计算机科学与探索 ›› 2016, Vol. 10 ›› Issue (9): 1272-1281.DOI: 10.3778/j.issn.1673-9418.1508036
李 艳+,黄光球,张 斌
LI Yan+, HUANG Guangqiu, ZHANG Bin
摘要: 网络攻击或防御策略选取的随机性会导致系统状态变化的随机性,网络攻防的过程也定然是收益矩阵各不相同的多状态上的对抗。使用Markov决策过程对这一随机性进行刻画,将单状态的博弈模型扩展到多状态,形成了多状态多智能体的Markov演化博弈模型;在形式化建模的基础上,证明了均衡策略的存在;通过非线性规划的求解方法得到了攻防策略方案。最后以一个典型的企业网络攻防过程为例,使用该模型进行了仿真分析和推演,结果表明该模型符合实际应用,评估结果准确,有助于攻防博弈研究的发展。