计算机科学与探索 ›› 2019, Vol. 13 ›› Issue (4): 693-701.DOI: 10.3778/j.issn.1673-9418.1802002
朱 芮,马永涛+,南亚飞,张云蕾
ZHU Rui, MA Yongtao+, NAN Yafei, ZHANG Yunlei
摘要: 针对认知无线电环境中认知用户易受到干扰的问题,研究了具有跳频功能的认知用户与智能感知功能的干扰器之间的相互作用。为了充分利用无线电频谱资源,在综合考虑信道选择和功率分配的基础上,设计了以认知用户的频谱能效性能为参考标准的效用函数,并将改进强化学习算法融入认知学习决策引擎中。决策算法通过将认知环境与决策引擎的交互建模为强化学习中环境与智能体的交互,探索最大的动作奖励反馈给认知决策引擎,在交互过程中得到自适应的优化策略选择。仿真结果表明,提出的算法能够较快速地收敛,选择的策略能够有效地优化认知用户在干扰情况下的性能,比随机策略的性能提高50%以上。