%0 Journal Article %A 余雪丽 %A 李 志 %A 周昌能 %A 崔 倩 %A 胡 坤 %T 强化学习中异构反馈信号的分析与集成 %D 2012 %R 10.3778/j.issn.1673-9418.2012.04.009 %J 计算机科学与探索 %P 366-376 %V 6 %N 4 %X 探讨了在高度危险行业的游戏式专业救援培训系统中,视觉与听觉信号能否协同作用以提高人们的记忆和推理能力问题;运用半马尔科夫博弈模型(semi-Markov game,SMG)提出了合作型多agent分层强化学习框架和算法,构建了由视觉处理agent、听觉处理agent以及人类agent组成的异构异质多agent系统;指出分析和归纳视觉听觉相干反馈信号的性质和特点是非常具有挑战性的任务,其决定了强化学习中异构信号的集成方法和途径。在此基础上,提出了将异构反馈信号进行集成的偏信息学习算法,大大缩小了状态搜索空间,缓解了强化学习固有的“维数灾难”问题;根据心理治疗的“系统脱敏”原理,设计了“情绪-个性-刺激-调节”(mood-personality-stimulus-regulation,MPSR)模型和恐怖场景个性化呈现算法(personalized rendering algorithm for terrorist scene,PRATS),用于提升救援队员的心理承受能力,并通过实验验证了算法的有效性。
%U http://fcst.ceaj.org/CN/10.3778/j.issn.1673-9418.2012.04.009