×
模态框(Modal)标题
在这里添加一些文本
关闭
关闭
提交更改
取消
确定并提交
×
模态框(Modal)标题
在这里添加一些文本
关闭
×
Toggle navigation
首页
期刊介绍
期刊简介
收录情况
编委会
期刊在线
当期目录
最新录用
过刊浏览
阅读排行
下载排行
引用排行
作者中心
投稿指南
同行评议
下载中心
中图分类号
科研诚信
出版道德声明
学术不端认定与处理
期刊订阅
联系我们
English
带有惩罚措施的自竞争事后经验重播算法
王子豪, 钱雪忠, 宋威
Self-competitive Hindsight Experience Replay with Penalty Measures
WANG Zihao, QIAN Xuezhong, SONG Wei
计算机科学与探索 . 2024, (
5
): 1223 -1231 . DOI: 10.3778/j.issn.1673-9418.2303031