基于Transformer和多关系图卷积网络的行人轨迹预测

doi:10.3778/j.issn.1673-9418.2405004

摘要/Abstract

摘要： 在自动导航应用领域，行人轨迹相对复杂，有效且合理预测行人未来轨迹对自动驾驶和出行安全至关重要。行人轨迹随机性和动态性极高且与交通环境有着复杂相互作用，因此需要对行人的时间依赖性和空间相互作用进行合理建模。为了解决该问题，本文提出了一种基于Transformer和多关系图卷积网络（GCN）的行人轨迹预测模型，该模型由交互捕获模块、锚点控制模块和轨迹修正补全模块构成，交互捕获模块由T-Transformer和多关系图卷积网络组成，分别提取每个行人在时间序列和空间序列上的运动特征，并结合锚点控制模块推断行人的中间目的地以减少递归累计误差，最后由修正补全模块进行最终轨迹细化。此外，在提取特征时添加逆关系可得到更为优化的结果，使用高斯剪枝减少虚假路径的生成也可提高模型效率。在ETH与UCY数据集上的实验结果表明，在平均位移误差（ADE）和最终位移误差（FDE）方面，该模型具有比现有大部分主流模型更好性能。由于在行人轨迹预测上的出色性能，可避免不必要的轨迹变更和碰撞风险，为行人轨迹预测应用提供了更为可能的解决方案。

关键词: T-Transformer, 图卷积网络, 锚点控制, 行人轨迹预测

Abstract: In the field of autonomous navigation, predicting pedestrian trajectories accurately is crucial for ensuring safe travel and autonomous driving. Pedestrian trajectories are highly complex, dynamic, and influenced by their surroundings, necessitating effective modeling of their temporal and spatial interactions. To address this, a model combining Transformer and Multi-Relation Graph Convolutional Networks (GCN) is proposed. It comprises an Interaction Capture Module, Anchor Control Module, and Trajectory Refinement Module. The Interaction Capture Module extracts motion features using T-Transformer and GCN, while the Anchor Control Module reduces errors by inferring intermediate destinations. Finally, the Trajectory Refinement Module enhances predictions. Experimental results on ETH and UCY datasets show superior performance in Average and Final Displacement Errors compared to mainstream models. This model's accuracy minimizes unnecessary trajectory changes and collision risks, offering a promising solution for pedestrian trajectory prediction applications.

Key words: T-Transformer , Graph Convolutional Networks , anchor control , pedestrian trajectory prediction

刘桂红, 周宗润, 孟祥福. 基于Transformer和多关系图卷积网络的行人轨迹预测[J]. 计算机科学与探索, DOI: 10.3778/j.issn.1673-9418.2405004.

LIU Guihong, ZHOU Zongrun, MENG Xiangfu. Pedestrian trajectory prediction based on Transformers and Multi-Relation Graph Convolutional Networks[J]. Journal of Frontiers of Computer Science and Technology, DOI: 10.3778/j.issn.1673-9418.2405004.

[1]	马金林, 崔琦磊, 马自萍, 闫琦, 曹浩杰, 武江涛. 预加权调制密集图卷积网络三维人体姿态估计[J]. 计算机科学与探索, 2024, 18(4): 963-977.
[2]	张文轩, 殷雁君, 智敏. 用于方面级情感分析的情感增强双图卷积网络[J]. 计算机科学与探索, 2024, 18(1): 217-230.
[3]	崔焕庆, 宋玮情, 杨峻铸. 知识水波图卷积网络推荐模型[J]. 计算机科学与探索, 2023, 17(9): 2209-2218.
[4]	刘超, 梁安婷, 刘小洋, 黄贤英. 融合多元信息的社交网络节点分类方法[J]. 计算机科学与探索, 2023, 17(9): 2198-2208.
[5]	曹营利, 邓赵红, 胡曙东, 王士同. 兼顾个性特征和融合特征的阿尔茨海默病分类[J]. 计算机科学与探索, 2023, 17(7): 1658-1668.
[6]	孟甜甜, 韩虎, 吴渊航. 面向方面抽取与情感分类的多任务联合建模[J]. 计算机科学与探索, 2023, 17(7): 1669-1679.
[7]	薛延明, 李光辉, 齐涛. 融合图小波和注意力机制的交通流预测方法[J]. 计算机科学与探索, 2023, 17(6): 1405-1416.
[8]	竺笈, 肖晓丽, 尹波, 孙倩, 谈东. 融合用户社会关系的双线性扩散图推荐模型[J]. 计算机科学与探索, 2023, 17(4): 826-836.
[9]	赵登阁, 智敏. 用于人体动作识别的多尺度时空图卷积算法[J]. 计算机科学与探索, 2023, 17(3): 719-732.
[10]	鲁富荣, 原之安, 钱宇华. 融合模体图神经网络和自编码器的链路预测[J]. 计算机科学与探索, 2023, 17(1): 209-216.
[11]	李珍琦, 王晶, 贾子钰, 林友芳. 融合注意力的多维特征图卷积运动想象分类[J]. 计算机科学与探索, 2022, 16(9): 2050-2060.
[12]	吴静, 谢辉, 姜火文. 图神经网络推荐系统综述[J]. 计算机科学与探索, 2022, 16(10): 2249-2263.
[13]	李想, 杨兴耀, 于炯, 钱育蓉, 郑捷. 基于知识图谱卷积网络的双端推荐算法[J]. 计算机科学与探索, 2022, 16(1): 176-184.
[14]	陈子阳, 廖劲智, 赵翔, 陈盈果. 融合子图结构的神经推理式知识库问答方法[J]. 计算机科学与探索, 2021, 15(10): 1870-1879.
[15]	蔺奇卡, 张玲玲, 刘均, 赵天哲. 基于问句感知图卷积的教育知识库问答方法[J]. 计算机科学与探索, 2021, 15(10): 1880-1887.

基于Transformer和多关系图卷积网络的行人轨迹预测

Pedestrian trajectory prediction based on Transformers and Multi-Relation Graph Convolutional Networks

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics