当期目录

    2025年 第19卷 第5期 刊出日期:2025-05-01
    全选:
    目次
    2025年第5期目次
    2025, 19(5):  0-0. 
    摘要 ( 15 )   PDF (619KB) ( 16 )  
    相关文章 | 计量指标
    前沿·综述
    深度学习下的单阶段通用目标检测算法研究综述
    王宁, 智敏
    2025, 19(5):  1115-1140.  DOI: 10.3778/j.issn.1673-9418.2411032
    摘要 ( 229 )   PDF (3046KB) ( 201 )  
    参考文献 | 相关文章 | 计量指标
    近年来,目标检测算法作为计算机视觉领域中的核心任务,逐渐成为热门研究方向。它使得计算机能够识别和定位图像或视频帧中的目标物体,广泛应用于自动驾驶、生物个体检测、农业检测、医疗影像分析等领域。随着深度学习的发展,通用目标检测算法从传统的目标检测方法转变为基于深度学习下的目标检测方法。其中深度学习下的通用目标检测算法主要分为单阶段目标检测与两阶段目标检测,以单阶段目标检测为切入点,根据采用经典卷积与Transformer两种不同架构,对首个单阶段目标检测算法YOLO系列(YOLOv1~YOLOv11、YOLO主要改进版本)、SSD等和以Transformer为基础架构的DETR系列的主流单阶段检测算法进行分析总结。介绍各个算法的网络结构以及其研究进展,根据各个算法的结构归纳出其特点优势以及局限性,概括目标检测领域主要通用数据集与评价指标,分析各算法以及其改进方法的性能,讨论各算法在不同领域的应用现状,展望单阶段目标检测算法在未来的研究方向。
    面向闭源大语言模型的增强研究综述
    刘华玲, 张子龙, 彭宏帅
    2025, 19(5):  1141-1156.  DOI: 10.3778/j.issn.1673-9418.2407021
    摘要 ( 41 )   PDF (1889KB) ( 43 )  
    参考文献 | 相关文章 | 计量指标
    随着大语言模型在自然语言处理领域的快速发展,以GPT系列为代表的闭源大语言模型的性能增强成为一个挑战。由于无法访问模型内部的参数权重,传统的训练方法,如微调技术,难以应用于闭源大语言模型,这使得在这些模型上进一步优化变得困难。同时,闭源大语言模型已经广泛应用于下游实际任务,因此研究如何增强闭源大语言模型的性能具有重要意义。聚焦于闭源大语言模型的增强研究,对提示工程(prompt engineering)、检索增强生成(retrieval augmented generation)、智能体(agent)三种技术进行了分析,并针对不同方法的技术特性和模块架构进行了进一步细分,详细介绍了每种技术的核心思想、主要方法及其应用效果,研究了不同增强方法在推理能力、生成可信度、任务适应性等方面的优越性和局限性。讨论了这三种技术的组合应用方法,结合具体案例,强调了组合技术在增强闭源大语言模型性能方面的巨大潜力。总结了现有技术的研究现状和存在的问题,对未来闭源大语言模型增强技术的发展进行了展望。
    草类植物无人机遥感图像中深度学习应用综述
    李少波, 王晓强, 郭利彪, 红英, 王志国
    2025, 19(5):  1157-1176.  DOI: 10.3778/j.issn.1673-9418.2405012
    摘要 ( 54 )   PDF (2086KB) ( 24 )  
    参考文献 | 相关文章 | 计量指标
    草类植物入侵后争夺农作物生长所需的资源,严重影响农作物的产量和品质;蒿属植物等草类植物释放过敏性花粉引起人体过敏反应,影响人们的身体健康。因此将深度学习与无人机遥感技术相结合,并对草类植物进行高效识别与检测,在植物入侵预防、过敏原监测、农业生产管理等方面具有重要的现实意义。目前遥感图像存在分辨率较低、背景信息较复杂、细节信息不明显等问题,深度学习结合无人机遥感RGB图像、多光谱图像等可以解决草类植物密度大、种类多、覆盖范围广、识别困难等各种应用问题。对深度学习技术应用于草类植物的无人机遥感图像的研究进展进行了全面而深入的综述。阐述了在草类植物研究中广泛应用的多种无人机遥感图像技术,着重介绍了可见光RGB和多光谱遥感技术的应用。详细总结了无人机航拍草类植物数据集,并重点介绍了目前将深度学习应用于草类植物遥感图像中所采用的主要网络结构和方法。最后归纳了目前草类植物无人机遥感图像应用深度学习技术面临的主要问题,并展望了未来发展趋势。
    道路行人行为轨迹预测研究综述
    杨智勇, 郭洁铷, 郭子杭, 张瑞祥, 周瑜
    2025, 19(5):  1177-1197.  DOI: 10.3778/j.issn.1673-9418.2407029
    摘要 ( 141 )   PDF (1797KB) ( 72 )  
    参考文献 | 相关文章 | 计量指标
    在自动驾驶汽车与行人共享空间的路径规划中,精准、高效的行人轨迹预测是保障道路安全的核心问题。行人轨迹预测不仅依赖于历史行为数据,更需全面考虑行人与车辆、交通设施及多方向车辆间的复杂动态交互。近年来,该领域取得了显著进展,逐渐成为研究热点。系统梳理了现有的研究成果,界定了行人轨迹预测的基本概念,并对主流预测方法进行了深入剖析。归纳了行人行为数据的主要来源,包括激光雷达、摄像头等多模态感知设备,并探讨了关键特征提取方式,涵盖行人运动特征、场景上下文特征及交通设施影响等。基于这些数据,对物理模型与数据驱动的预测方法进行了系统总结,重点分析了统计模型、深度学习与强化学习模型的发展现状,尤其是深度学习方法,依据其网络结构进一步细分为序列模型、卷积神经网络、图卷积神经网络和生成对抗网络等类型。总结了该领域常用的数据集和评价指标,对现有算法的性能进行了综合评估。针对行人轨迹预测在自动驾驶中的挑战,尤其是行人与多方向车辆及交通设施之间的动态耦合问题,提出了潜在的解决思路,并展望了未来的研究方向。
    深度学习在结肠息肉图像分割中的研究综述
    李国威, 刘静, 曹慧, 姜良
    2025, 19(5):  1198-1216.  DOI: 10.3778/j.issn.1673-9418.2408012
    摘要 ( 104 )   PDF (3167KB) ( 59 )  
    参考文献 | 相关文章 | 计量指标
    结肠息肉是一种可能发展为结直肠癌的胃肠道异常生长组织,因此,早期检测和切除结肠息肉对预防结直肠癌具有重要意义。近年来,深度学习技术在结肠息肉图像分割领域中的应用取得了显著进展,大幅提高了分割的准确性和自动化水平。针对深度学习在结肠息肉图像分割中的研究展开综述,介绍了多种结肠息肉成像方式及包括图片和视频在内的常用数据集,并详细说明了这些数据集的特点。深入阐述了基于深度学习的结肠息肉分割方法,涵盖了全卷积网络、Mask R-CNN、生成对抗网络、U-Net、Transformer以及多网络融合模型,其中重点强调了U-Net及其变体在结肠息肉图像分割中的应用,分析了其结构改进、性能提升和实际应用效果。同时,综合对比了各网络模型的主要改进思路、优缺点及其分割结果。指出了当前深度学习在该领域面临的主要挑战,并对未来的研究方向进行了相应的展望。
    理论·算法
    融合自适应超图的自监督知识感知推荐模型
    周家旋, 柳先辉, 赵晓东, 侯文龙, 赵卫东
    2025, 19(5):  1217-1229.  DOI: 10.3778/j.issn.1673-9418.2406021
    摘要 ( 50 )   PDF (2157KB) ( 53 )  
    参考文献 | 相关文章 | 计量指标
    为缓解传统协同过滤推荐系统存在的冷启动问题,知识图谱作为一种辅助知识被引入到推荐系统中。然而,现有的知识图谱推荐模型在充分地建模高阶相互作用方面存在局限性,难以捕获来自高阶邻居的重要信息。此外,监督信号的稀疏性问题也影响着推荐系统性能。为了解决上述问题,提出一种融合自适应超图的自监督知识感知推荐模型。该模型使用混合图卷积网络共同学习交互图中低阶交互嵌入与自适应超图中高阶交互嵌入;使用关系感知图注意网络挖掘知识图谱中用户与物品丰富的知识信息;模型在这三种视图基础上构建对比学习任务,通过引入自监督信号来缓解交互数据的稀疏性问题;将三种嵌入相结合,用于后续的推荐预测。该模型在多个公开数据集上与KGAT、KGIN、KACL等基准模型进行了对比实验,与7个对比模型中推荐性能最好的模型相比,在MovieLens数据集上,Recall@20提升了1.22%,NDCG@20提升了1.17%;在Yelp2018数据集上,Recall@20提升了1.41%,NDCG@ 20提升了1.60%。实验结果显示该模型的推荐性能优于其他基准模型。
    TCGCL:基于图对比学习的复杂网络流量分类算法
    胡仲则, 秦宏超, 李振军, 李艳辉, 李荣华, 王国仁
    2025, 19(5):  1230-1240.  DOI: 10.3778/j.issn.1673-9418.2407095
    摘要 ( 44 )   PDF (2252KB) ( 33 )  
    参考文献 | 相关文章 | 计量指标
    网络流量分类技术在网络安全领域中起到了关键性作用。现代网络架构高度复杂,网络流量传输过程中将会不可避免地遇到各种异常情况。为此,提出了一种稳定性指标,评估算法对数据异常干扰的抵抗能力,基于图对比学习技术提出一种流量分类算法TCGCL,可以同时提取网络流量内部的载荷特征及网络流量之间的通联关系特征,更全面地保留数据有效信息,在此基础上通过数据增强技术模拟网络流量异常状态表现,大幅提升了算法在数据异常情况下的分类稳定性。基于协议分析技术,对流量分类过程中图结构数据的构造方式进行了研究,提出了一种高质低维的属性生成方法。实验表明,相较于基线算法,在达到近乎相同准确率的前提下,TCGCL的样本输入维度降低了约80%。针对复杂网络通信环境,TCGCL对测试样本进行了噪音混淆,模拟流量异常的情况。测试结果表明,TCGCL在流量出现异常的条件下仍可保持很高的分类准确率,且稳定性指标大幅领先于基线算法。
    动态自适应跨域均值逼近
    李慧敏, 马建伟, 臧绍飞, 宋彦兵
    2025, 19(5):  1241-1251.  DOI: 10.3778/j.issn.1673-9418.2405070
    摘要 ( 28 )   PDF (2049KB) ( 23 )  
    参考文献 | 相关文章 | 计量指标
    跨域均值逼近(CDMA)是一种高效的领域间分布差异度量方法。它通过计算一个域的样本到另一个域样本均值的距离来度量领域间的样本分布差异,进而可以促进知识的跨领域迁移。然而,在实际应用中,数据的边缘分布和条件分布往往是不平衡的,CDMA平等地追求度量边缘分布和条件分布的差异,而不考虑二者之间的差异性,导致其在迁移学习中的效率不高。对CDMA进行改进,引入适应性因子,设计动态CDMA评估源域和目标域之间的边缘分布误差和条件分布误差;在动态CDMA基础上,提出动态自适应跨域均值逼近(DA-CDMA)特征提取算法,来提取领域间不变的特征,以实现知识的跨领域迁移。此外,特征提取过程中为减小个别远离均值中心的不良样本对均值造成的偏移,提出均值更新机制,在类内进行均值更新,增加迁移的稳定性和准确性。在公开的迁移学习数据集上进行分类实验,验证了该方法的有效性。
    图形·图像
    增强退化表征学习的盲图像超分辨率
    袁 江, 马 冀, 周登文
    2025, 19(5):  1252-1263.  DOI: 10.3778/j.issn.1673-9418.2403065
    摘要 ( 36 )   PDF (1123KB) ( 35 )  
    参考文献 | 相关文章 | 计量指标
    大多数基于卷积神经网络的超分辨率(SR)方法,退化假设是固定且已知的(如双三次退化)。将它们应用在真实世界退化图像时,实际退化与假设不匹配会使得SR方法性能显著下降。为解决退化不匹配时SR方法性能下降问题,提出一种新的盲SR方法,它可以无监督地学习退化图像的退化信息,并使用学习的退化信息有效地调制SR网络。基于对比学习设计了一种无监督的隐式退化表征学习方法,不依赖负样本队列即可提取出准确的退化信息,并提出将经过同一退化的不同图片作为正样本对,克服了图片内容相似性对学习退化的影响,有效提升了隐式退化估计器的表达能力。设计了一个包含全局调制块和通道融合调制块的退化引导调制超分辨率网络,它和退化信息结合可以灵活处理各种退化,以实现最终的SR恢复。实验在四个标准数据集上与多种代表性方法进行了比较,结果显示在×2、×3和×4三种不同放大倍数情形下,在Urban100数据集上比基线模型(DASR)的PSNR分别提高0.85 dB、0.87 dB和0.32 dB。最终提取的退化表征信息质量和重建出的SR图像比DASR均有较大提升。
    基于ConvNeXt与双特征提取分支的水体提取方法
    周珂, 常然然, 徐西志, 苗茹, 张广雨, 王嘉茜
    2025, 19(5):  1264-1279.  DOI: 10.3778/j.issn.1673-9418.2404085
    摘要 ( 75 )   PDF (1510KB) ( 67 )  
    参考文献 | 相关文章 | 计量指标
    由于复杂的光谱混合物、地物边界模糊、环境噪声等因素的共同作用,从高分辨率遥感图像中准确识别水体边界极具挑战性。针对此问题,在PSPNet的基础上提出基于ConvNeXt与双特征提取分支的水体提取方法(CoNFM-Net)。在编码器阶段,以ConvNeXt代替ResNet50作为主干网络,利用逆瓶颈层、大卷积核等设计来增强网络的特征提取能力。在解码器阶段,设计了多尺度特征融合和上下文信息增强的双特征提取分支结构,多尺度特征融合分支为有效利用主干网络产生的多层次特征图,设计了一种双向特征融合模块(BiFFM),以解决边界识别中尺度不一致的问题;上下文信息增强分支为提高全局信息的利用率,将主干网络输出的深层特征图通过全局上下文信息获取模块(GCIM)。同时,将经过多尺度特征融合分支的最深层特征图与其进行拼接,增强模型对水体边界细节的捕捉能力。实验结果表明,该方法在LoveDA数据集、高分二号(GF-2)数据集及Sentinel-2数据集上的平均交并比和F1分数分别为89.64%、94.32%,92.60%、96.16%及93.72%、96.73%,且在同样环境下,与U-Net、DANet、CMTFNet等语义分割算法相比,该算法CoNFM-Net具有一定优势。
    背景支持下的全域特征响应图像分类网络
    姜文涛, 李威达, 张晟翀
    2025, 19(5):  1280-1294.  DOI: 10.3778/j.issn.1673-9418.2404027
    摘要 ( 39 )   PDF (1695KB) ( 27 )  
    参考文献 | 相关文章 | 计量指标
    针对目前图像分类方法缺少背景信息支持,导致模型分类精度受限的问题,提出背景支持下的全域特征响应图像分类网络(BGRNet)。该网络以WRN残差网络为基础,提出新的背景支持激活函数BS,通过BS激活函数引入背景支持机制,使网络在关注目标前景信息的同时,也能够平滑地关注背景信息;提出全域特征响应模块(BGR),并将BGR嵌入到残差分支中,对图像全域特征进行还原,在一定程度上减少因卷积操作而产生的特征信息损失;调整残差块内部网络结构,通过调整残差块中激活函数、批量归一化的前向传播顺序并删除Dropout(Dropout Regularization),放大BS激活函数对整体网络模型的背景支持作用,促进背景信息在网络中的有效传递。BGRNet通过引入背景信息支持机制,不仅考虑了目标前景信息在图像分类过程中的支持作用,还考虑了背景信息在分类过程中的支持作用,在提升网络分类精度的同时,有效提高了网络训练效率。在FashionMNIST、KMNIST、CIFAR-10、CIFAR-100、SVHN数据集上的实验结果表明,BGRNet显著提高了基线模型的分类性能,且与当前主流方法相比,BGRNet具有较高的分类准确率和较强的泛化性能。
    人工智能·模式识别
    大语言模型幻觉现象的分类识别与优化研究
    何静, 沈阳, 谢润锋
    2025, 19(5):  1295-1301.  DOI: 10.3778/j.issn.1673-9418.2408080
    摘要 ( 133 )   PDF (1468KB) ( 47 )  
    参考文献 | 相关文章 | 计量指标
    随着大语言模型在自然语言理解和生成任务上的广泛应用,其在医疗、法律和科研等高精度领域的表现被愈发关注。然而,幻觉现象作为大语言模型普遍存在的问题,极大制约了其在这些领域的实际应用。当前,针对大语言模型幻觉现象的评估和优化尚存在显著不足:缺乏高质量的高精度领域幻觉评估数据集;现有幻觉评估方法大多依赖单一模型,未能充分利用多模型间的差异性优势;不同模型在幻觉类型和幻觉率上表现存在较大差异,尚未有有效方法来降低高幻觉率模型的幻觉现象。该研究采用数据集构建-群体智能选举-幻觉分类与量化-先验知识优化的系统流程,全面评估和优化了大语言模型在医疗问答领域的幻觉现象。根据公开数据集Huatuo,结合GPT4生成问题答案和人工标注的形式构建了医疗问答领域大模型幻觉评估数据集;使用GPT4o、GPT4、ChatGLM4、Baichuan-13B和Claude 3.5等先进的大语言模型对数据集中的问题生成答案。通过一种基于群体智能的方法,选举出一个LeaderAI,它将各模型的回答与参考答案进行比较,从而确定各模型的幻觉率。进一步将幻觉分为事实性幻觉和忠实性幻觉两类。研究结果表明,在LeaderAI的指导下,被评估的大模型的幻觉率显著下降,特别是忠实性幻觉率明显降低。
    基于大语言模型的社交媒体文本立场检测
    李居昊, 石磊, 丁锰, 雷永升, 赵东越, 陈泷
    2025, 19(5):  1302-1312.  DOI: 10.3778/j.issn.1673-9418.2408074
    摘要 ( 69 )   PDF (2272KB) ( 80 )  
    参考文献 | 相关文章 | 计量指标
    立场检测旨在分析文本对给定目标的态度。当前社交媒体的文本通常简短且话题演变迅速,传统立场检测方法面临着语义信息稀少和立场特征表示不充分等挑战,且许多现有方法往往忽略了情感信息对立场检测的影响。为了应对上述两方面挑战,提出了一种基于大语言模型的社交媒体文本立场检测方法。通过设计包含明确任务指令的立场检测提示模板,调用模型在预训练阶段获得的与立场检测相关的知识,解决语义信息稀少的问题;通过在任务指令中加入情感分析任务,引导模型关注情感信息,为立场检测提供更多的语义线索,解决情感信息利用不足的问题。在此基础上,在模型内部添加针对立场检测任务的适配器,专注于提取和表示立场特征,增强模型对立场特征的表示能力,实现了更好的立场检测效果;将不同架构的大语言模型的结果进行集成投票提高预测结果的稳定性。为验证该方法,构建多组对比实验,实验结果表明该方法在SemEval-2016 Task 6A数据集上的有效性显著优于现有基准方法。
    时间序列中非平稳性和波动性的建模及预测
    冯强, 赵建光, 杨茸, 牛保宁
    2025, 19(5):  1313-1321.  DOI: 10.3778/j.issn.1673-9418.2407096
    摘要 ( 37 )   PDF (2511KB) ( 25 )  
    参考文献 | 相关文章 | 计量指标
    时间序列预测的难点在于如何处理好非平稳性和波动性。在应对非平稳性时,现有深度学习模型在训练前采取平稳化输入序列的方法,存在消解非平稳性能力不强或信息损失的问题;在应对波动性时,通常采用带有单头注意力机制的LSTM模型,捕获全局依赖能力弱,影响预测精度。针对上述问题,在处理非平稳性方面,提出遵循“提取-分解”原则的Prophet-CEEMDAN二次分解法,将原始序列分解为一组分量,该方法在确保趋势和周期特征完整的情况下,提高分量集合中平稳分量的占比,为预测模型提供更稳定的数据分布。在波动性方面,通过使用带有多头自注意力机制的长短期记忆(LSTM-MH-SA)神经网络模型,并行地堆叠注意力头用于捕获序列不同时间段的波动特征并联系起来,提高捕获全局波动信息的能力。结合Prophet-CEEMDAN和LSTM-MH-SA,提出能够同时处理时间序列非平稳性和高波动性的PCLMS模型。在多个股票数据集和合成数据集上的实验表明,对比基准模型、CNN-LSTM和Informer模型,PCLMS模型在各项评价指标的平均值最优,对波动率较高的数据集性能表现最好。
    基于PPLM模板增强的零样本方面类别情感分析模型
    凤丽洲, 李梦莎, 王友卫, 杨贵军
    2025, 19(5):  1322-1333.  DOI: 10.3778/j.issn.1673-9418.2406005
    摘要 ( 22 )   PDF (1857KB) ( 20 )  
    参考文献 | 相关文章 | 计量指标
    如今方面类别情感分析(ACSA)因标注数据稀缺而受限,如何在无特定情感标注数据下实现有效分析成为研究挑战。将零样本方面类别情感分析任务转换为自然语言推理(NLI)任务,针对传统提示模板面临语义表达不充分的问题,提出了一种基于PPLM文本限制生成模型的原因补充提示模板,结合情感极性和其原因,使得模板可以帮助模型更好地理解情感背后的原因和动机,从而提高情感分析的准确性和可解释性。为了进一步提升ACSA的分类性能,引入了性能逆序系数来确定文中多种提示模板的集成权重。在公共数据集MAMS和Restaurant的实验结果表明该模型相较于其他零样本ACSA模型,在准确率ACC上提升约7个百分点;PPLM原因补充提示模板可以提升NLI模型的零样本分类性能,其相较于其他较好传统模板在MF1上提升2.6个百分点;同时改进的权重确定策略也对模型在零样本情境下的情感分析能力有一定提升作用。
    基于多提示学习的方面类别情感分析方法
    刘锦行, 李琳, 吴任伟, 刘佳
    2025, 19(5):  1334-1341.  DOI: 10.3778/j.issn.1673-9418.2407093
    摘要 ( 58 )   PDF (1143KB) ( 30 )  
    参考文献 | 相关文章 | 计量指标
    基于方面类别的情感分析(ACSA)旨在辨别评论文本中的方面类别,并同时预测它们的情感极性,是情感分析领域重要的细粒度子任务。近年来,基于预训练语言模型的微调(Fine-tuning)方法已经为方面类别情感分析提供了有效的解决思路。然而,由于预训练任务和下游情感分类任务目标不一致,影响了情感分析质量提升的空间。目前基于提示模板的提示学习(Prompt learning)能够对其进行相应缓解,但人工设计单一的Prompt文本为ACSA任务提供的上下文有限,缺少丰富性。针对此问题,提出了一种基于提示学习的方面类别情感分析方法(Multi-Prompt_ACSA)。在提示学习的基础上进行了提示模板工程和答案工程的多样化设计,结合ACSA的研究特点,提出了适配方面类别情感分析的提示学习方法。引入自回归预训练语言模型进行训练。基于Prompt的多样化设计集成多个不同提示模板下的情感分类结果。与其他模型(非预训练、预训练和提示学习三个类别)在SemEval 2015和SemEval 2016数据集上的结果相比,提出的方法在F1指标上有良好的效果提升。
    融合梯度预测和无参注意力的高效地震去噪Transformer
    高磊, 乔昊炜, 梁东升, 闵帆, 杨梅
    2025, 19(5):  1342-1352.  DOI: 10.3778/j.issn.1673-9418.2405052
    摘要 ( 52 )   PDF (1281KB) ( 26 )  
    参考文献 | 相关文章 | 计量指标
    压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会导致细节信息的丢失。针对地震数据去噪问题,提出了一种融合梯度预测和无参注意力的高效Transformer模型(ETGP)。引入多头“转置”注意力来代替传统的多头注意力,它能在通道间计算注意力来表示全局信息,缓解了传统多头注意力复杂度过高的问题。提出了无参注意力前馈神经网络,它能同时考虑空间和通道维度计算注意力权重,而不向网络增加参数。设计了梯度预测网络以提取边缘信息,并将信息自适应地添加到并行Transformer的输入中,从而获得高质量的地震数据。在合成数据和野外数据上进行了实验,并与经典和先进的去噪方法进行了比较。结果表明,ETGP去噪方法不仅能更有效地压制随机噪声,并且在弱信号保留和同相轴连续性方面具有显著优势。
    基于Transformer和多关系图卷积网络的行人轨迹预测
    刘桂红, 周宗润, 孟祥福
    2025, 19(5):  1353-1364.  DOI: 10.3778/j.issn.1673-9418.2405004
    摘要 ( 97 )   PDF (2737KB) ( 110 )  
    参考文献 | 相关文章 | 计量指标
    在自动导航应用领域,行人轨迹相对复杂,有效且合理地预测行人未来轨迹对自动驾驶和出行安全至关重要。行人轨迹随机性和动态性极高且与交通环境有着复杂相互作用,因此需要对行人的时间依赖性和空间相互作用进行合理建模。为了解决该问题,提出了一种基于Transformer和多关系图卷积网络(GCN)的行人轨迹预测模型。该模型由交互捕获模块、锚点控制模块和轨迹修正补全模块构成。交互捕获模块由T-Transformer和多关系图卷积网络组成,分别提取每个行人在时间序列和空间序列上的运动特征,并结合锚点控制模块推断行人的中间目的地以减少递归累计误差,由修正补全模块进行最终轨迹细化。在提取特征时添加逆关系可得到更为优化的结果,使用高斯剪枝减少虚假路径的生成也可提高模型效率。在ETH与UCY数据集上的实验结果表明,在平均位移误差(ADE)和最终位移误差(FDE)方面,该模型具有比现有大部分主流模型更好的性能。由于该模型在行人轨迹预测上的出色性能,可避免不必要的轨迹变更和碰撞风险,为行人轨迹预测应用提供了更为可能的解决方案。
    网络·安全
    RMFKAN:基于改进图Mamba的网络水军检测方法
    王宇哲, 颜靖华, 卜凡亮, 王一帆, 李嘉, 韩竹轩
    2025, 19(5):  1365-1378.  DOI: 10.3778/j.issn.1673-9418.2407124
    摘要 ( 36 )   PDF (2233KB) ( 49 )  
    参考文献 | 相关文章 | 计量指标
    网络水军检测任务对构建和谐网络空间至关重要。针对现有基于图Transformer的网络水军检测方法无差别传递来自社区的节点之间的信息,从而导致节点表示过于同质,在处理长距离依赖关系时存在过度压缩和过度平滑,最终降低网络水军检测效果的问题,提出了一种基于关系双向图Mamba的傅里叶Kolmogorov-Arnold网络(RMFKAN)模型用于检测社交平台中的网络水军。通过异质感知的长距离关系特征提取方法解决了大规模社交网络跨社区长距离关系特征丢失的问题。通过引入双向选择状态空间模型(Bi-Mamba)解决了处理长距离依赖关系时的过度压缩和过度平滑问题。具体而言,通过随机游走策略令牌化子图,输入消息传递神经网络独立处理不同类型的边,利用傅里叶系数改进的KAN增强特征,将特征矩阵输入Bi-Mamba,提高对长距离依赖关系的捕捉能力,同时有效降低训练复杂度。在两个公开的网络水军检测数据集Twibot-20和Twibot-22上与10个基线模型进行对比实验,实验结果表明,RMFKAN在多个评价指标上均优于现有的基线方法,与现有研究的最佳效果相比RMFKAN的F1分数分别提高了2.10和4.06个百分点,准确率分别提高了1.01和4.45个百分点,验证了其在网络水军检测任务中的优越性能。
    EG-DPoS:基于演化博弈的DPoS优化共识算法
    刘勇, 邓小鸿, 刘力汇, 石亦燃, 张丽
    2025, 19(5):  1379-1394.  DOI: 10.3778/j.issn.1673-9418.2406101
    摘要 ( 54 )   PDF (3120KB) ( 27 )  
    参考文献 | 相关文章 | 计量指标
    针对委托权益证明算法(DPoS)共识过程中,投票节点积极性不高、恶意节点贿赂拉票和代理节点按序出块易被攻击的问题,提出了一种基于演化博弈的DPoS优化共识算法(EG-DPoS)。引入信用机制构建节点投票激励模型,根据节点的投票情况给予信用值奖励,有效提高了节点的投票积极性;基于演化博弈的策略制定了一种行为奖惩机制,对投票选举阶段各节点的不同行为策略预设对应的收益函数并实施奖惩,以此来遏制恶意节点的贿赂合谋行为,保证了系统的稳定性和公平性;平衡代理节点选举过程中信用值和投票权重的比例系数,以减少高信用值节点造成的寡头现象,同时利用轮盘选择算法打乱代理节点的出块顺序,避免节点在出块过程中被攻击,提高了系统的安全性。仿真实验结果表明,与DPoS算法相比,EG-DPoS的平均时延降低了36.83%,平均吞吐量提高了19.44%,且参与投票的节点数与总节点数的比值提升约42%。这是由于EG-DPoS中存在投票激励机制和设定了固定的投票时间,以及在演化博弈策略的作用下,节点会随系统的运行表现得更加安全高效,使得代理节点的出块效率和共识效率更高,因此能在降低时延的同时提升吞吐量和投票节点的积极性,并且与其他典型DPoS改进算法相比,EG-DPoS也具有明显的性能优势。