• 学术研究 • 下一篇
张一帆,严豫,刘特立,陈鹏
ZHANG Yifan, YAN Yu, LIU Teli, CHEN Peng
摘要: 视频异常检测(Video Anomaly Detection,VAD)已成为计算机视觉领域的一项重要任务。目前,弱监督视频异常检测(Weakly-supervised Video Anomaly Detection,WVAD)已经成为视频异常检测的主流方法之一。然而,现有方法存在将各视频段视为独立同分布的示例,忽略了视频级时空依赖关系的问题。针对上述问题,提出了一种三维重排MLP驱动的跨维度特征交互式弱监督视频异常检测方法(Three-Dimensional rearrangement MultiLayer Perceptron driven Cross-Dimensional Feature Interaction for Weakly-supervised Video Anomaly Detection,rMLP-WVAD)。首先,使用I3D编码器提取视频帧的多尺度特征,并通过三维重排MLP驱动的视频级特征交互及时空注意力机制(Video-level feature interaction and Spatio-temporal Attention,VSA)进行特征增强,以保留视频级的时空依赖关系并充分挖掘关键的跨维度异常特征。然后,随着跨维度特征被进一步挖掘和丰富,如何更加精准地定义并量化“异常”便成为能否有效检测视频异常的关键。为此,提出将特征与加权平均特征的差异(Divergence of Feature from Weighted Mean vector,DFWM)作为异常判别标准,以充分利用增强后的时空特征表达并更准确地量化“异常”并提升检测的性能。最后,在公开数据集上的实验结果显示,rMLP-WVAD在XD-Violence数据集上的AP达到86.39%;在UCF-Crime数据集上的AUC达到85.70%,验证了该方法的有效性。