• 学术研究 •
刘成广, 王善敏,刘青山
LIU Chengguang, WANG Shanmin, LIU Qingshan
摘要: 人脸表情识别(facial expression recognition, FER)旨在从人脸图片中判断表情的类别,在心理诊断、人机交互等领域有着广泛的应用前景。在实际任务中,不同表情数据的分布往往是不平衡的。数据的不平衡导致了各表情的特征分布不平衡和分类器优化不平衡,从而影响了表情识别模型的性能。为此,本文提出了一种类别平衡调制的人脸表情识别方法(CBM-Net),分别在特征学习阶段和分类器优化阶段对模型进行类别平衡调制。具体地,CBM-Net包括特征调制和梯度调制两个模块。特征调制模块通过在特征方向上增加类间的可分性与类内的紧密性,实现各类别的特征分布平衡。梯度调制模块利用批次训练样本的统计信息对各分类器的优化梯度进行反向调节,确保各类别的分类器收敛速度一致,使得各分类器性能同时达到最优。在四个流行的数据集上进行的定性和定量实验表明,CBM-Net在人脸表情识别的类别平衡调制上是有效的,与一众先进方法相比,效果也相当良好。