计算机科学与探索 ›› 2018, Vol. 12 ›› Issue (12): 1974-1986.DOI: 10.3778/j.issn.1673-9418.1709060
周书仁,谢盈,蔡碧野
ZHOU Shuren, XIE Ying, CAI Biye
摘要:
近期,许多学者开始结合深度网络进行图像处理,与传统的基于人工抽取的特征相比,由深度卷积网络提取的特征更为准确,效果更好。因此,提出了一种结合卷积神经网络和哈希算法的深度网络架构,用于大规模图像检索。一方面,为了更好地保持哈希编码之间的语义相似性,引入了多任务学习机制,将图像分类信息和图像间的相似度信息同时用于模型的训练,并且根据信息熵理论,训练过程中使哈希编码尽可能地维持均匀分布以增加信息量;另一方面,提出了一种多尺度融合池化方法(multi-scale fusion pooling,MSFP),融合图像中多种尺度的区域信息,提升了检索性能,同时明显地减少了网络参数。在SVHN、CIFAR-10和NUS-WIDE等数据集上的实验结果表明,提出的算法与现有的基准算法相比,检索效果具有明显改善。