计算机科学与探索 ›› 2017, Vol. 11 ›› Issue (4): 608-618.DOI: 10.3778/j.issn.1673-9418.1604029
李 峰1,2+,侯加英3,曾荣仁1,凌 晨1
LI Feng1,2+, HOU Jiaying3, ZENG Rongren1, LING Chen1
摘要: 在归纳常见的句子相似度计算方法后,基于《人民日报》3.4万余份文本训练了用于语义相似度计算的词向量模型,并设计了一种融合词向量的多特征句子相似度计算方法。该方法在词方面,考虑了句子中重叠的词数和词的连续性,并运用词向量模型测量了非重叠词间的相似性;在结构方面,考虑了句子中重叠词的语序和两个句子的长度一致性。实验部分设计实现了4种句子相似度计算方法,并开发了相应的实验系统。结果表明:提出的算法能够取得相对较好的实验结果,对句子中词的语义特征和句子结构特征进行组合处理和优化,能够提升句子相似度计算的准确性。