计算机科学与探索 ›› 2015, Vol. 9 ›› Issue (10): 1238-1246.DOI: 10.3778/j.issn.1673-9418.1409019
李晓静1,2+,林海伦1,2,贾岩涛1,王元卓1,程学旗1
LI Xiaojing1,2+, LIN Hailun1,2, JIA Yantao1, WANG Yuanzhuo1, CHENG Xueqi1
摘要: 在线百科实体标注目的是标注出属于特定类别(如人名、地名、机构名等)的实体。百科实体标注对大量的应用,诸如实体消歧、实体关系挖掘、知识库构建都很重要。百科实体特征可以分为结构特征(属性框、标题、类别等)和内容特征(页面正文)。现有的标注方法大多只考虑一种特征或者一种分类器,导致F1值较低,无法充分发挥两种特征的优势。因此,提出了融合页面结构特征和内容特征的在线百科实体标注方法。该方法考虑了两种特征对标注结果的影响,分别构造分类器,并且对结果进行线性组合,能够更准确地实现百科实体的实体标注。实验表明,该方法在实体标注中F1值较其他对比实验方法均有所提高。