计算机科学与探索 ›› 2016, Vol. 10 ›› Issue (9): 1310-1319.DOI: 10.3778/j.issn.1673-9418.1509086
薛丽娟,席梦隆,王梦婕,王昊奋,阮 彤+
XUE Lijuan, XI Menglong, WANG Mengjie, WANG Haofen, RUAN Tong+
摘要: 实体关系抽取是指从无结构的自然语言文本中抽取实体之间的语义关系,并以结构化的形式表示出来。传统的实体关系抽取方法只注重一种特定类型的数据源,并需要标注大量的训练数据来训练抽取模型,人工成本高。因此提出了一种综合多种数据源,并结合规则推理引擎的实体关系抽取方法,准确地说就是综合结构化和非结构化两种数据源,在结构化数据提供少量种子的情况下用规则推理引擎推理出更多的实体关系。然后使用远程监督学习方法从无结构的文本中抽取实体关系,通过多次迭代获得最终的实体关系。实验结果证明了该方法的有效性。