计算机科学与探索 ›› 2018, Vol. 12 ›› Issue (5): 697-707.DOI: 10.3778/j.issn.1673-9418.1705038
李 博1+,赵 翔1,2,王 帅1,葛 斌1,2,肖卫东1,2
LI Bo1+, ZHAO Xiang1,2, WANG Shuai1, GE Bin1,2, XIAO Weidong1,2
摘要: 关系分类是通过信息抽取实现文本数据结构化的重要一环。基于卷积神经网络(convolution neural network,CNN)的关系分类方法,在本身仅包含一个卷积层、池化层和softmax层的情况下,就能取得和其他复杂结构网络相当的效果。但在处理大间距实体的样本时,CNN难以提取有效特征甚至提取出从句中的错误特征,导致分类精度下降。此外,现有方法在输入同一样本的正向实例和反向实例时,会出现结果不一致的情况。针对这两个问题,提出了一种利用最短依赖路径的CNN句子编码器,对句子中与实体联系密切的词语进行选择性注意,增强了CNN抽取特征的有效性;定义了正向实例和反向实例,并设计了一种结合正向实例和反向实例的关系分类框架。实验证明,这种改进的关系分类框架和方法即使没有添加额外特征也取得了领域最优的效果。