计算机科学与探索 ›› 2017, Vol. 11 ›› Issue (4): 599-607.DOI: 10.3778/j.issn.1673-9418.1603057
李 英1,郭剑毅1,2+,余正涛1,2,毛存礼1,2,线岩团1,2
LI Ying1, GUO Jianyi1,2+, YU Zhengtao1,2, MAO Cunli1,2, XIAN Yantuan1,2
摘要: 依存句法分析是自然语言处理的一个关键环节,目前对于越南语短语结构树的研究比较多,而依存结构树的研究就显得十分薄弱。提出了一种新的方法,尝试结合越南语的语言特点和语法特征,利用中心子节点过滤表的思想与统计的方法将越南语的短语结构树转换成依存结构树。首先依据中文依存关系标注体系与越南语的语法规则,制定出依存关系列表;然后结合越南语的语言特点,制定出中心子节点过滤表,利用中心子节点过滤表的思想进行初步转化;最后使用依存关系标注器来进行依存关系标注。基于转换后得到的依存结构树,利用MSTParser工具进一步训练得到更多的越南语依存结构树。对实验结果进行了抽样评估,树库转换的准确率达到了89.4%,较好地解决了越南语由短语树到依存树的转换问题。