计算机科学与探索 ›› 2017, Vol. 11 ›› Issue (8): 1288-1295.DOI: 10.3778/j.issn.1673-9418.1706033
李冬梅1+,张 琪1,王 璇2,檀 稳1
LI Dongmei1+, ZHANG Qi1, WANG Xuan2, TAN Wen1
摘要: 为了使中文问答系统能够准确高效地识别问句的语义,在构建生物医学领域本体的基础上,提出了一种基于浅层句法分析和最大熵模型的语义分析算法。该算法首先对自然语言问句进行语义块识别,如果识别成功,则形成问句向量,然后利用本体进行SPARQL查询;如果识别失败,则调用最大熵模型,判断问句的语义角色。最大熵模型利用标注好语义的熟语料进行训练,提取语义组块特征,从而判断出最可能的句型,形成问句向量,然后再利用本体进行查询,获取答案。通过实验与其他方法相比,新算法具有更高的查准率和召回率。