计算机科学与探索 ›› 2018, Vol. 12 ›› Issue (6): 972-980.DOI: 10.3778/j.issn.1673-9418.1708028
许 侃1,林 原2,曲 忱1,徐 博1,林鸿飞1+
XU Kan1, LIN Yuan2, QU Chen1, XU Bo1, LIN Hongfei1+
摘要: 查询扩展技术被广泛地应用于信息检索系统中。为提高专利检索的结果,采用查询扩展方法进行优化,利用相关专利文本训练词向量,并选择与原始查询相似度高的候选词作为查询扩展词,加入原始查询中。提出4种方法运用词向量获取查询扩展词,并提出两种方法进行扩展词相关性排序,改进已有的查询扩展词选择方法。在TREC数据集上的实验显示,将词向量模型进行扩展词选择的方法与传统的TF-IDF扩展词选择方法相融合,可以有效提高查询扩展模型的性能,对于理解用户的查询意图有着很好的促进作用。