计算机科学与探索 ›› 2012, Vol. 6 ›› Issue (10): 935-947.DOI: 10.3778/j.issn.1673-9418.2012.10.009
刘喜平1,2+,万常选1,2,刘德喜1,2
LIU Xiping1,2+, WAN Changxuan1,2, LIU Dexi1,2
摘要: 可扩展标记语言(extensible markup language,XML)数据的关键词搜索面临着搜索结果数量庞大,同质化严重和不易区分等问题,针对这些问题,提出了一种新的基于多样化的方法。首先从查询结果抽取原型以标识查询结果语义,然后根据结果原型的特点,定义了原型的兴趣度和原型之间的距离,在此基础上,实现了原型的多样化。进一步提出了一种XML关键词搜索结果组织方法,即按照原型聚集查询结果。这种组织方式能够解决上述问题。最后通过实验证明了所提方法的有效性。