%0 Journal Article %A 蔡元哲 %A 李 佩 %A 刘红岩 %A 何 军 %A 杜小勇 %A $authorName.trim() %A $authorName.trim() %A $authorName.trim() %A $authorName.trim() %A $authorName.trim() %T S-SimRank:结合内容和链接信息的文档相似度计算方法 %D 2009 %R 10.3778/j.issn.1673-9418.2009.04.005 %J 计算机科学与探索 %P 378-391 %V 3 %N 4 %X 文档的内容分析和连接分析是计算文档相似度的两种方法。连接分析能够发现文档之间的隐含关系,但是,由于文档之间的噪声的存在,这种方法很难得到精确的结果。为了解决这个问题,提出了一个新的算法—S-SimRank(Star-SimRank),有效地将文档的内容信息和连接信息结合在一起从而提高了文档相似度计算的准确性。S-Simrank算法在ACM数据集上无论是准确性和效率都比其他算法有了很大地提高。最后,给出了S-SimRank的收敛性的数学证明。 %U http://fcst.ceaj.org/CN/10.3778/j.issn.1673-9418.2009.04.005