计算机科学与探索 ›› 2017, Vol. 11 ›› Issue (4): 565-576.DOI: 10.3778/j.issn.1673-9418.1603050
沈桂兰1,2+,贾彩燕3,于 剑3,杨小平2
SHEN Guilan1,2+, JIA Caiyan3, YU Jian3, YANG Xiaoping2
摘要: 对节点带有内容的信息网络进行语义社区发现是新的研究方向。融合节点内容增加了算法的复杂度。提出了一种在线性时间内进行语义社区发现的标签传播算法,用LDA(latent Dirichlet allocation)主题模型表示节点内容,以节点内容相似度和传播影响力的乘性模型作为标签传播的策略,在归一化过程中,自然融合节点内容和网络结构信息,标签迭代过程中,采用节点与绝大部分邻居节点内容不相同才进行更新的策略,保证算法的运行效率。通过在不同规模的12个真实数据集上进行实验,以模块度和纯度作为度量标准,验证了算法在语义社区发现上的有效性和可行性。