计算机科学与探索 ›› 2013, Vol. 7 ›› Issue (4): 368-376.DOI: 10.3778/j.issn.1673-9418.1205024
仲兆满1+,李存华1,戴红伟1,刘宗田2
ZHONG Zhaoman1+, LI Cunhua1, DAI Hongwei1, LIU Zongtian2
摘要: 子话题是对话题的再次划分,是比话题粒度更细的新兴研究方向,子话题的聚类是话题内部演化关系分析的基础。提出了融合内容特征和时间特征的中文新闻子话题聚类方法,重点分析了子话题内容特征的表现规律,研究了子话题特征词的权重计算和降维方法。选取5个话题的18个子话题进行了实验,结果表明,所提方法的性能与已有的子话题聚类方法相比有显著提高。