摘要: 文本分类是人们日常工作中经常遇到的问题, 也是机器学习的重要研究内容。半监督学习算法同时考虑有标记和无标记数据, 能显著提升学习效果。给出了文本分类的定义和特点, 介绍了传统的监督学习分类算法和评价指标, 对半监督文本分类的特点和基础理论进行了分析, 并具体介绍了一些半监督文本分类算法, 如贝叶斯方法和正则化方法。
牛 罡, 罗爱宝, 商 琳. 半监督文本分类综述[J]. 计算机科学与探索, 2011, 5(4): 313-323.
NIU Gang, LUO Aibao, SHANG Lin. A survey of semi-supervised text categorization[J]. Journal of Frontiers of Computer Science and Technology, 2011, 5(4): 313-323.