计算机科学与探索 ›› 2010, Vol. 4 ›› Issue (9): 769-779.DOI: 10.3778/j.issn.1673-9418.2010.09.001
潘世瑞1, 张阳1,2+, 李雪 3, 王勇 4
Nearest Neighbor Algorithm for Positive and Unlabeled Learning with Uncertainty
PAN Shirui1, ZHANG Yang1,2+, LI Xue3, WANG Yong4
摘要: 研究了在正例和未标记样本场景下不确定样本的分类问题, 提出了一种新的算法NNPU(nearest neighbor algorithm for positive and unlabeled learning)。NNPU 具有两种实现方式:NNPUa 和NNPUu。在UCI 标准数据集上的实验结果表明, 充分考虑数据不确定信息的NNPUu 算法要比仅仅考虑样本中不确定信息均值的NNPUa 算法具有更好的分类能力; 同时, NNPU 算法在对精确数据进行分类时, 比NN-d、OCC以及aPUNB 算法性能更优。
中图分类号: