计算机科学与探索 ›› 2015, Vol. 9 ›› Issue (7): 869-876.DOI: 10.3778/j.issn.1673-9418.1409037
杜红乐+
DU Hongle+
摘要: 为了解决传统分类器的过拟合现象,从而增强分类性能,提出了一种基于核空间中K-近邻算法的混合取样的不均衡数据集分类算法。该算法首先在核空间上计算样本与相反类样本的k个近邻,以及类样本间的平均距离,即两个类中心间的距离;然后依据控制参数删除远离分类边界的样本,再对少数类利用SMOTE算法插入样本;最后在新的训练集上确定最终决策函数。在人工数据集和4组UCI数据集上进行了实验,结果表明了该算法对不均衡数据集进行降维采样的有效性。