计算机科学与探索 ›› 2014, Vol. 8 ›› Issue (6): 727-734.DOI: 10.3778/j.issn.1673-9418.1403003
王超学1,张 涛1+,马春森2
WANG Chaoxue1, ZHANG Tao1+, MA Chunsen2
摘要: 针对SMOTE(synthetic minority over-sampling technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法GA-SMOTE。该算法的关键将是遗传算法中的3个基本算子引入到SMOTE中,利用选择算子实现对少数类样本有区别的选择,使用交叉、变异算子实现对合成样本质量的控制。结合GA-SMOTE与SVM(support vector machine)算法来处理不平衡数据的分类问题。UCI数据集上的大量实验表明,GA-SMOTE在新样本的整体合成效果上表现出色,有效提高了SVM在不平衡数据集上的分类性能。