计算机科学与探索 ›› 2010, Vol. 4 ›› Issue (5): 455-463.DOI: 10.3778/j.issn.1673-9418.2010.05.008
石国强, 牛常勇, 范 明+
SHI Guoqiang, NIU Changyong, FAN Ming+
摘要: 提出了一种使用基于规则的基分类器建立组合分类器的新方法PCARules。尽管新方法也采用基分类器预测的加权投票来决定待分类样本的类, 但是为基分类器创建训练数据集的方法与bagging和boosting完全不同。该方法不是通过抽样为基分类器创建数据集, 而是随机地将特征划分成K个子集, 使用PCA得到每个子集的主成分, 形成新的特征空间, 并将所有训练数据映射到新的特征空间作为基分类器的训练集。在UCI机器学习库的30个随机选取的数据集上的实验表明:算法不仅能够显著提高基于规则的分类方法的分类性能, 而且与bagging和boosting等传统组合方法相比, 在大部分数据集上都具有更高的分类准确率。
中图分类号: