计算机科学与探索 ›› 2019, Vol. 13 ›› Issue (3): 521-528.DOI: 10.3778/j.issn.1673-9418.1805068
杨贵军,于 洋+
YANG Guijun, YU Yang+
摘要: 粗糙集选择是粗糙集实证研究中的关键步骤。目前常用的粗糙集择优标准是误判率。考虑到误判率准则未考察粗糙集的复杂度,存在过拟合风险,在测试集中误判率小的粗糙集不一定具有最强的泛化能力,引入Mallow’s Cp准则作为一种新粗糙集选择标准。粗糙集的Mallow’s Cp选择算法通过Logistic模型将非线性的粗糙集分类规则表达为线性形式,Logistic模型的Cp值作为粗糙集的Cp值,根据Cp值进行粗糙集择优。实际应用显示,粗糙集的Mallow’s Cp选择算法能够筛选出泛化能力强的粗糙集,相较误判率准则选出泛化能力强的粗糙集的频率更高。特别当多个粗糙集的误判率差异小时,新算法更可能选出泛化能力强的粗糙集。粗糙集的Mallow’s Cp选择算法兼顾了粗糙规则的分类准确性与复杂度,能够更好地选择泛化能力强的粗糙集。