计算机科学与探索 ›› 2016, Vol. 10 ›› Issue (10): 1451-1458.DOI: 10.3778/j.issn.1673-9418.1509042
黄伟婷1+,赵 红2,祝 峰2
HUANG Weiting1+, ZHAO Hong2, ZHU William2
摘要: 代价敏感属性选择是数据挖掘的一个重要研究领域,其目的在于通过权衡测试代价和误分类代价,获得总代价最小的属性子集。针对经典回溯算法运行时间较长的缺点,结合分治思想,提出了一种改进的回溯算法。改进算法引入了两个相关参数,根据数据集规模自适应调整参数,并按参数大小拆分数据集,降低问题规模,以提高经典回溯算法的执行效率。针对较大规模数据集的实验结果表明,与经典的回溯算法相比,改进算法在保证效果的同时至少提高20%的运算效率;与启发式算法相比,改进算法在保证效率的同时取得了具有更小总代价的属性集合,可应用于实际问题。