计算机科学与探索 ›› 2012, Vol. 6 ›› Issue (8): 726-740.DOI: 10.3778/j.issn.1673-9418.2012.08.006
陈红梅1,王丽珍1+,刘惟一1,袁立坚2
CHEN Hongmei1, WANG Lizhen1+, LIU Weiyi1, YUAN Lijian2
摘要: 针对不确定数据的概率分布难以获取的客观实际,讨论了缺失概率分布的值不确定离散对象的决策树。定义了(条件)概率区间,并证明了(条件)概率区间是可达概率区间;基于可达概率区间,定义了(条件)熵区间,并给出了求解(条件)熵区间的上/下界的方法;采用条件熵区间作为属性选择度量,提出了一种新的不确定决策树,将以0-1划分对象的决策树扩展到以概率区间分配对象的决策树,这样不仅可以处理缺失概率分布的值不确定离散对象,也可以处理确定离散对象。通过在基于UCI数据集的不确定数据集上的实验,证实了不确定决策树是有效的。