计算机科学与探索 ›› 2019, Vol. 13 ›› Issue (4): 639-646.DOI: 10.3778/j.issn.1673-9418.1806007
孙 涛,周志华+
SUN Tao, ZHOU Zhihua+
摘要: 集成多样性,即个体学习器之间的差异性,是集成学习中的一个基础问题。多元信息多样性(multi-information diversity)基于信息论来刻画集成多样性,为理解集成多样性提供了一个可行方向,其在实际应用中面临的困难是高阶信息通常难以估计。提出基于一种特殊的[k]阶t-cherry联结树对高阶信息做低阶近似,从而得到多元信息多样性的近似估计。方法包括基于联结树直接近似估计多元信息和近似估计多元信息分量,并对两者的相关性进行了分析。实验结果表明,在同阶近似下,该估计方法优于现有近似估计方法。