计算机科学与探索 ›› 2016, Vol. 10 ›› Issue (3): 414-424.DOI: 10.3778/j.issn.1673-9418.1505005
郭瑛洁+,王士同
GUO Yingjie+, WANG Shitong
摘要: 使用边信息进行距离学习的方法在许多数据挖掘应用中占有重要位置,而传统的距离学习算法通常使用马氏距离形式的距离函数从而具有一定的局限性。提出了一种基于混合距离进行距离学习的方法,数据集的未知距离度量被表示为若干候选距离的线性组合,利用数据的边信息学习得到各距离所占权值从而得到新的距离函数,并将该距离函数应用于聚类算法以验证其有效性。通过与其他已有的距离学习方法进行对比,基于UCI(University of California,Irvine)数据集的实验结果证明了该算法具有明显的优势。