计算机科学与探索 ›› 2016, Vol. 10 ›› Issue (11): 1614-1622.DOI: 10.3778/j.issn.1673-9418.1510049
李 涛1,葛洪伟1,2+,苏树智1
LI Tao1, GE Hongwei1,2+, SU Shuzhi1
摘要: 密度峰聚类是一种新的基于密度的聚类算法,该算法不需要预先指定聚类数目,能够发现非球形簇。针对密度峰聚类算法需要人工确定聚类中心的缺陷,提出了一种自动确定聚类中心的密度峰聚类算法。首先,计算每个数据点的局部密度和该点到具有更高密度数据点的最短距离;其次,根据排序图自动确定聚类中心;最后,将剩下的每个数据点分配到比其密度更高且距其最近的数据点所属的类别,并根据边界密度识别噪声点,得到聚类结果。将新算法与原密度峰算法进行对比,在人工数据集和UCI数据集上的实验表明,新算法不仅能够自动确定聚类中心,而且具有更高的准确率。