计算机科学与探索 ›› 2019, Vol. 13 ›› Issue (4): 711-720.DOI: 10.3778/j.issn.1673-9418.1804033
• 理论与算法 • 上一篇
金 辉+,钱雪忠
JIN Hui+, QIAN Xuezhong
摘要: 针对现有的基于密度的聚类算法存在参数敏感,处理非球面数据和复杂流形数据聚类效果差的问题,提出一种新的基于密度峰值的聚类算法。该算法首先根据自然最近邻居的概念确定数据点的局部密度,然后根据密度峰局部密度最高并且被稀疏区域分割来确定聚类中心,最后提出一种新的类簇间相似度概念来解决复杂流形问题。在实验中,该算法在合成和实际数据集中的表现比DPC(clustering by fast search and find of density peaks)、DBSCAN(density-based spatial clustering of applications with noise)和K-means算法要好,并且在非球面数据和复杂流形数据上的优越性特别大。