计算机科学与探索 ›› 2020, Vol. 14 ›› Issue (4): 712-720.DOI: 10.3778/j.issn.1673-9418.1902022
• 理论与算法 • 上一篇
钱雪忠,金辉
QIAN Xuezhong, JIN Hui
摘要:
针对密度峰值聚类算法受人为干预影响较大和参数敏感的问题,即不正确的截断距离[dc]会导致错误的初始聚类中心,而且在某些情况下,即使设置了适当的[dc]值,仍然难以从决策图中人为选择初始聚类中心。为克服这些缺陷,提出一种新的基于密度峰值的聚类算法。该算法首先根据[K]近邻的思想来确定数据点的局部密度,然后提出一种新的自适应聚合策略,即首先通过算法给出阈值判断初始类簇中心,然后依据离初始类簇中心最近分配剩余点,最后通过类簇间密度可达来合并相似类簇。在实验中,该算法在合成和实际数据集中的表现比DPC、DBSCAN、[KNNDPC]和K-means算法要好,能有效提高聚类准确率和质量。