计算机科学与探索 ›› 2020, Vol. 14 ›› Issue (5): 792-802.DOI: 10.3778/j.issn.1673-9418.1904001
丁志成,葛洪伟
DING Zhicheng, GE Hongwei
摘要:
针对密度峰值聚类算法在面对复杂结构数据集时容易出现分配错误的问题,提出一种优化分配策略的密度峰值聚类算法(ODPC)。新算法首先引入参数积[γ],扩大了聚类中心的选取范围;然后使用改进的数据点分配策略,对数据集的数据点进行基于相似度指标[MS]的重新分配,进一步优化了簇类中点集的分配;最后使用[dc]近邻法优化识别数据集的噪声点。在人工数据集及UCI真实数据集上的实验均可证明,新算法能够在优化噪声识别的同时,提高复杂流形数据集中数据点分配的正确率,并取得比DPC算法、DenPEHC算法、GDPC算法更好的聚类效果。