计算机科学与探索 ›› 2018, Vol. 12 ›› Issue (6): 1004-1012.DOI: 10.3778/j.issn.1673-9418.1702048
于晓飞1,葛洪伟1,2+
YU Xiaofei1, GE Hongwei1,2+
摘要: 基于势能的快速层次聚类算法使用一种全新的相似性度量准则,可以更高效地得到聚类结果。但该算法需人工设定聚类数目,而且在分配样本时仅依据距离测度,削弱了势能的影响。针对上述问题,提出一种自动确定聚类中心的势能聚类算法。新算法基于势能的物理意义和数据点与父节点的距离两个特征来自动确定聚类中心,并在分配机制上同时考虑势能和距离两个因素。在人工数据集和真实数据集上的实验表明,新算法不仅可以自动确定聚类数目,而且具有更优的聚类结果。