计算机科学与探索 ›› 2012, Vol. 6 ›› Issue (10): 903-911.DOI: 10.3778/j.issn.1673-9418.2012.10.005
杨 静1,2+,高嘉伟1,2,梁吉业1,2,刘杨磊1,2
YANG Jing1,2+, GAO Jiawei1,2, LIANG Jiye1,2, LIU Yanglei1,2
摘要: DBSCAN(density based spatial clustering of applications with noise)算法是一种典型的基于密度的聚类算法。该算法可以识别任意形状的类簇,但聚类结果依赖于参数Eps和MinPts的选择,而且对于一些密度差别较大的数据集,可能得不到具有正确类簇个数的聚类结果,也可能将部分数据错分为噪声。为此,利用数据场能较好描述数据分布,反映数据关系的优势,提出了一种基于数据场的改进DBSCAN聚类算法。该算法引入平均势差的概念,在聚类过程中动态地确定每个类的Eps和平均势差,从而能够在一些密度相差较大的数据集上得到较好的聚类结果。实验表明,所提算法的性能优于DBSCAN算法。