计算机科学与探索 ›› 2013, Vol. 7 ›› Issue (8): 729-735.DOI: 10.3778/j.issn.1673-9418.1305005
马儒宁1,王 萍1,丁军娣2+
MA Runing1, WANG Ping1, DING Jundi2+
摘要: 粗化是多层聚类算法中的关键步骤。经典的多层聚类算法,如METIS(multilevel scheme for partitioning irregular graphs)、Graclus等,利用顶点和边权的若干准则合并顶点和边,实现粗化,其缺点是粗化之后的小规模数据集无法准确表述原数据集的全局信息和结构。提出了核心集粗化(core-sets coarsening)的方法,通过定义“多层核心集”,逐层保留数据集的全局信息。同时,顶层核心点的个数与聚类个数相同,其每个核心点对应一个单独的类,因此不需要一般多层聚类中的划分过程。实验结果表明了该算法的有效性。