计算机科学与探索 ›› 2013, Vol. 7 ›› Issue (11): 1009-1017.DOI: 10.3778/j.issn.1673-9418.1306012
钱宇华1+,成红红2,张晓琴2,梁吉业1
QIAN Yuhua1+, CHENG Honghong2, ZHANG Xiaoqin2, LIANG Jiye1
摘要: 大数据时代的到来给数据挖掘和知识发现带来了很大的挑战。簸箕是一种大家熟知的农用工具,能快速将不同的物体分开。基于簸箕的工作机制,提出了一个新颖的学习原理:随机并行序化原理(random parallel ranking principle,RPRP),称为数据簸箕,可高效地对数据进行排序和分类。为了验证这种学习原理的有效性与高效性,设计了一种新的聚类方法,即聚类簸箕。实验结果表明,聚类簸箕能够快速且有效地对数据进行聚类。此外,该学习原理也能够用于设计高效的分类器。该数据簸箕有望推动大数据背景下机器学习与知识发现理论与方法的发展。