计算机科学与探索 ›› 2010, Vol. 4 ›› Issue (7): 662-672.DOI: 10.3778/j.issn.1673-9418.2010.07.010
• 学术研究 • 上一篇
闫光辉 1+, 董晓慧1, 刘云 1, 贺少领1, 马志程2
YAN Guanghui1+, DONG Xiaohui1, LIU Yun1, HE Shaoling1, MA Zhicheng2
摘要: 数据流随时间演变具有突发性及随机性的特点, 如何自适应、实时追踪这种变化是数据流挖掘面临的一个重要问题, 完全由用户通过试探来甄别这种变化在实际中无法实现, 同时也失去了数据流聚类进化追踪的现实意义。针对聚类变化自动追踪问题, 考虑到现实的计算资源限制和处理速度要求, 结合分形聚类、自适应采样技术与Chernoff 不等式, 提出了数据流聚类演变实时追踪算法, 进行聚类演变的自动追踪; 通过合成与实际数据集上的实验工作验证了算法的有效性。
中图分类号: