计算机科学与探索 ›› 2010, Vol. 4 ›› Issue (2): 180-190.DOI: 10.3778/j.issn.1673-9418.2010.02.010
• 学术研究 • 上一篇
王 翼+,徐六通,杨胜琦
WANG Yi+, XU Liutong, YANG Shengqi
摘要: 数据挖掘工作面临一个问题:由于数据挖掘任务需要处理大规模数据,导致任务执行时间过长。网格计算的研究目标就是将分散的、异构的、闲置的计算机结合为一个高性能的计算机系统,因此可以利用网格系统提供的高性能计算能力来有效降低数据处理时间。提出并实现基于网格计算的数据挖掘系统——DMGrid。重点考虑了并行计算功能,同时考虑了网格计算资源的动态配置。和现存的数据挖掘网格不同的是,DMGrid提供了一个引擎来执行应用中设定的工作流,同时还提供了应用运行监控功能。最后在实验中通过设计两个应用程序(客户流失分析和客户价值分析),证明了DMGrid的可行性。
中图分类号: