计算机科学与探索 ›› 2011, Vol. 5 ›› Issue (5): 385-397.
张波良1,2, 周水庚1,2, 关佶红3
ZHANG Boliang1,2, ZHOU Shuigeng1,2, GUAN Jihong3
摘要: 由于Skyline查询广泛应用于多目标决策、数据可视化等领域, 近年来成为数据库领域的一个研究热点。针对云计算环境, 在MapReduce框架下设计并实现了Skyline算法。MapReduce是一个运行在大型集群上处理海量数据的并行计算框架, 其主要思想是任务的分解与结果的汇总。基于不同的数据划分思想, 实施了三种Skyline并行算法, 分别是基于MapReduce的块嵌套循环算法(MapReduce based block-nested- loops, MR-BNL)、基于MapReduce的排序过滤算法(MapReduce based sort-filter-skyline, MR-SFS)以及基于MapReduce的位图算法(MapReduce based bitmap, MR-Bitmap), 并针对这三种算法进行了系统的实验比较, 得出了不同数据分布、维数、缓存等因素对算法性能的影响结果。