计算机科学与探索 ›› 2011, Vol. 5 ›› Issue (5): 398-409.
师金钢, 鲍玉斌, 冷芳玲, 于 戈
SHI Jingang, BAO Yubin, LENG Fangling, YU Ge
摘要: 针对数据密集型应用, 提出了一种基于MapReduce框架的并行Dwarf数据立方构建算法。算法将传统Dwarf立方等价分割为多个独立的子Dwarf立方, 采用MapReduce架构, 实现了Dwarf立方的并行构建、查询和更新。实验证明, 并行Dwarf算法一方面结合了MapReduce框架的并行性和高可扩展性, 另一方面结合了Dwarf立方结构的数据高压缩性及数据自索引性。并行Dwarf立方既实现了数据立方的高压缩存储, 提供了快速的构造和增量更新操作, 又克服了MapReduce机制没有索引的劣势, 实现了数据立方上的快速查询操作。