计算机科学与探索 ›› 2013, Vol. 7 ›› Issue (11): 973-982.DOI: 10.3778/j.issn.1673-9418.1305053
吴志川,毛 琛,韩 蕾,陈立军+
WU Zhichuan, MAO Chen, HAN Lei, CHEN Lijun+
摘要: 矩阵乘法是线性代数和图算法中非常重要的一个基本操作,而大规模数据处理中的矩阵往往是稀疏矩阵。MapReduce编程框架能够有效地支持海量数据的分布式计算。因此,对如何运用MapReduce编程框架实现超大规模稀疏矩阵的乘法进行了研究。传统矩阵乘法并行算法没有针对稀疏矩阵进行专门优化,导致计算过程中出现大量不必要的通信开销。提出了一种新的算法——CRM(column row multiplication)算法,并与传统的矩阵分块算法进行了比较。实验证明,CRM算法运行效率有很大的提高,并且具有高度的可伸缩性,适合在MapReduce平台上运行。