计算机科学与探索 ›› 2012, Vol. 6 ›› Issue (2): 118-124.DOI: 10.3778/j.issn.1673-9418.2012.02.003
王 伟, 陈建平, 曾国荪, 俞莉花, 谭一鸣
WANG Wei, CHEN Jianping, ZENG Guosun, YU Lihua, TAN Yiming
摘要: 矩阵主特征向量(principal eigenvectors computing, PEC)的求解是科学与工程计算中的一个重要问题。随着图形处理单元通用计算(general-purpose computing on graphics processing unit, GPGPU)的兴起, 利用GPU来优化大规模稀疏矩阵的图形处理单元求解得到了广泛关注。分别从应用特征和GPU体系结构特征两方面分析了PEC运算的性能瓶颈, 提出了一种面向GPU的稀疏矩阵存储格式——GPU-ELL和一个针对GPU的线程优化映射策略, 并设计了相应的PEC优化执行算法。在ATI HD Radeon 5850上的实验结果表明, 相对于传统CPU, 该方案获得了最多200倍左右的加速, 相对于已有GPU上的实现, 也获得了2倍的加速。