计算机科学与探索 ›› 2015, Vol. 9 ›› Issue (10): 1153-1162.DOI: 10.3778/j.issn.1673-9418.1412057
车永刚1,2+,张理论1,2,王勇献1,2,徐传福2,程兴华2
CHE Yonggang1,2+, ZHANG Lilun1,2, WANG Yongxian1,2, XU Chuanfu2, CHENG Xinghua2
摘要: 多核与众核已成为当前主流的高性能计算体系结构,OpenMP编程是开发其并行计算能力的主要手段之一。针对一个实际高阶精度结构网格CFD(computational fluids dynamics)应用程序,采用基于硬件计数器的性能测试和模型分析的方法,系统地研究了其在Intel Xeon E5 Sandy Bridge多核处理器和Intel Knights Corner集成众核协处理器上的OpenMP性能。重点分析了OpenMP库开销、线程负载均衡性、主存访问带宽对性能的影响,发现因OpenMP并行引入的冗余计算对并行效率影响很小,但串行计算部分和负载不均衡性对并行效率影响大,主存访问带宽对浮点性能的影响大。还比较了该程序两种体系结构上的性能差异,讨论了性能进一步优化的方向。