计算机科学与探索 ›› 2013, Vol. 7 ›› Issue (8): 736-746.DOI: 10.3778/j.issn.1673-9418.1212008
郭宪勇1,2,陈性元1,邓亚丹2+
GUO Xianyong1,2, CHEN Xingyuan1, DENG Yadan2+
摘要: 针对目前主流的多核处理器,研究了XML(extensible markup language)处理过程中XML文档解析性能优化,从多线程并发执行和提高线程内存访问性能两个方面优化XML文档解析的性能,主要贡献如下:给出了多线程XML文档解析框架,该框架采用多线程执行XML文档的扫描,采用预读线程改善解析线程的内存访问性能;给出了XML文档数据划分算法和数据融合算法,保证了该框架XML文档扫描结果的正确性,且算法自身代价很小;给出了该框架的代价分析,然后基于该代价分析优化了框架的性能;在实验中,基于开源XML处理引擎VTD-XML(virtual token descriptor XML)实现了上述多线程执行框架,测试了XML文档解析的性能。实验结果表明,多线程XML文档解析框架充分利用了多核处理器的计算资源,有效提高了线程的内存访问性能和XML文档解析的性能。