计算机科学与探索 ›› 2010, Vol. 4 ›› Issue (2): 145-152.DOI: 10.3778/j.issn.1673-9418.2010.02.006
付 强1,2+,王腾蛟1,2,李红燕1,3,杨冬青1,2,唐世渭1,3
FU Qiang1,2+, WANG Tengjiao1,2, LI Hongyan1,3, YANG Dongqing1,2, TANG Shiwei1,3
摘要: XML(extensible markup language)文档已经被广泛用作应用程序的一个数据交换格式,针对XML数据的压缩技术也逐渐成为新的研究领域。提出XSLC(XML stream layered-coding compression)算法,通过预先扫描DTD对数据模式进行分析,继而根据元素的父子关系进行子元素层面的编码;同时根据数据类型进行数据压缩,能够在压缩之后的文档上进行查询,因为仅需一遍压缩扫描所以可以应用于数据流环境。实验表明:XSLC算法的压缩比率和压缩时间均优于传统算法。
中图分类号: