计算机科学与探索 ›› 2011, Vol. 5 ›› Issue (8): 673-685.

• 学术研究 • 上一篇    下一篇

标签劣质的XML数据上的查询处理

姜国华, 姜守旭, 王宏志, 李建中, 高 宏   

  1. 哈尔滨工业大学 计算机科学与技术学院, 哈尔滨 150001
  • 收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2011-08-01 发布日期:2011-08-01

Query Processing on XML with Dirty Tags

JIANG Guohua, JIANG Shouxu, WANG Hongzhi, LI Jianzhong, GAO Hong   

  1. School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China
  • Received:1900-01-01 Revised:1900-01-01 Online:2011-08-01 Published:2011-08-01

摘要: XML数据中的不正确数据、不一致数据、不精确数据等劣质数据给XML数据上的有效查询处理带来了挑战。重点研究了标签劣质的XML数据上twig查询的处理方法。给出求得每个标签的拼写相近标签、松弛标签、同义标签等相似标签的方法, 以及在XML文档中求出与原查询相似的所有查询结果的高效算法。通过实验证明了所提方法的有效性和效率。

关键词: 劣质数据, 可扩展标记语言(XML), twig查询

Abstract: Uncertain data as incorrect data, inconsistent data, imprecise data bring challenges to effective query processing on extensible markup language (XML). This paper focuses on processing twig queries on XML with dirty tags. First it shows the generating methods of similar spelling tags, relaxation tags and synonym tags of each tag, and then proposes the efficient algorithm which computes all the similar query results. Experimental evaluation of effectiveness and efficiency is made on all the methods.

Key words: uncertain data, extensible markup language (XML), twig query