%0 Journal Article %A 马志程 %A 袁海峰 %A 谷洋 %A 刘亚茹 %A 张孝 %T 文档-关系数据查询执行技术研究与实现 %D 2020 %R 10.3778/j.issn.1673-9418.1908023 %J 计算机科学与探索 %P 1315-1326 %V 14 %N 8 %X

随着大数据时代的到来,各类互联网应用产生了丰富的数据类型。将多种多样结构的数据进行一体化存储、查询和组织是新时代下的大数据管理系统的研究热点。对关系数据库和NoSQL文档数据库加以统一管理,将支持结构化数据和半结构化数据的两种不同的数据库引擎集成在大数据管理系统中,实现了查询引擎ENTIA来执行查询处理。基于全局视图对用户提供统一的查询接口,终端用户无需关心数据的类型、结构以及物理存储位置,只需根据业务需求向ENTIA发出请求即可。进行了大量的前期实验,基于启发式规则进行查询优化,单个查询被重写为可以并行执行的多个查询子任务,将计算推向合适的数据库引擎,充分利用系统计算资源,大大提高了系统的查询性能。以关系数据库PostgreSQL和文档数据库MongoDB两个对等引擎为代表,实现了ENTIA对多数据类型的查询能力以及查询优化能力。通过功能符合实验测试了ENTIA能够正确地执行混合查询,以多组性能对比实验证明了优化方法的有效性。

%U http://fcst.ceaj.org/CN/10.3778/j.issn.1673-9418.1908023