计算机科学与探索 ›› 2018, Vol. 12 ›› Issue (10): 1559-1570.DOI: 10.3778/j.issn.1673-9418.1709033
申金鑫,吴 烨+,陈 荦,景 宁
SHEN Jinxin, WU Ye+, CHEN Luo, JING Ning
摘要: 在应对激增的空间数据时,空间聚集查询是一类有效的分析方法。当前,传统单机串行方法已经难以胜任在线分析需求,然而并行可扩展的计算架构中专门针对空间数据的聚集索引技术尚未有很多研究。因此,提出两种新的索引方法以支持空间在线并行聚集分析。第一种索引方法中,并行的两级空间索引结构提升了精确聚集查询效率。在此基础上构建随机采样样本并优化得到第二种索引方法,在任意给定置信度下能够反馈带有置信区间聚集查询结果,且精度随着获取样本的增加不断提高。10亿级规模数据实验结果表明该方法有效可行,还有一定的可扩展性。