计算机科学与探索 ›› 2010, Vol. 4 ›› Issue (9): 840-849.DOI: 10.3778/j.issn.1673-9418.2010.09.007
面向高维数据集的近邻顺序查询方法
崔江涛1+, 肖 斌1, 詹海生2
CUI Jiangtao1+, XIAO Bin1, ZHAN Haisheng2
摘要: 对顺序索引方法进行了研究, 提出一种基于向量近似的高维顺序索引结构, 该结构顺序访问部分文件就能完成k近邻查询。在查询过程中依据投影值来终止查询过程, 依据距离来排除不匹配的数据。为进一步降低数据访问率, 采用椭圆体聚类算法对数据集进行划分。新索引结构支持以多个顺序访问过程完成k近邻查询, 能够同时降低查询过程中的I/O开销和CPU开销。在大型高维图像特征库上的实验表明,新的高维索引结构的查询性能优于其他高维索引方法。
中图分类号: