计算机科学与探索 ›› 2013, Vol. 7 ›› Issue (1): 1-13.DOI: 10.3778/j.issn.1673-9418.1209024
庞 俊,谷 峪,许 嘉,于 戈
PANG Jun, GU Yu, XU Jia, YU Ge
摘要: 相似性连接查询,即查找相似的数据对象对,具有广泛的应用领域,例如相似网页检测、实体解析、数据清洗和相似图像检索等。相似性连接查询是当前大数据处理领域的热点问题之一。讨论了相似性连接查询面临的挑战;根据不同的标准对现有的相似性连接查询进行了分类;总结并比较了现有的字符串、集合、向量和图相似性连接算法;探讨了今后的研究重点和发展趋势。