计算机科学与探索 ›› 2018, Vol. 12 ›› Issue (12): 1950-1960.DOI: 10.3778/j.issn.1673-9418.1807036
舒敏,刘华文,郑忠龙,徐晓丹
SHU Min, LIU Huawen, ZHENG Zhonglong, XU Xiaodan
摘要:
异常检测是数据挖掘的主要研究热点问题之一。目前已存在很多异常检测的方法,但是现存的主要异常检测方法在高维数据处理过程中效率较低。为解决此问题,提出了一种高效的异常检测算法。该算法结合局部敏感哈希的性质和图的随机游走来识别异常点。具体而言,通过局部敏感哈希实现对高维数据的高效处理,随后利用数据之间距离获取其相似性,并将其转化为随机游走的转移概率。在此基础上,使用随机游走技术计算数据之间的游走概率,其中正常数据之间的转移概率越来越高,而异常点的概率越来越低,进而根据此性质最终辨别异常数据。实验结果表明,提出的方法能有效检测出数据中的异常,总体上优于其他异常检测算法。