计算机科学与探索 ›› 2015, Vol. 9 ›› Issue (2): 172-181.DOI: 10.3778/j.issn.1673-9418.1405050
曹科研+,王国仁,韩东红,李硕儒
CAO Keyan+, WANG Guoren, HAN Donghong, LI Shuoru
摘要: 近几年,随着数据流和不确定数据的产生,不确定数据流上的异常点检测成为新的研究热点。然而,现有的不确定数据的异常点定义中涉及3个参数,这对于用户是非常难设定的,以致不能查询到适合的异常点。在大多时候,用户更想知道最可能是异常点的对象,因此提出了不确定数据流上的top-k异常点查询算法。该算法通过估计数据对象异常点的概率范围而进行剪枝,从而减少了一些不必要的计算,同时增量地计算数据对象异常点的概率范围。在真实数据集和合成数据集上进行了一系列的模拟实验,证明了算法的性能。