计算机科学与探索 ›› 2015, Vol. 9 ›› Issue (4): 429-437.DOI: 10.3778/j.issn.1673-9418.1407034
雷 雨1+,李 曼2,胡卫松2,宋国杰1,谢昆青1
LEI Yu1+, LI Man2, HU Weisong2, SONG Guojie1, XIE Kunqing1
摘要: 序列模式挖掘是数据挖掘领域的一个经典研究问题,目前的研究主要关注于频繁序列模式的挖掘。但是不频繁的序列模式,即“稀有序列模式(rare sequential pattern,RSP)”也可能蕴含着一些不寻常的规律,具有更高的挖掘价值。因此,给出了稀有序列模式挖掘的定义,并且提出了两种逐层挖掘稀有序列模式完全集的方法。为克服挖掘稀有序列模式全集时产生的组合爆炸问题,提出了一种高效的基于二分查找的算法来挖掘“最小稀有序列模式(minimal rare sequential pattern,MRSP)”全集,它包含了稀有序列模式全集的完整信息。通过实验验证了提出的算法可以有效地挖掘稀有序列模式。