计算机科学与探索 ›› 2008, Vol. 2 ›› Issue (1): 60-76.
常 雷1,2+,杨冬青1,2,王腾蛟1,2,唐世渭1,2
CHANG Lei1,2+, YANG Dongqing1,2, WANG Tengjiao1,2, TANG Shiwei1,2
摘要: 研究了如何使用SP-Feature来压缩序列模式。SP-Feature是一种简洁表示序列模式的新颖结构。一种新的相似性度量被用来聚类SP-Feature,同时也给出了SP-Feature的合并方法。基于层次聚类框架,设计了一种有效的挖掘压缩序列模式的算法CSP。在真实和模拟数据上的大量实验表明CSP能够快速有效地压缩序列模式(在稠密数据集上的恢复误差小于4%)。