计算机科学与探索 ›› 2015, Vol. 9 ›› Issue (9): 1075-1083.DOI: 10.3778/j.issn.1673-9418.1410042
周发超1,王志坚1,2+,叶 枫1,2,邓玲玲1
ZHOU Fachao1, WANG Zhijian1,2+, YE Feng1,2, DENG Lingling1
摘要: 在关联规则挖掘领域有很多算法,其中最经典的是Apriori算法,该算法可找出所有的频繁项集,并发现项目间的关联关系,但是执行效率却很低。针对经典Apriori算法中存在的I/O过重,产生频繁项集,计算量过大等问题,提出了一种Apriori的改进方案I_Apriori,通过减少扫描数据库次数,降低候选项集计算复杂度以及减少预剪枝步骤计算量等途径提高了算法的执行效率。对比分析了Apriori和I_Apriori算法,I_Apriori算法计算复杂度更低,同时进行了对比实验,结果表明相比于Apriori算法,I_Apriori算法执行效率更高。