计算机科学与探索 ›› 2019, Vol. 13 ›› Issue (9): 1582-1592.DOI: 10.3778/j.issn.1673-9418.1806067
王永贵,徐山珊,肖成龙
WANG Yonggui, XU Shanshan, XIAO Chenglong
摘要: 社团发现算法存在生成结果冗余及时间复杂度高等问题,虽然关联规则是解决社团发现问题的有效方法,但面临大量迭代计算的瓶颈。针对上述问题进行了研究,提出了一种改进社团发现的SIACD算法。该算法引入MAC地址和布尔矩阵的概念对数据进行预处理,利用基于项数的布尔向量交运算改进Apriori算法,再基于Spark实现算法并行化计算,通过关联规则的方式挖掘无线社团数据。实验结果表明,SIACD算法解决了生成结果冗余、复杂度高、迭代计算等问题,提升了社团发现的挖掘速度,提高了对大数据的处理能力。