计算机科学与探索 ›› 2011, Vol. 5 ›› Issue (5): 433-445.
邓小龙, 王 柏, 吴 斌, 赵海舟
DENG Xiaolong, WANG Bai, WU Bin, ZHAO Haizhou
摘要: 随着电信行业竞争日益激烈, 基于数据挖掘的客户流失预测对于电信运营商提升客户服务质量具有重要意义。为提升客户流失预测效率和提高预测模型的泛化能力, 引入人工智能的遗传演化思想改进了基于心理学扩散模型SPA(spreading activation)的流失预测算法, 提出了基于遗传演化的流失预测算法GASPA (genetic algorithm based SPA)。GASPA在演化中能自主学习和优化模型参数, 通过在真实电话呼叫数据和短消息数据上实验, 发现GASPA在精确度上性能优于固定步长方法, 在Lift曲线值上性能优于SPA, 显著提高了SPA的Lift曲线值, 增强了SPA的流失预测效果。为处理海量电信数据, 实现了在云计算平台上的并行化方案M-GASPA(MapReduce-GASPA), 在提高GASPA可处理数据规模的同时降低了运行时间。