计算机科学与探索 ›› 2013, Vol. 7 ›› Issue (6): 545-550.DOI: 10.3778/j.issn.1673-9418.1210006
张玉红+,胡学钢,张 娟
ZHANG Yuhong+, HU Xuegang, ZHANG Juan
摘要: 倾斜数据中普遍存在概念漂移,而已有数据流概念漂移检测方法多假设类分布是平衡的,难以用于倾斜数据流。为此,提出了一种基于正例分布的倾斜数据流概念漂移检测方法CDPSD。首先采用改进的重采样方法,避免将不同概念的实例采样到同一数据块中,并构建分类器;再通过检测正例而非所有实例的类分布变化进行概念漂移的检测及分类器更新。实验表明,CDPSD能及时检测到倾斜数据流中的概念漂移,并快速更新分类模型,提高了正类样本的分类效果。