计算机科学与探索 ›› 2018, Vol. 12 ›› Issue (7): 1145-1153.DOI: 10.3778/j.issn.1673-9418.1705080
么素素,王宝亮,侯永宏
YAO Susu, WANG Baoliang, HOU Yonghong
摘要:
针对训练数据绝对不平衡问题,提出了一种基于级联结构的集成迁移学习算法。该算法主要包括两部分:迁移学习部分和数据选择部分。在迁移学习阶段,针对TrAdaBoost算法中辅助领域样本权重不可恢复问题,引入权重恢复因子;在数据选择阶段,算法利用级联结构逐步删除辅助领域中噪声样本与冗余样本,在保证目标领域主导作用的同时充分利用辅助领域数据。在真实数据集上的实验结果表明,该算法在数据绝对不平衡的情况下,提升了分类器的综合评价指标与几何平均数,因此该算法可以在一定程度上解决数据绝对不平衡问题。