计算机科学与探索 ›› 2019, Vol. 13 ›› Issue (6): 1005-1015.DOI: 10.3778/j.issn.1673-9418.1806019
商显震1,2,韩 萌1,孙毓忠2+,孙宇宁3,陈 旭2,胡满满2,梅御东2
SHANG Xianzhen1,2, HAN Meng1, SUN Yuzhong2+, SUN Yuning3, CHEN Xu2, HU Manman2, MEI Yudong2
摘要: 不同皮肤病间发病率的差异导致了皮肤病数据类不平衡现象,对使用机器学习方法构建高效、准确的皮肤病诊断模型带来了巨大挑战。提出一种融合生成对抗网络(generative adversarial networks,GAN)和朴素贝叶斯的皮肤病二分类诊断方法:在皮肤病数据集上训练朴素贝叶斯二分类器作为诊断器,创新性地使用GAN为前者生成补充训练样本,使其训练集正负类样本达到平衡。针对皮肤病诊断多分类问题,提出一种融合生成对抗网络和朴素贝叶斯的多分类诊断方法:使用GAN和朴素贝叶斯训练皮肤病单病种二分类器,并结合了词频-逆文档频率算法(term frequency-inverse document frequency,TF-IDF),将多个二分类器组合成一个多分类器作为诊断器。与六种诊断方法进行了对比实验,提出的两种皮肤病诊断方法准确率和召回率均有提升。