计算机科学与探索 ›› 2019, Vol. 13 ›› Issue (7): 1154-1164.DOI: 10.3778/j.issn.1673-9418.1806013
浦建宇1,陈 蕾1,2,3+,邵 楷1
PU Jianyu1, CHEN Lei1,2,3+, SHAO Kai1
摘要: 基因-疾病关联关系预测已经成为当前生物医学研究的一个热点。现有的关联预测方法通常会遭受基因-疾病关联数据稀疏和PU(positive and unlabeled)问题的影响。基于以上不足,提出一种基于Katz增强归纳型矩阵补全的基因-疾病关联预测模型。该模型由基于Katz方法的预估计和基于归纳型矩阵补全方法的精化估计两个步骤组成。具体地,先利用Katz方法基于基因-疾病异构网络对基因-疾病关联进行预估计,以期缓解关联数据稀疏和PU问题的影响。然而,受制于相似度网络的质量,Katz方法在预估计基因-疾病关联时不可避免地会引入一些噪声,为此,将弹性网正则化技术引入传统的归纳型矩阵补全模型以增强其鲁棒性,进而用改进的归纳型矩阵补全模型来精化基因-疾病关联预测效果。实验结果表明,与目前流行的基因-疾病关联预测方法相比,所提出的模型在查全率和查准率上均有显著提高,同时也能解决关联预测中常见的冷启动问题。