计算机科学与探索 ›› 2018, Vol. 12 ›› Issue (7): 1154-1161.DOI: 10.3778/j.issn.1673-9418.1705043
刘晓燕,张诚诚,郭茂祖,邢林林
LIU Xiaoyan, ZHANG Chengcheng, GUO Maozu, XING Linlin
摘要:
转录调控网络一直是系统生物学和生物信息学领域的一个研究热点。构建转录调控网络为揭示细胞内的生化反应机制提供了重要的手段。目前该领域的研究存在生物数据利用不充分,基因转录调控网络构建精度低等问题,尤其是在比较大的数据集上。针对以上问题,充分利用基因表达数据、基因序列数据和基因注释数据,提出了基于深度自编码器的XGBoost和逻辑回归组合模型DAXL(combined model with XGBoost and logistic regression based on deep AutoEncoder)。最后,在拟南芥数据集上进行了实验,结果表明DAXL方法提高了转录调控网络的预测精度,并且较对比方法优势明显。