计算机科学与探索 ›› 2016, Vol. 10 ›› Issue (3): 381-388.DOI: 10.3778/j.issn.1673-9418.1505048
欧书华+,刘学军,张 礼
OU Shuhua+, LIU Xuejun, ZHANG Li
摘要: RNA-Seq是目前转录组研究的一种重要技术,针对RNA-Seq数据分析中读段的多源映射,参考序列分布的不均匀性,一些转录本中外显子分布稀疏以及跨结合区读段处理问题,提出了一个新的转录组表达研究模型sLDASeq。该模型根据基因中转录本注释信息对模型参数进行约束,对跨结合区的读段按长度分配处理,解决了读段非均匀分布和跨结合区问题;在模型中增加一个超参数,从而解决了外显子的稀疏问题。将该模型应用到3个真实的数据集上,并与其他主流方法进行比较,结果表明该模型获得了较为准确的基因以及转录本表达水平计算结果。