计算机科学与探索 ›› 2017, Vol. 11 ›› Issue (10): 1599-1608.DOI: 10.3778/j.issn.1673-9418.1609035
尹春林1,王 炜1,2+,李 彤1,2,何 云1,熊文军1,周小煊1
YIN Chunlin1, WANG Wei1,2+, LI Tong1,2, HE Yun1, XIONG Wenjun1, ZHOU Xiaoxuan1
摘要: 软件特征定位是软件演化活动顺利展开的保证。基于文本的特征定位方法是目前特征定位研究的一个重要组成部分。当前基于文本的特征定位方法将代码关键词视为独立同分布的个体,忽略了代码间的语境。针对上述问题,基于深度学习语言模型RNNLM(recurrent neural networks language model)提出了一种源代码主题建模方法,并在此基础上实现了特征定位。实验结果表明,与基于LDA(latent Dirichlet allocation)和LSI(latent semantic indexing)的文本特征定位相比较,查准率提高8.61%和2.61%,表明该方法具有较优的查准率。