计算机科学与探索 ›› 2019, Vol. 13 ›› Issue (9): 1534-1542.DOI: 10.3778/j.issn.1673-9418.1809029
张涛,刘阳,任相赢
ZHANG Tao, LIU Yang, REN Xiangying
摘要: 语音端点检测是语音信号处理的基础,为了提高在低信噪比及非平稳噪声下语音端点检测的准确性,提出了一种基于长时信号功率谱变化的语音特征,利用阈值判决法验证了这一特征在语音端点检测中的应用前景。该方法首先统计信号在长时段下功率谱的变化量;然后进行阈值判决,在初始化后可依据每次的判决结果自适应更新阈值;最后通过投票决策机制来判定当前是否为语音帧。仿真结果表明,与两种经典的基于长时特征(长时段信号变化率和长时段信号谱平坦度)的语音端点检测方法相比,所提方法在不同噪声环境及信噪比下,均具有更高的检测准确率,尤其在非平稳噪声条件下的检测效果提升明显,例如在机枪噪声环境下,平均检测准确率提高超过10%。