期刊在线咨询服务,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)
关键词:喉振传声器 语音盲增强 递归神经网络 长短时记忆 非负矩阵分解
摘要:喉振传声器以其优良的抗噪声特性已在多种强噪声场景中得到应用,但其产生的语音尚存在着中频成份厚重、高频成份缺失等问题,严重影响了语音的清晰度和可懂度。为改善喉振传声器的语音质量,本文提出了一种基于长短时记忆递归神经网络(Long short term memory recurrent neuralnetworks,LSTM-RNN)的喉振传声器语音盲增强算法。与基于低维的谱包络特征估计算法不同,该算法首先利用LSTM-RNN对喉振传声器语音与空气传导语音的高维对数幅度谱之间的转换关系进行建模,能有效捕捉上下文信息实现语音幅度谱的重构,然后采用非负矩阵分解(Non-negative matrixfactorization,NMF)对估计出的语音幅度谱进行处理,有效抑制了过平滑问题,进一步提高了语音质量。仿真实验得到的LLR,LSD,PESQ性能指标表明,该算法可有效改善喉振传声器的语音质量。
数据采集与处理杂志要求:
{1}基金项目:如果论文是项目成果,请按“项目名称(项目号)”的形式写出。项目名称与项目号两者都要有。
{2}稿件应具有科学性、创新性和实用性,论点明确、论据可靠、数据准确、逻辑严谨、文字通顺。
{3}文中图表或插图请附清晰的原图文件(tif. 或eps.格式,不低于600 像素)。
{4}注释是对论文中某一特定内容的解释或补充说明,用带圈数字注于当页页脚。
{5}稿件文字、标点、年代、数字等书写方式均以国家有关规定为准。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社