期刊在线咨询服务,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

期刊咨询 杂志订阅 购物车(0)

一种基于LSTM-RNN的喉振传声器语音盲增强算法

郑昌艳; 张雄伟; 曹铁勇; 杨吉斌; 孙蒙; 邢益搏 陆军工程大学; 南京210007

关键词:喉振传声器 语音盲增强 递归神经网络 长短时记忆 非负矩阵分解 

摘要:喉振传声器以其优良的抗噪声特性已在多种强噪声场景中得到应用,但其产生的语音尚存在着中频成份厚重、高频成份缺失等问题,严重影响了语音的清晰度和可懂度。为改善喉振传声器的语音质量,本文提出了一种基于长短时记忆递归神经网络(Long short term memory recurrent neuralnetworks,LSTM-RNN)的喉振传声器语音盲增强算法。与基于低维的谱包络特征估计算法不同,该算法首先利用LSTM-RNN对喉振传声器语音与空气传导语音的高维对数幅度谱之间的转换关系进行建模,能有效捕捉上下文信息实现语音幅度谱的重构,然后采用非负矩阵分解(Non-negative matrixfactorization,NMF)对估计出的语音幅度谱进行处理,有效抑制了过平滑问题,进一步提高了语音质量。仿真实验得到的LLR,LSD,PESQ性能指标表明,该算法可有效改善喉振传声器的语音质量。

数据采集与处理杂志要求:

{1}基金项目:如果论文是项目成果,请按“项目名称(项目号)”的形式写出。项目名称与项目号两者都要有。

{2}稿件应具有科学性、创新性和实用性,论点明确、论据可靠、数据准确、逻辑严谨、文字通顺。

{3}文中图表或插图请附清晰的原图文件(tif. 或eps.格式,不低于600 像素)。

{4}注释是对论文中某一特定内容的解释或补充说明,用带圈数字注于当页页脚。

{5}稿件文字、标点、年代、数字等书写方式均以国家有关规定为准。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

数据采集与处理

北大期刊
1-3个月下单

关注 30人评论|0人关注
相关期刊
  • 中医儿科
    省级期刊 1个月内下单
    甘肃中医药大学;中华中医药学会
  • 中国仪器仪表
    部级期刊 1个月内下单
    机械工业仪器仪表综合技术经济研究所;中国仪器仪表行业协会
  • 中国疫苗和免疫
    北大期刊 1-3个月下单
    中国疾病预防控制中心
  • 中华医学遗传学
    北大期刊 1-3个月下单
    中华医学会(四川大学承办)
服务与支付