专利名称:一种提高DNN模型泛化性能的语音增强方法专利类型:发明专利
发明人:程琳娟,彭任华,郑成诗,李晓东申请号:CN201811623918.6申请日:20181228公开号:CN109767782A公开日:20190517
摘要:本发明公开了一种提高DNN模型泛化性能的语音增强方法,所述方法包括:步骤1)将原始带噪语音当前帧能量平均值与训练集能量平均值之间的比值作为当前帧增益,根据调整后的当前帧增益对原始带噪语音的当前帧幅度进行调整;步骤2)提取调整幅度后的带噪语音的特征并输入预先用训练集训练好的DNN模型中,估计纯净语音对数谱和噪声对数谱;步骤3)利用IRM后处理对纯净语音对数谱进行二次估计;步骤4)利用二次估计后的纯净语音对数谱和带噪语音的相位通过重叠相加法得到时域信号,并对此时域信号进行幅度调整反变换,最终估计出纯净语音时域信号。本发明的方法能够提高DNN模型在与训练集能量不匹配场景下的泛化能力,计算复杂度低,应用范围广。
申请人:中国科学院声学研究所
地址:100190 北京市海淀区北四环西路21号
国籍:CN
代理机构:北京方安思达知识产权代理有限公司
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容