您现在的位置:首页 >> 技术文章 >> 图像语音处理 >> 内容

MATLAB代做|通道畸变的抑制方法

时间:2014-11-2 23:50:50 点击:

  核心提示:MATLAB代做|MATLAB代写|MATLAB有偿编程 - MATLAB代做FPGA代做|FPGA代写|FPGA有偿编程 - FPGA代做QQ: 1224848052...
语音信号携带有语言学的信息,不可避免受到其他信号源的干扰,这些非语言学信息源将直接影响语音识别系统功能。
通道环境的频率特征强烈地影响到语音信号的短时频谱。语音识别系统的许多相似度测量直接或者间接地依赖于语音信号的短时频谱分析结果,所以语音识别系统也明显地受到这种通信环境频率特征强烈的影响。
对通道畸变影响的抑制方法,有倒谱平均减CMS,RASTA-PLP方法。
 
倒谱平均减CMS一般使用CMS时,对训练和测试中的每个发音都进行这一过程。在同一环境中的发音的均值是相同的。再到谱矢量上使用CMS不影响倒谱的一阶和二阶特征。
CMS不能正确判断极短的发音,发音很短,包含一个以上音素的情况,问题可以克服,音素间混淆要比没有应用CMS高。发音长度如果大于2s-4s,CMS并不会引起识别率下降。CMS方法也可作为一类话者归正的方法。缺点是在计算发音均值时不能分辨出无声和有声,并且当通道畸变不能被模型化为线性特征时,该方法的有效性受到限制。处理非线性通道畸变,提出二级CMS方法,它对非线性通道畸变采用了简单的分段处理方法,先将输入语音信号分为语音和背景两部分,并分别求出各部分倒谱特征的平均值,然后每一部分的到谱特征再分别减去各自的平均值。
 
二级CMS方法
基于时不变线性通道畸变假设的CMS方法,广泛地用于进行通道畸变的抑制,并被认为是一种标准的通道畸变抑制方法。对非线性畸变,不能有好效果,采用一种简单的分段线性模型的处理方法,假设语音信号依赖于一个依赖能量大小的线性滤波器的干扰,对输入信号的不同能量段,传输通道有不同的频率响应。通过在不同的能量段上去除各自的倒谱平均值,可以抑制通道畸变的影响。二级CMS就是这样处理方法,将混噪语音信号按能量分为两段,每段分别采用前面CMS方法。
加性噪声可被忽略情况下,通道畸变对语音信号的影响在对数频谱域上将为加性。离散余弦变换一种线性变换,因此,将通道畸变污染后的语音信号从对数频谱域上经离散余弦变换后,通道畸变对语音信号的影响在倒谱域上变为加性,采用CMS去除通道中不变的部分。对于非线性通道畸变,只能在高信噪比的语音段中忽略噪声的影响,对具有非常低噪声比的信号段上,忽略语音部分。语音信号分为两部分,背景和语音,然后分别对各部分使用CMS方法进行通道畸变抑制,可以更有效地处理通道畸变的影响。
一个给定的语音信号倒谱序列,他的每一帧分别将其分类为背景帧和语音帧。分类使用一个序列中的最大能量值作为参考进行。二级CMS用于汽车环境下数字识别中的通道畸变控制,以及说话人识别中的通道畸变控制时,性能优于CMS方法。系统依赖于分类结果。
 
RASTA-PLP 技术
感知线性预测PLP,将人耳的听觉试验获得的一些结论,通过近似计算进行工程化的处理,之后应用到频谱分析中。
PLP分析具体过程1.频谱分析,语音信号进过采样、加窗、离散傅里叶变换后,取短时语音频谱的实部和虚部的平方和,得到短时功率谱。
2.临界带分析将频率和频率轴映射到Bark频率。按每个Bark间隔采样,选择合适的采样间隔可以保证用整数采样值覆盖整个分析频带。
3.等响度预加重
4.强度和响度转换,在进行全极点模型求线性预测系数之前的最后一步是响度幅值压缩,这一步是近似和模拟声音的强度和人耳感受的响度间的非线性关系。
5.全极点模型求线性预测系数。
RASTA技术一种用于抑制传输通道对语音信号产生影响的方法,依据在于感知实验的结果。感知实验指出,人类对语音的听觉感知性可以抑制平稳的非语音学北京,增强变化的语言信息。基于听觉感知特性的语音分析方法有助于顽健语音识别。传输通道变化对于语音的变化来说是常量的或缓变的,RASTA-PLP利用这种传输通道的相对平稳性,在每个PLP频带对数频谱上,使用一个低端截止频率非常低的带通滤波器进行滤波处理来代替通常的短时频谱。每个频带上任何常量或者相对变化缓慢的部分将被抑制。对数频域上频谱的常数部分反映的是输入语音信号中卷积的影响,而这种卷积的影响刚好是传输通道的影响。
RASTA-PLP处理过程:
1.计算临界带频谱,取其对数
2.使用连续5点频谱回归来估计对数临界带频谱的导数
3.做非线性处理
4.要用一个一阶的IIR系统对上面对数临界带暂变特征重积分,通过调整IIR系统的极点位置设置有效窗长。一般取0.98
5.通常的PLP处理,进行等响度预加重和强度-响度转换
6.对相对的对数频谱取指数计算,产生一个相对的听觉频谱
7.用全极点模型求线性预测系数
RASTA-OLP滤波器的高通部分有利于抑制通道中卷积噪声的影响,低通部分有助于平滑短时频谱分析造成的帧间变化。RASTA-PLP的结果通常依赖于分析的起始点。经典的RASTA处理抑制了对数频谱上传输通道畸变等变化缓慢的部分,然而不相关的加性噪声等部分经对数运算后变为与信号相关的部分,且不能在对数频域上经RASTA带通滤波有效进行去除。RASTA不适合对明显带有加性噪声的原始信号进行处理。
改进的RASTA处理技术,如LIN-LOG RASTA,在噪声加性时,相当于在功率谱上滤波,噪声是卷积类型时,相当于在对数谱上滤波。通道畸变的抑制主要依靠RASTA处理部分进行,PLP技术只是对人类听觉感知特性的一种工程模拟。完全可以将RASTA处理应用到Mel频率对数频谱上。先求MFCC,再做带通滤波处理。RASTA主要部分是在每个频带的对数频谱上使用了低端截止频率非常低的带通滤波器。

作者:不详 来源:网络
  • 您是如何找到本站的?
  • 百度搜索
  • Google搜索
  • 查阅资料过程中
  • 论坛发现
  • 百度贴吧发现
  • 朋友介绍
本站最新成功开发工程项目案例
相关评论
发表我的评论
  • 大名:
  • 内容:
  • matlab代做|matlab专业代做|matlab淘宝代做(www.hslogic.com) © 2019 版权所有 All Rights Reserved.
  • Email:highspeed_logic@163.com 站长QQ: 1224848052

    专业代做/代写/承接、MATLAB、SIMULINK、FPGA项目、博士/硕士/本科毕业设计、课题设计、论文,毕业论文,Coursework、Eassy、Assignment