您现在的位置:首页 >> 技术文章 >> 图像语音处理 >> 内容

MATLAB代做|极低语速语音编码技术

时间:2014-11-2 23:48:09 点击:

  核心提示:MATLAB代做|MATLAB代写|MATLAB有偿编程 - MATLAB代做FPGA代做|FPGA代写|FPGA有偿编程 - FPGA代做QQ: 1224848052...
前面各种编码算法针对中低速率语音编码应用的。通常将数码滤低于1.2Kbps的语音编码器称为极低速率语音编码器。
现代通信一方面扩展信道,实现“宽带通信”,另一方面仍然追求更加有效、经济实用的信道。其中最重要的一项就是要压缩信源频带或编码速率。在语音通信信道中,有的信道难以扩展,且质量很差,例如短波信道,有的信道正被广泛使用,短期无法更新,例如市话和载波信道;有的信道通信环境比较复杂,例如在强的“人为干扰”或环境噪声下军用通信,数字语音保密通信,因特网语音通信;还有的信道十分昂贵,例如卫星、宇宙通信等。在这些条件下,极低速率语音编码很有吸引力。
400bps-1.2Kbps的语音编码算法一般是在2.4Kbps的LPC声码器的基础上,利用矢量量化技术和帧间相关性作进一步的数据压缩。
帧填充技术:在2.4Kbps的声码器中码序列相邻帧之间仍有相关性,尤其在平稳的语音段,如浊音段、帧于帧之间变化不大,因此,编码时可以每隔一帧做一次编码传输,并通过边信息通知合成端如何填充空白帧。填充时可以使用前邻帧,也可以是用后邻帧。这样处理大概可以在压缩一半的编码速率。更加细致考虑:填充帧的基频、能量按既定的规则生成,而不是完全复制相邻帧。采用帧填充技术,可以在数码率降低一半的情况下,保证合成语音的音质基本保持不变。
 
矢量量化技术,可以进一步减少帧间编码参数的相关性。在码激励线性预测编码器中,利用矢量量化技术对激励信号进行编码,实现了对编码的压缩,实际上,还可以用矢量量化技术对声道滤波器系数等参数进行编码,进一步降低编码速率。基本思路是:把一帧或多帧需要传输的某些参数划分在一起,组成一个矢量。根据感觉误差最小准则,在一个已训练好的码本中搜索该矢量对应的最佳码字,在传输时只传送该码字在码本中的序号,可以进一步降低编码速率,而不过多的影响音质。
利用矢量量化技术来压缩编码速率的典型例子是VQ-LPC声码器。VQ-LPC声码器,结合VQ技术,进一步降低了编码速率,而语音质量没有下降。LPC声码器LPC-10的参数量化比特分配情况为:基音6bit,清音标志1bit,增益5bit,这些参数已经没有进一步压缩的余地。然而p个lPC参数仍然还有很大的压缩余地,他们本省就是一种典型的矢量信号。每组LPC参数代表一种与能量大小无关的谱形,反映声道的一种形态。对于这样的矢量,已经找到了与主观感觉有较好对应关系的失真测度方法。既然他是声道形态的表征,他么它在p维空间中的分布必然是比较集中的。而人类听觉系统对于语音信号的谱形的分辨能力有限,允许一定程度的量化失真。因此用vQ技术编码时,可以用较小的码本。
VQ用于数据压缩的所有优势在LP参数的编码中都能得到充分的体现。首次提出VQ技术时,用VQ-LPC声码器作为例证来证明VQ压缩数据的强大威力。这一例证对于新型语音编码器和极低速率声码器的发展起了重要的推动作用。
 
识别合成型声码器信息论的观点来看,语音所含信息量的下界是50bps左右,大量研究表明:400bps以下,各种基于分析合成的算法都不满足要求。根本原因在于这种分析合成型声码器的编码单元是一帧或几帧语音信号,每帧,变幻无穷,用一个太小的有限符号集来表示,恢复的语音信号难免产生不可容忍的失真。接近这个下界,采用语音识别和与语音和成技术。以语音基元为编码单位进行编码。进年来,非特定人、连续语音识别、按规则语音合成已取得突破性进展,现在开发这种声码器已经具备了较好基础。
识别合成型声码器就是采用语音识别和合成技术,以语音单位位编码单元对语音信号进行编码,语音基元可以是音素、音节、或词,任何一种语言的音素或音节都是一个有限数目的集合,用他们作为基元可以实现限词汇的语音编码。
在发送部分采用语音识别技术进行语音基元识别和编码,在接收部分根据收到的语音基元代码串和某些附加的韵律信息重新合成语音因此这种声码器在信道中的参数很少,可以以极低的编码速率传输或存储语音参数,而且能恢复高质量的语音。
识别合成语音的基础是语音识别和语音合成技术。在识别合成声码器中的问题有:
1如何从语音信号中提取韵律特征参数并对他们进行压缩编码。所谓韵律就是语句中个音节的声学特征,如音长、音强、基音轮廓线、共振峰轨迹等的变化规律;在接收端利用这些韵律参数可以获得较高质量的输出语音。
2如何在语音识别中保证获得较高的音节识别正确率。例如使用特定人语音识别技术。非特定人语音识别系统的性能无法和特定人语音识别的性能相比拟。在特定人中的训练很麻烦和费时,一种可行的方法是采用说话人自适应技术,研究表明在语音识别系统中,采用各种快速说话人自适应算法是提高系统性能的一种有效途径。大量研究表明,适当的语言模型对提高系统的识别率也发挥重要作用。而在合成声码器中的语音模型又于一般语音识别系统的语言模型有所不同,他可以在保证音节发音正确的情况下,不必区分音节所对应的不同汉字的情况。而且在模型中,韵律信息也可以有效的加以利用,得到更高的识别性能。因而研究适用于识别和成型声码器的语音模型也是该编码算法的一项重要任务。

作者:不详 来源:网络
  • 您是如何找到本站的?
  • 百度搜索
  • Google搜索
  • 查阅资料过程中
  • 论坛发现
  • 百度贴吧发现
  • 朋友介绍
本站最新成功开发工程项目案例
相关文章
相关评论
发表我的评论
  • 大名:
  • 内容:
  • matlab代做|matlab专业代做|matlab淘宝代做(www.hslogic.com) © 2019 版权所有 All Rights Reserved.
  • Email:highspeed_logic@163.com 站长QQ: 1224848052

    专业代做/代写/承接、MATLAB、SIMULINK、FPGA项目、博士/硕士/本科毕业设计、课题设计、论文,毕业论文,Coursework、Eassy、Assignment