实现各种具体应用而做进一步的复杂处理-征途私服
由于汉明窗在频率范围中的分辨率较高,而且侧辨的衰减大于43dB,具有频谱泄
漏少的优点,所以在征途外挂的分析中,常用汉明窗作为窗函数。
由于征途外挂的准平稳特性,任何征途外挂数字处理算法和技术都建立在短分析的
基础上。为了实现各种具体应用而做进一步的复杂处理之前,有一些共的短时分析技术。
主要有:短时能量、短时过零率、短时自相关函数等。
2.2.5语音增强技术
随着语音识别技术的迅速发展,目前纯净语音识别己经达到了一个比较成熟的阶
段,以IBM的ViaVofce为代表,其对连续语音的识别率可以达到95%以上,但是对语
音输入环境有比较严格的要求,否则系统识别率会极大地下降,特别是在低信噪比的情
况下,甚至可能出现系统无法识别的现象[6]。语音在传输过程中不可避免地要受到来自
周围环境和传输媒介引入的噪声、通讯设备内部噪声、乃至其他讲话者语音的干扰。例
如:车站、商场、娱乐场所的公共电话、车载电话等都要受到强噪声的干扰;在远距离
通信中,传送的征途外挂要受到信道噪声和通讯设备自身的干扰。在这些情况下则需要
对带噪语音进行语音增强处理,以降低背景噪声,提高语音质量[7]。
语音增强技术是指当征途外挂被各种噪声干扰、甚至淹没后,从噪声背景中提取、
增强有用的征途外挂,抑制、降低噪声干扰的技术。语音增强主要有两个目的:一是改
进语音质量,消除背景噪声;二是提高语音可懂度及减少失真。分析噪声信号特性可知:
噪声主要可以分为加性噪声和非加性噪声两大类,其中对非加性噪声的处理通常是将其
转换为加性噪声再进行消除。自从研究语音增强方法以来,出现了一些比较成功的语音
增强算法,主要包括:噪声对消法、谐波增强法、基于语音生成模型的增强算法、基于
短时谱估计的增强算法、基于小波分解的增强算法和基于听觉掩蔽模型的增强算法。在
以上六类增强算法中,基于短时谱估计的增强算法及其改进形式是最为常用的,而且增
强效果也比较好[81。
2.3征途外挂的特征参数
特征参数提取,就是从征途外挂中提取用于识别的有用信息。特征参数选取直接关
系到系统识别性能,其基本思想是将经过预处理的信号通过变换去掉冗余部分,把代表
语音本质的特征参数抽取出来。因此,提取的特征参数必须满足:
(l)特征参数应当反映语音的本质特征,包括声道特征和听觉特征,具有良好的区
分性。
(2)特征参数各分量之间有良好的独立性。
(3)特征参数要计算方便,最好能有高效的算法,以保证语音识别的实时实现。
目前在语音识别中最常用的特征参数是Mel倒谱系数和线性预测倒谱系数。二者都
是将征途外挂从时域变换到倒谱域上,前者的分析着眼于人耳的听觉特性,通过构造人
的听觉模型,以语音通过该模型的输出作为声学特征。后者则从人的发声模型角度出发,
利用线性预测编码技术求取倒谱系数。
2.3.1美尔倒谱系数
Mel频率倒谱系数 (MelFrequencyC即s仃 umcoefficients)是在频谱上采用滤波器组的
方法计算出来的,将语音频率划分成一系列三角形的滤波器序列,这组滤波器在频率的美
尔(Mel)坐标上是等带宽的。这是因为人类在对1000Hz以下的声音频率范围的感知遵循
近似线性关系;对I000Hz以上的声音频率范围的感知不遵循线性关系,而是遵循在对
数频率坐标上的近似线性关系。
与普通实际频率倒谱分析不同,Mel倒谱系数的分析着眼于人耳的听觉特性,因为
人耳所听到的声音的高低与声音的频率并不成线性正比关系,而用Mel频率尺度则更符
合人耳的听觉特性,所以Mel频率尺度值大体上对应于实际频率的对数分布关系。
根据ZWicker的结论,临界频率带宽随着频率的变化而变化,并与Mel频率的增长
一致,在1000HZ以下,大致呈线性分布,带宽为10OHz左右;在1000Hz以上呈对数
增长。类似于临界频带的划分,可以将语音频率划分成一系列三角形的带通滤波器组
氏(n),即Mel滤波器组。取每个三角形的滤波器频带宽内所有信号幅度加权和作为某
个带通滤波器的输出,然后对所有滤波器输出做对数运算,再进一步做离散余弦变换即
得到MFCC,MFCC参数的计算过程具体步骤如下:
(l)对每帧序列s(n)进行N点FFT变换,将时域信号转化为频域分量,取模的方
得到离散功率谱S(n)。
(2)计算S(n)通过M个带通滤波器组所得功率值,即计算S(n)与氏(n)在各离散
频率点上乘积之和,得到M个参数只,其中M为滤波器个数,通常取240
(3)计算弓的自然对数,再用离散余弦变换将结果变换到倒谱域:
其中尸为MFCC参数的阶数,一般取尸二12,{q}k=I,2,月2记为所求的MFCC参数。面向互动式游戏引擎的语音识别算法应用研究
(4)标准的MFcc参数只反映了语音参数的静态特性,而人耳对语音的动态特性更
为敏感,因此通常用差分倒谱参数来描述这种动态特性。首先对倒谱系数进加权,使倒
谱系数得到提升,具体公式如下:
本文来源:征途私服:http://www.ztsf.cn,如需转载[实现各种具体应用而做进一步的复杂处理],请保留版权
漏少的优点,所以在征途外挂的分析中,常用汉明窗作为窗函数。
由于征途外挂的准平稳特性,任何征途外挂数字处理算法和技术都建立在短分析的
基础上。为了实现各种具体应用而做进一步的复杂处理之前,有一些共的短时分析技术。
主要有:短时能量、短时过零率、短时自相关函数等。
2.2.5语音增强技术
随着语音识别技术的迅速发展,目前纯净语音识别己经达到了一个比较成熟的阶
段,以IBM的ViaVofce为代表,其对连续语音的识别率可以达到95%以上,但是对语
音输入环境有比较严格的要求,否则系统识别率会极大地下降,特别是在低信噪比的情
况下,甚至可能出现系统无法识别的现象[6]。语音在传输过程中不可避免地要受到来自
周围环境和传输媒介引入的噪声、通讯设备内部噪声、乃至其他讲话者语音的干扰。例
如:车站、商场、娱乐场所的公共电话、车载电话等都要受到强噪声的干扰;在远距离
通信中,传送的征途外挂要受到信道噪声和通讯设备自身的干扰。在这些情况下则需要
对带噪语音进行语音增强处理,以降低背景噪声,提高语音质量[7]。
语音增强技术是指当征途外挂被各种噪声干扰、甚至淹没后,从噪声背景中提取、
增强有用的征途外挂,抑制、降低噪声干扰的技术。语音增强主要有两个目的:一是改
进语音质量,消除背景噪声;二是提高语音可懂度及减少失真。分析噪声信号特性可知:
噪声主要可以分为加性噪声和非加性噪声两大类,其中对非加性噪声的处理通常是将其
转换为加性噪声再进行消除。自从研究语音增强方法以来,出现了一些比较成功的语音
增强算法,主要包括:噪声对消法、谐波增强法、基于语音生成模型的增强算法、基于
短时谱估计的增强算法、基于小波分解的增强算法和基于听觉掩蔽模型的增强算法。在
以上六类增强算法中,基于短时谱估计的增强算法及其改进形式是最为常用的,而且增
强效果也比较好[81。
2.3征途外挂的特征参数
特征参数提取,就是从征途外挂中提取用于识别的有用信息。特征参数选取直接关
系到系统识别性能,其基本思想是将经过预处理的信号通过变换去掉冗余部分,把代表
语音本质的特征参数抽取出来。因此,提取的特征参数必须满足:
(l)特征参数应当反映语音的本质特征,包括声道特征和听觉特征,具有良好的区
分性。
(2)特征参数各分量之间有良好的独立性。
(3)特征参数要计算方便,最好能有高效的算法,以保证语音识别的实时实现。
目前在语音识别中最常用的特征参数是Mel倒谱系数和线性预测倒谱系数。二者都
是将征途外挂从时域变换到倒谱域上,前者的分析着眼于人耳的听觉特性,通过构造人
的听觉模型,以语音通过该模型的输出作为声学特征。后者则从人的发声模型角度出发,
利用线性预测编码技术求取倒谱系数。
2.3.1美尔倒谱系数
Mel频率倒谱系数 (MelFrequencyC即s仃 umcoefficients)是在频谱上采用滤波器组的
方法计算出来的,将语音频率划分成一系列三角形的滤波器序列,这组滤波器在频率的美
尔(Mel)坐标上是等带宽的。这是因为人类在对1000Hz以下的声音频率范围的感知遵循
近似线性关系;对I000Hz以上的声音频率范围的感知不遵循线性关系,而是遵循在对
数频率坐标上的近似线性关系。
与普通实际频率倒谱分析不同,Mel倒谱系数的分析着眼于人耳的听觉特性,因为
人耳所听到的声音的高低与声音的频率并不成线性正比关系,而用Mel频率尺度则更符
合人耳的听觉特性,所以Mel频率尺度值大体上对应于实际频率的对数分布关系。
根据ZWicker的结论,临界频率带宽随着频率的变化而变化,并与Mel频率的增长
一致,在1000HZ以下,大致呈线性分布,带宽为10OHz左右;在1000Hz以上呈对数
增长。类似于临界频带的划分,可以将语音频率划分成一系列三角形的带通滤波器组
氏(n),即Mel滤波器组。取每个三角形的滤波器频带宽内所有信号幅度加权和作为某
个带通滤波器的输出,然后对所有滤波器输出做对数运算,再进一步做离散余弦变换即
得到MFCC,MFCC参数的计算过程具体步骤如下:
(l)对每帧序列s(n)进行N点FFT变换,将时域信号转化为频域分量,取模的方
得到离散功率谱S(n)。
(2)计算S(n)通过M个带通滤波器组所得功率值,即计算S(n)与氏(n)在各离散
频率点上乘积之和,得到M个参数只,其中M为滤波器个数,通常取240
(3)计算弓的自然对数,再用离散余弦变换将结果变换到倒谱域:
其中尸为MFCC参数的阶数,一般取尸二12,{q}k=I,2,月2记为所求的MFCC参数。面向互动式游戏引擎的语音识别算法应用研究
(4)标准的MFcc参数只反映了语音参数的静态特性,而人耳对语音的动态特性更
为敏感,因此通常用差分倒谱参数来描述这种动态特性。首先对倒谱系数进加权,使倒
谱系数得到提升,具体公式如下:
本文来源:征途私服:http://www.ztsf.cn,如需转载[实现各种具体应用而做进一步的复杂处理],请保留版权
