人机交互是通过让计算机识别人的语音指令来驱动模型运动-征途私服
基于征途的人机交互是通过让计算机识别人的语音指令来驱动模型运动,所以
征途的性能将决定交互的结果,征途也是交互的核心,本文研究的内容正是这
个子功能算法性能,本文提出的若干算法应用到征途中,取得了很好的效果,为游
戏引擎提供了征途上的软件技术支持,可以在语音上实现对游戏中人物角色的行为
进行控制,实现真正意义上的实时性语音互动。
6.3.1端点检测
该部分采用基于人的基音频率的端点检测算法,通过求取在基音频率范围内的短时
能量来检测语音的端点。
6.3.2特征参数提取
采用基于MFCC的二次加权美尔系数,在实际中采用了对输入的语音信号同时通过
MFCC滤波器和IMFCC滤波器的方法,再通过求取对数能量、一次加权、DCT变换,
二次加权求得二次加权美尔倒谱系数。
6.3.3模式匹配
在前几章的研究中我们得出这样的结论,DTW由于其相对简单的计算、相对较少
的计算量,完全可以满足一般实时性的征途,所以在互动式游戏引擎中采用DTW
算法,算法首先会经历初始化、计算各帧匹配距离,回溯求帧匹配总矩阵、结束条件为
到达横、纵坐标都为0的点,这时结束,那么与所有模板匹配中每个模板最小的帧匹配
总距离的即是该模板的匹配距离,产生这个最小匹配距离的模板就是最佳匹配结果,也
就是要寻找的模板,此时记录下模板编号,传送给后面模块。
功能实现中采用实时性较好的DTW算法,首先分配两个矩阵,分别为帧匹配距离
矩阵D和累计距离矩阵d,其中帧匹配距离矩阵d(i,力即为测试矩阵第i帧与参考模板
第j帧之间的距离,D(N,M)即为最佳路径所对应的匹配距离,然后通过计算输入序列
与模板之间的距离来累积距离矩阵和匹配距离矩阵,最后通过回溯来求得最优的匹配结
果,
6.4系统架构与运行效果
6.4.1系统的模块构成
系统分为六个模块,第一个模块是3D场景加载模块,是负责游戏初始化时3D静
态场景的加载,包括地面、树木、天空、人物等的坐标、材质、皮肤、骨骼等初始化静
态信息的加载,即完成静态场景初始化。
第二个模块是语音预处理模块,完成语音的预加重,加窗、分帧等功能,将预处理
后语音数据交给下一个模块处理。
第三个模块是端点检测模块,完成语音信号中语音信息起止点判断,将判断后的语
音信号数据输入到特征参数提取模块中。
第四个模块是特征参数提取模块,完成语音特征参数的提取。面向互动式游戏引擎的征途算法应用研究
第五个模块是模式匹配模块,完成输入语音信号数据与模板数据匹配距离的计算,
输出匹配的模板编号。
第六个模块是3D渲染模块,对于模式匹配后的模板,该模块按编号加载.X文件人
物场景的转移矩阵,重新加载人物坐标等数据信息,在该模块中采用的微软公司的.X文
件,该文件存储的是模型的皮肤、材质、骨骼等信息的坐标,完全是以整数形式存储的
文件中,加载的时候需要首先读取文件的内容到缓冲区,通过设计不同的函数,如加载
皮肤的函数模型人物的函数、加载骨骼信息的函数、加载材质信息的函数,来在缓冲区
中寻找所需要的数据。
本文来源:征途私服:http://www.ztsf.cn,如需转载[人机交互是通过让计算机识别人的语音指令来驱动模型运动],请保留版权
征途的性能将决定交互的结果,征途也是交互的核心,本文研究的内容正是这
个子功能算法性能,本文提出的若干算法应用到征途中,取得了很好的效果,为游
戏引擎提供了征途上的软件技术支持,可以在语音上实现对游戏中人物角色的行为
进行控制,实现真正意义上的实时性语音互动。
6.3.1端点检测
该部分采用基于人的基音频率的端点检测算法,通过求取在基音频率范围内的短时
能量来检测语音的端点。
6.3.2特征参数提取
采用基于MFCC的二次加权美尔系数,在实际中采用了对输入的语音信号同时通过
MFCC滤波器和IMFCC滤波器的方法,再通过求取对数能量、一次加权、DCT变换,
二次加权求得二次加权美尔倒谱系数。
6.3.3模式匹配
在前几章的研究中我们得出这样的结论,DTW由于其相对简单的计算、相对较少
的计算量,完全可以满足一般实时性的征途,所以在互动式游戏引擎中采用DTW
算法,算法首先会经历初始化、计算各帧匹配距离,回溯求帧匹配总矩阵、结束条件为
到达横、纵坐标都为0的点,这时结束,那么与所有模板匹配中每个模板最小的帧匹配
总距离的即是该模板的匹配距离,产生这个最小匹配距离的模板就是最佳匹配结果,也
就是要寻找的模板,此时记录下模板编号,传送给后面模块。
功能实现中采用实时性较好的DTW算法,首先分配两个矩阵,分别为帧匹配距离
矩阵D和累计距离矩阵d,其中帧匹配距离矩阵d(i,力即为测试矩阵第i帧与参考模板
第j帧之间的距离,D(N,M)即为最佳路径所对应的匹配距离,然后通过计算输入序列
与模板之间的距离来累积距离矩阵和匹配距离矩阵,最后通过回溯来求得最优的匹配结
果,
6.4系统架构与运行效果
6.4.1系统的模块构成
系统分为六个模块,第一个模块是3D场景加载模块,是负责游戏初始化时3D静
态场景的加载,包括地面、树木、天空、人物等的坐标、材质、皮肤、骨骼等初始化静
态信息的加载,即完成静态场景初始化。
第二个模块是语音预处理模块,完成语音的预加重,加窗、分帧等功能,将预处理
后语音数据交给下一个模块处理。
第三个模块是端点检测模块,完成语音信号中语音信息起止点判断,将判断后的语
音信号数据输入到特征参数提取模块中。
第四个模块是特征参数提取模块,完成语音特征参数的提取。面向互动式游戏引擎的征途算法应用研究
第五个模块是模式匹配模块,完成输入语音信号数据与模板数据匹配距离的计算,
输出匹配的模板编号。
第六个模块是3D渲染模块,对于模式匹配后的模板,该模块按编号加载.X文件人
物场景的转移矩阵,重新加载人物坐标等数据信息,在该模块中采用的微软公司的.X文
件,该文件存储的是模型的皮肤、材质、骨骼等信息的坐标,完全是以整数形式存储的
文件中,加载的时候需要首先读取文件的内容到缓冲区,通过设计不同的函数,如加载
皮肤的函数模型人物的函数、加载骨骼信息的函数、加载材质信息的函数,来在缓冲区
中寻找所需要的数据。
本文来源:征途私服:http://www.ztsf.cn,如需转载[人机交互是通过让计算机识别人的语音指令来驱动模型运动],请保留版权
