【摘要】 本发明涉及一种语种识别系统及方法,该系统包括:预处理和特征提取模块、 生成性音子序列解码模块、N元文法语言语法模型模块及分类器。生成性音子序列 解码模块包括:混合高斯模型训练模块、混合高斯模型解码模块及序列平滑模块。 该系统及方法将训练语种语音数据通过EM迭代准则,训练生成与该语种数据相对 应的混合高斯模型,并根据该混合高斯模型对输入语音的特征进行识别,产生音子 序列。本发明的系统及方法利用基于混合高斯模型的生成性音子序列解码模块,避 免PPRLM系统中前端音子识别器所需要的大量计算,实现在不损失检测精度的基础 上识别速度大幅提高;使用平滑策略,使语音序列具有明显的短时稳定性。 【专利类型】发明申请 【申请人】中国科学院声学研究所; 北京中科信利技术有限公司 【申请人类型】企业,科研单位 【申请人地址】100190北京市海淀区北四环西路21号中国科学院声学研究所 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810247575.8 【申请日】2008-12-30 【申请年份】2008 【公开公告号】CN101645269A 【公开公告日】2010-02-10 【公开公告年份】2010 【发明人】颜永红; 肖翔; 索宏彬; 赵庆卫 【主权项内容】1、一种语种识别系统,该系统包括: 一预处理和特征提取模块,用于对输入的语音信号做预处理、提取语音信号的 特征,并将该特征送入生成性音子序列解码模块; 一N元文法语言语法模型模块,用于对送入的音子序列进行似然打分,并将该 得分送入分类器;及 一分类器,用于将N元文法语言语法模型模块的打分进行比较,最终确定输入 的语音信号的语种类别; 其特征在于,所述语种识别系统还包括: 一生成性音子序列解码模块,用于将训练语种语音数据通过期望最大化EM迭 代准则,训练生成与该语种数据相对应的混合高斯模型,并根据该混合高斯模型对 输入语音的特征进行识别,产生音子序列,并将该音子序列送入N元文法语言语法 模型模块。 【当前权利人】中国科学院声学研究所; 北京中科信利技术有限公司 【当前专利权人地址】北京市海淀区北四环西路21号中国科学院声学研究所; 北京市海淀区北四环西路21号DSP大楼1层 【专利权人类型】; 其他有限责任公司 【统一社会信用代码】12100000400883447M; 911101087400715928 【被引证次数】TRUE 【家族被引证次数】TRUE