【摘要】 本发明涉及一种用于自动检测语言学习者朗读错误的方法,包括:根据朗读语 料训练多发音模型;根据参考答案、发音字典、多发音模型构建精简空间;根 据参考答案及语言学知识构建朗读语言模型;对输入语音预处理分帧,提取语音特 征;采用Viterbi算法在精简空间中一条声学模型得分、语言模型得分及发 音得分的累积分数最高的一条发音路径作为识别发音序列;将识别的发音序列与参 考答案的发音序列通过动态规划匹配算法对齐,进而得到朗读的多读、漏读、错读 结果。本发明中采用隐马尔可夫模型作为声学模型,不需要模板语音,可大大提高 使用的便利性,其性能和运行速度也较好。 【专利类型】发明申请 【申请人】中国科学院声学研究所; 北京中科信利技术有限公司 【申请人类型】企业,科研单位 【申请人地址】100190北京市海淀区北四环西路21号中国科学院声学研究所 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810224792.5 【申请日】2008-12-26 【申请年份】2008 【公开公告号】CN101650886A 【公开公告日】2010-02-17 【公开公告年份】2010 【授权公告号】CN101650886B 【授权公告日】2011-05-18 【授权公告年份】2011.0 【发明人】颜永红; 董滨; 刘常亮 【主权项内容】: 。1、一种自动检测语言学习者朗读错误的方法,其特征在于,包含如下步骤: 1)前端处理:对输入语音进行预处理,进行特征提取,所提取特征为MFCC特 征矢量; 2)构建精简空间:将用户所要朗读的内容作为参考答案,并根据参考答案、 发音字典、多发音模型和声学模型构建精简的空间; 3)构建朗读语言模型:根据参考答案构建用户的朗读语言模型,该语言模型描 述用户在朗读该参考语句的时候可能朗读的上下文内容及其概率信息; 4):在空间中,根据声学模型、朗读语言模型和多发音模型得到 与输入的特征矢量流最匹配的一条路径,作为用户的实际朗读结果内容,做成识别 结果序列; 5)对齐:将所述参考答案与识别结果进行对齐,得到用户多读、漏读、错读的 检测结果。 【当前权利人】中国科学院声学研究所; 北京中科信利技术有限公司 【当前专利权人地址】北京市海淀区北四环西路21号中国科学院声学研究所; 【专利权人类型】; 其他有限责任公司 【统一社会信用代码】12100000400883447M; 911101087400715928 【被引证次数】TRUE 【家族被引证次数】TRUE