【摘要】 本发明公开了一种基于先验知识的发音评估与诊断系统,包括:语音预处理单元、发音评估单元、评估确认和诊断单元、模型和先验知识库单元和评估信息和诊断信息输出单元。先验知识在本系统的两个方面得到应用:首先,利用易混淆音素对的发音错误先验知识对传统后验概率进行修正,采用修正后的后验概率进行发音评估。其次,利用易混淆音素对的区分性特征先验知识,采用基于区分性特征及分类器的方法,确认评估结果,获得更好的评估性能,从更基础、更细致的角度为学习者提供诊断信息,帮助学习者矫正和改善发音。本发明的基于先验知识的发音评估与诊断系统能够满足普通话学习和测试中的高稳定性、高准确性要求,是一种创新且有效的方法。 【专利类型】发明申请 【申请人】中国科学院自动化研究所 【申请人类型】科研单位 【申请人地址】100080 北京市海淀区中关村东路95号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810226675.2 【申请日】2008-11-19 【申请年份】2008 【公开公告号】CN101739869A 【公开公告日】2010-06-16 【公开公告年份】2010 【授权公告号】CN101739869B 【授权公告日】2012-03-28 【授权公告年份】2012.0 【IPC分类号】G09B19/06; G09B7/00; G09B7/02; G10L15/28; G10L15/02; G10L25/00 【发明人】徐波; 徐爽; 江杰; 陈振标; 浦剑涛 【主权项内容】一种基于先验知识的发音评估与诊断系统,其特征在于,该系统包括:语音预处理单元,用于对学习者输入的原始语音进行预处理,以实现对语音基本内容的确认,将内容基本符合标准脚本的语音分割为音素级的小单元,输入到发音评估单元进行判别;发音评估单元,用于对输入的语音进行初步发音质量评估,利用易混淆音素对的发音错误先验知识对传统后验概率进行修正,基于修正后的后验概率进行发音评估,计算出的后验概率通过映射模型可以转换为直观的衡量发音水平的分数或等级;发音评估确认和诊断单元,用于对发音评估单元输入的初步评估结果,利用易混淆音素对的区别性特征的先验知识,采用基于区别性特征及分类器的方法,进行发音评估结果的确认,并从声学语音学角度提供发音诊断信息;模型和先验知识库单元,用于保存音素对齐和计算后验概率的模型,以及先验知识库;以及评估信息和诊断信息输出单元,用于输出包括分级和打分结果的发音评估的分数、发音错误的定位信息、发音错误类型,并给出矫正的指导性建议。 【当前权利人】科大讯飞股份有限公司 【当前专利权人地址】安徽省合肥市高新开发区望江西路666号 【统一社会信用代码】12100000400010945B 【被引证次数】28 【被自引次数】2.0 【被他引次数】26.0 【家族引证次数】6.0 【家族被引证次数】28