【摘要】 本发明涉及一种针对计算机语言学习系统发音评测的自适应方法,包括以下步骤:搭建语音识别系统;在语音识别系统基础上进行语音数据的声韵母切分和限制声韵母边界的声韵母和声调的识别;根据切分和限制边界识别的结果计算各声韵母和声调后验概率,并根据预先设定门限分别挑选出的自适应数据;根据挑选出自适应数据对识别系统中的声学模型进行自适应;用自适应后的声学模型进行第二遍切分和识别;用最终切分识别结果提取评测参数。本发明通过后验概率挑选合适的自适应语料,既能减弱由于实际发音人同标准模型音色、使用环境以及信道的差异造成的识别器误差,又能避免自适应时将标准模型拉偏,不能正确对发音人的发音进行评价。 【专利类型】发明授权 【申请人】安徽科大讯飞信息科技股份有限公司 【申请人类型】企业 【申请人地址】230088 安徽省合肥市高新区黄山路616号信息产业基地 【申请人地区】中国 【申请人城市】合肥市 【申请人区县】蜀山区 【申请号】CN200810107118.9 【申请日】2008-07-17 【申请年份】2008 【公开公告号】CN101315733B 【公开公告日】2010-06-02 【公开公告年份】2010 【授权公告号】CN101315733B 【授权公告日】2010-06-02 【授权公告年份】2010.0 【IPC分类号】G09B19/04; G09B19/06; G10L15/00; G10L25/69 【发明人】王海坤; 魏思; 胡国平; 胡郁; 刘庆峰; 王仁华 【主权项内容】1.一种针对计算机语言学习系统发音评测的自适应方法,包括搭建语音识别系统,其特征在于还包括以下步骤: (1)在语音识别系统基础上进行语音数据的声韵母切分和限制声韵母边界的声韵母和声调的识别; 所述的步骤(1)包括以下步骤: (A)根据专家的先验知识,统计得到发音人容易混淆的音素作为限定边界识别的候选项,进行声韵母替换列表的设计; (B)利用被评测语料的文本对发音进行切分和计算目标文本的概率,记为PT,然后,在切分得到的边界上,计算此音段对替换列表内所有模型的概率,这是一个矢量,记为(P1,P2,……,PN),得到声韵母第一遍切分和限制边界识别结果; (C)利用被评测语料的文本,在声韵母切分的边界上,计算该段对所有声调模型的概率,将这个矢量记为(PT1,PT2,……,PTK),将其中评测文本对应的调型概率记为PTT,得到声调第一遍限制边界识别的结果; (2)根据切分和限制边界识别的结果计算各声韵母和声调后验概率,并根据预先设定门限分别挑选出的自适应数据; 所述的步骤(2)包括以下步骤: 首先,根据切分和限制边界识别的结果以声韵母为单位计算各声韵母的后验概率,记为PP(p);同样,以调型为单位计算各个声调的后验概率,记为PPT(p),计算方法如下: 其中nFrame为当前声韵母所占的时间长度,nFrameTone为单个调型所占时间长度,然后仅选择后验概率大于预先设定门限的数据作为自适应数据; (3)根据挑选出自适应数据对识别系统中的声学模型进行自适应; 步骤(3)是根据挑选得到的数据分别对声韵母识别模型和声调识别模型做MLLR全局自适应,得到自适应后的声韵母识别模型和声调识别模型; (4)用自适应后的声学模型进行第二遍切分和识别;得到自适应后的声韵母识别模型和声调识别模型后,使用自适应后的模型对发音人的语料进行第二遍切分和限制边界的识别; (5)用最终切分识别结果提取评测参数。 该数据由<>整理 【当前权利人】讯飞南亚东南亚信息科技(云南)有限公司 【引证次数】3.0 【被引证次数】8 【自引次数】1.0 【他引次数】2.0 【被他引次数】8.0 【家族引证次数】3.0 【家族被引证次数】25