【摘要】 : 本发明为基于广义流利的口语流利度自动化评估方法,包括:利用语音输入设备,分不同年龄和口语水平收集语音数据;采用基于广义流利度的特征和机器学习训练流利度评测模型;根据语音数据不同话题的脚本和发音者的性别,配置相应参数的语音识别系统;利用对语音数据中语速连贯、内容理解、高级技巧和重构标特征进行量化,从专家评估角度综合提取语音数据中流利度的特征;采用回归拟合分析和数据挖掘中的决策树方法对异常流利度错误的检测和流利度评分、诊断。得到的机器流利度分数可以达到与评分专家接近的水平,在相关度指标上超过一般5个专家中的2-3个;速度快,可以嵌入到口语自动化评分系统中,作为重要模块评测发音质量中流利度指标。 【专利类型】发明申请 【申请人】中国科学院自动化研究所 【申请人类型】科研单位 【申请人地址】100080 北京市海淀区中关村东路95号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810226672.9 【申请日】2008-11-19 【申请年份】2008 【公开公告号】CN101740024A 【公开公告日】2010-06-16 【公开公告年份】2010 【授权公告号】CN101740024B 【授权公告日】2012-02-08 【授权公告年份】2012.0 【IPC分类号】G10L11/00; G10L15/00; G10L15/06; G10L19/032; G10L25/60; G10L25/69 【发明人】徐波; 黄申; 梁家恩; 高鹏; 王士进; 李鹏 【主权项内容】一种基于广义流利的口语流利度自动化评估方法,其特征在于,以下步骤:步骤S1:利用语音输入设备,分不同年龄和口语水平收集语音数据;步骤S2:采用基于广义流利度的特征和机器学习的方法训练异常流利度错误决策树分类模型、流利度评分回归分析模型和流利度诊断规则模型;步骤S3:根据语音数据不同话题的脚本和发音者的性别,配置相应参数的语音识别系统;步骤S4:利用对语音数据中语速连贯、内容理解、高级技巧和重构标特征进行量化,计算机自动从专家评估角度综合提取语音数据中流利度的特征;步骤S5:采用回归拟合分析和数据挖掘中的决策树方法对异常流利度错误的检测和流利度评分、诊断。 【当前权利人】科大讯飞股份有限公司 【当前专利权人地址】安徽省合肥市高新开发区望江西路666号 【统一社会信用代码】12100000400010945B 【被引证次数】90 【被自引次数】4.0 【被他引次数】86.0 【家族被引证次数】90