【摘要】 本发明涉及自动字幕生成系统中的语音检测技术,具体涉及一种语音端 点检测中的短时能频值波形斜率门限的确定方法。该方法通过分析当前的短 时能频值序列,找出其最小值EZE-featuremin和最大值EZE-featuremax,然后计 算EZE-featuremax/100;比较EZE-featuremin和EZE-featuremax/100,取其中较大 者,记为EZE-featureslope;确定短时能频值波形斜率门限值为Rm= EZE-featureslope×2。通过本发明所述方法找到的短时能频值斜率门限对于整 个短时能频值序列都有效,因此在语音端点检测过程中不需要再次进行修改, 而且在绝大部分情况下基本可以满足寻找语句端点的需要,因此,可以提高 语音端点的检测效率。 【专利类型】发明申请 【申请人】新奥特(北京)视频技术有限公司 【申请人类型】企业 【申请人地址】100080北京市海淀区西草场1号北京硅谷电脑城15层1501-1506室 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810116462.4 【申请日】2008-07-10 【申请年份】2008 【公开公告号】CN101625859A 【公开公告日】2010-01-13 【公开公告年份】2010 【授权公告号】CN101625859B 【授权公告日】2012-06-06 【授权公告年份】2012.0 【发明人】李祺; 马华东; 郑侃彦; 韩忠涛; 张婷 【主权项内容】1.一种语音端点检测中的短时能频值波形斜率门限的确定方法,包括 如下步骤: (1)分析当前的短时能频值序列,找出其最小值,记为EZE-featuremin;找 出其最大值,记为EZE-featuremax,然后计算EZE-featuremax/100; (2)比较EZE-featuremin和EZE-featuremax/100,取其中较大者,记为 EZE-featureslope; (3)确定短时能频值波形斜率门限值Rm=EZE-featureslope×2。 微信 【当前权利人】新奥特(北京)视频技术有限公司 【当前专利权人地址】北京市海淀区西草场1号北京硅谷电脑城15层1501-1506室 【专利权人类型】有限责任公司(外国法人独资) 【统一社会信用代码】911101086631036849