【摘要】 本发明提供一种音频匹配方法,用于从待测音频流片段中检测出与标准音频库中音频样例相匹配的音频片段,包括:在待测音频流片段的能量包络单元图上,选择每个能量包络单元的起始点作为匹配操作的点;将每个音频样例以及待测音频流片段用切分点和概率对组成的数对形式表示;将待测音频流片段的数对依次与每个音频样例的数对进行比较,得到匹配点以及对应的匹配概率;采用相似性度量函数对匹配点以及对应的音频样例进行计算,得到两者的相似值;将相似值与一个预先设定的阈值进行比较,若所述的相似值大于该阈值,则认为与匹配点相对应的音频片段和与匹配点相对应的音频样例匹配。本发明具有计算简便、运算速度快的优点。 【专利类型】发明授权 【申请人】中国科学院计算技术研究所 【申请人类型】科研单位 【申请人地址】100080 北京市海淀区中关村科学院南路6号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810057161.9 【申请日】2008-01-30 【申请年份】2008 【公开公告号】CN101221760B 【公开公告日】2010-12-22 【公开公告年份】2010 【授权公告号】CN101221760B 【授权公告日】2010-12-22 【授权公告年份】2010.0 【IPC分类号】G10L15/08; G10L15/10; G06F17/30 【发明人】赵丹; 王向东; 钱跃良; 刘群; 林守勋 【主权项内容】一种音频匹配方法,用于从待测音频流片段中检测出与标准音频库中音频样例相匹配的音频片段,包括:步骤1)、在待测音频流片段的能量包络单元图上,依次选择每个能量包络单元的起始点作为匹配操作的起始点;步骤2)、将每个音频样例用音频样例所对应的能量包络单元图上的切分点和概率对组成的数对形式表示,将每个待测音频流片段用待检测音频流片段所对应的能量包络单元图上的切分点和概率对组成的数对形式表示;步骤3)、将待测音频流片段的数对依次与每个音频样例的数对进行比较,得到匹配点以及对应的匹配概率;步骤4)、采用相似性度量函数对步骤3)所得到的匹配点以及对应的音频样例进行计算,得到两者的相似值;步骤5)、将步骤4)所得到的相似值与一个预先设定的阈值进行比较,若所述的相似值大于该阈值,则认为与步骤3)所得到的匹配点相对应的音频片段和与匹配点相对应的音频样例匹配。 【当前权利人】中国科学院计算技术研究所 【当前专利权人地址】北京市海淀区中关村科学院南路6号 【统一社会信用代码】12100000400012342E 【引证次数】3.0 【他引次数】3.0 【家族引证次数】10.0 【家族被引证次数】23