24小时服务热线
效率高速
品质保障
厂家直供
售后保障
行业新闻
当前位置:行业新闻>

一种音频匹配方法及系统专利

发布时间:2026-06-13

【摘要】 本发明提供一种音频匹配方法,用于从待测音频流片段中检测出与标准音频库中音频样例相匹配的音频片段,包括:在待测音频流片段的能量包络单元图上,选择每个能量包络单元的起始点作为匹配操作的点;将每个音频样例以及待测音频流片段用切分点和概率对组成的数对形式表示;将待测音频流片段的数对依次与每个音频样例的数对进行比较,得到匹配点以及对应的匹配概率;采用相似性度量函数对匹配点以及对应的音频样例进行计算,得到两者的相似值;将相似值与一个预先设定的阈值进行比较,若所述的相似值大于该阈值,则认为与匹配点相对应的音频片段和与匹配点相对应的音频样例匹配。本发明具有计算简便、运算速度快的优点。 【专利类型】发明授权 【申请人】中国科学院计算技术研究所 【申请人类型】科研单位 【申请人地址】100080 北京市海淀区中关村科学院南路6号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810057161.9 【申请日】2008-01-30 【申请年份】2008 【公开公告号】CN101221760B 【公开公告日】2010-12-22 【公开公告年份】2010 【授权公告号】CN101221760B 【授权公告日】2010-12-22 【授权公告年份】2010.0 【IPC分类号】G10L15/08; G10L15/10; G06F17/30 【发明人】赵丹; 王向东; 钱跃良; 刘群; 林守勋 【主权项内容】一种音频匹配方法,用于从待测音频流片段中检测出与标准音频库中音频样例相匹配的音频片段,包括:步骤1)、在待测音频流片段的能量包络单元图上,依次选择每个能量包络单元的起始点作为匹配操作的起始点;步骤2)、将每个音频样例用音频样例所对应的能量包络单元图上的切分点和概率对组成的数对形式表示,将每个待测音频流片段用待检测音频流片段所对应的能量包络单元图上的切分点和概率对组成的数对形式表示;步骤3)、将待测音频流片段的数对依次与每个音频样例的数对进行比较,得到匹配点以及对应的匹配概率;步骤4)、采用相似性度量函数对步骤3)所得到的匹配点以及对应的音频样例进行计算,得到两者的相似值;步骤5)、将步骤4)所得到的相似值与一个预先设定的阈值进行比较,若所述的相似值大于该阈值,则认为与步骤3)所得到的匹配点相对应的音频片段和与匹配点相对应的音频样例匹配。 【当前权利人】中国科学院计算技术研究所 【当前专利权人地址】北京市海淀区中关村科学院南路6号 【统一社会信用代码】12100000400012342E 【引证次数】3.0 【他引次数】3.0 【家族引证次数】10.0 【家族被引证次数】23

  • 【摘要】一种箱型空间弯扭构件加工制作方法,步骤1,分别将上翼缘板、下翼缘板、两侧腹板置于数控模具的上排凸弧形冲头和下排凹弧形冲头之间,采用多冲头无模冲压成形的方法压制成空间弯扭板件;步骤2,先在钢平台上划线,标出胎架定位点,在钢平台上架设高
  • 【摘要】本发明涉及一种不主动消耗能源的发电机,可将一般的机械振动、振荡作为动力进行发电,将振动、振荡的机械能转化为可以利用或存储的电能;在更多的场合可以无需消耗能源进行发电;在实用新型“能量收集式减振器”基础上加以改进,大大提高了能量转换的
  • 【摘要】本发明提供了一种提升交流型等离子显示器图像灰度级质量的方法,包括以下步骤:计算该灰度级图像的APL值,还包括以下步骤:步骤S102,根据图像的输入灰度级计算图像的维持脉冲数;以及步骤S104,根据计算结果将相应数量的维持脉冲分配到图
  • 【摘要】本发明公开了一种像素单元的FD有源区结构,属于CMOS图像传感器领域。该FD有源区结构包括:P型硅半导体衬底上形成P型阱,P型阱上设有N型硅半导体注入层,所述N型硅半导体注入层中包含有N-Plus离子注入层,所述N型硅半导体注入层周
  • 【摘要】本发明公开了无线通信系统中中继场景下终端切换的方法和系统,该方 法包括:控制站点确定将终端从源站点切换到目标站点;控制站点将切换命 令通过广播信道广播出去,所述切换命令包括终端标识和目标站点标识;终 端标识对应的终端通过广播信道接收
  • 【摘要】一种能建立超低磁空间和复现三维磁场空间的集成装置,涉及磁空间技术领域。应用于物理学、地学、航空航天、生物医学工程、国防科技等领域。本发明是一种屏蔽室与三维线圈套装的磁空间装置,其屏蔽室用高磁导材料构筑,骨架采用非金属无磁性材料制作,