【摘要】 本发明涉及一种音频分类方法,其在音频编码前对音频信号进行分类,该音频分类方法包括初次分类和再次分类,其特征在于,再次分类包括对初次分类结果进行平滑。另外,本发明还公开了一种音频分类装置,其被设置在音频编码器前端用于对音频信号分类,该音频分类装置包括初次分类器和再次分类器,其特征在于,再次分类器包括对初次分类结果进行平滑处理的平滑模块。使用根据本发明的方法及装置,能从音频信号中正确区分出音乐和语音。由于再次分类包括对初次分类结果进行平滑,因此剔除了音频类型切换过快时导致的偶尔的误判,同时也减少了运算复杂度,从而实现了正确并且简单区分音乐和语音。 【专利类型】发明申请 【申请人】数维科技(北京)有限公司 【申请人类型】企业 【申请人地址】100031 北京市西城区西长安街88号首都时代广场办公楼503/504号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】西城区 【申请号】CN200810240339.3 【申请日】2008-12-19 【申请年份】2008 【公开公告号】CN101751920A 【公开公告日】2010-06-23 【公开公告年份】2010 【IPC分类号】G10L11/00; G10L15/08 【发明人】张培; 闫建新 【主权项内容】一种音频分类方法,其在音频编码前对音频信号进行分类,所述音频分类方法包括初次分类和再次分类,其特征在于,所述再次分类包括对初次分类结果进行平滑。。-官网 【当前权利人】数维科技(北京)有限公司 【当前专利权人地址】北京市西城区西长安街88号首都时代广场办公楼503/504号 【专利权人类型】有限责任公司 【统一社会信用代码】91110108768464419X 【被引证次数】22 【被自引次数】1.0 【被他引次数】21.0 【家族被引证次数】22