【摘要】 本发明提供了一种用SVM方法对音频数据进行分析的分析装 置,其特征在于,包括:输入单元,用于输入音频流;预处理单元, 用于对所述音频流进行预处理,得到所述音频流的每一帧的特征参 数;分类单元,按照所述特征参数分析所述每一帧所属的类别;以 及后处理单元,对所述分类单元的分类结果进行后处理,得到最终 的分段结果,其中,所述特征参数包括:短时平均能量、子带能量、 过零率、Mel频域倒谱系数、ΔMel频域倒谱系数、谱通量和基音频 率。根据本发明,实现了精彩内容的快速检索,能够节省观众的时 间,满足观众的观看需求。 【专利类型】发明申请 【申请人】索尼(中国)有限公司 【申请人类型】企业 【申请人地址】100027北京市朝阳区东三环北路霞光里18号佳程大厦A座25层 【申请人地区】中国 【申请人城市】北京市 【申请人区县】朝阳区 【申请号】CN200810161401.X 【申请日】2008-09-25 【申请年份】2008 【公开公告号】CN101685446A 【公开公告日】2010-03-31 【公开公告年份】2010 【IPC分类号】G06F17/30; G10L11/00; G10L25/03; G10L25/57 【发明人】刘昆; 吴伟国 【主权项内容】1.一种用SVM方法对音频数据进行分析的分析装置,其特征在 于,包括: 输入单元,用于输入音频流; 预处理单元,用于对所述音频流进行预处理,得到所述 音频流的每一帧的特征参数; 分类单元,按照所述特征参数分析所述每一帧所属的类 别;以及 后处理单元,对所述分类单元的分类结果进行后处理, 得到最终的分段结果, 其中,所述特征参数包括: 短时平均能量; 子带能量; 过零率; Mel频域倒谱系数; ΔMel频域倒谱系数; 谱通量;和 基音频率。 【当前权利人】索尼(中国)有限公司 【当前专利权人地址】北京市朝阳区东三环北路霞光里18号佳程大厦A座25层 【专利权人类型】有限责任公司(外国法人独资) 【统一社会信用代码】911100006259119201 【引证次数】1.0 【被引证次数】43 【他引次数】1.0 【被他引次数】43.0 【家族引证次数】1.0 【家族被引证次数】43