行业新闻

语音端点检测中短时能频值的提取方法专利

发布时间:2026-06-15

【摘要】本发明涉及自动字幕生成系统中的语音检测技术，具体涉及一种语音端点检测中短时能频值的提取方法。该方法将音频采样序列分成固定长度的帧，并形成一个帧序列；针对每一帧数据提取短时能量、短时过零率和短时信息熵三个音频特征参数；根据上述音频特征参数计算每一帧数据的短时能频值，并形成一个短时能频值序列。本发明将时域和频域的音频特征参数结合在一起，能够发挥它们各自的长处，同时又可以在一定程度上规避各自的缺点，从而能够有效的应对各种不同类型的背景噪声。【专利类型】发明申请【申请人】新奥特(北京)视频技术有限公司【申请人类型】企业【申请人地址】100080北京市海淀区西草场1号北京硅谷电脑城15层1501-1506室【申请人地区】中国【申请人城市】北京市【申请人区县】海淀区【申请号】CN200810116461.X 【申请日】2008-07-10 【申请年份】2008 【公开公告号】CN101625858A 【公开公告日】2010-01-13 【公开公告年份】2010 【授权公告号】CN101625858B 【授权公告日】2012-07-18 【授权公告年份】2012.0 【发明人】李祺; 马华东; 郑侃彦; 韩忠涛; 张婷【主权项内容】1.一种语音端点检测中短时能频值的提取方法，包括如下步骤： (1)将音频采样序列分成固定长度的帧，并形成一个帧序列； (2)针对每一帧数据提取短时能量、短时过零率和短时信息熵三个音频特征参数； (3)根据上述音频特征参数按如下公式计算每一帧数据的短时能频值，并形成一个短时能频值序列， EZE-featurei＝(Ei-Eb)·(Zi-Zb)·(Hi-Hb) 其中，EZE-featurei表示第i帧的短时能频值；Ei、Zi和Hi分别表示第i 帧的短时能量、短时过零率和短时信息熵；Eb、Zb和Hb分别表示当前背景噪声的短时能量、短时过零率和短时信息熵。【当前权利人】新奥特(北京)视频技术有限公司【当前专利权人地址】北京市海淀区西草场1号北京硅谷电脑城15层1501-1506室【专利权人类型】有限责任公司(外国法人独资) 【统一社会信用代码】911101086631036849 【被引证次数】14 【家族被引证次数】14

一种多文档摘要的生成方法及装置
【摘要】本发明公开了一种多文档摘要的生成方法及装置，用以解决现有技术中生成的多文档摘要的可读性差的问题。该方法从多篇文档中选择若干个摘要句；按照设置的至少一种排序规则将所述若干个摘要句进行排序生成多文档摘要，其中，每种排序规则根据摘要句包含
一种实现防火墙接入的方法
【摘要】本发明提供一种实现防火墙接入的方法，包括下列步骤：步骤A：预先利用网口配置命令将防火墙设置成虚拟线，将防火墙内部数据结构修改成包含标识消息是否从虚拟线转发来的标志位的数据结构，并选择两个网口作为所述虚拟线的两个端口；步骤B：防火墙收
一种预编码矩阵的选择方法
【摘要】本发明公开了一种预编码矩阵选择方法，根据码本矩阵的特征，将原有的码本进行分组，分组准则是每组内的矩阵均是由其中一个第一码本矩阵进行行变换得到的，这种行变换包括不同行之间进行的模值不变的交换。在码本矩阵分组的基础上，利用每组的第一码本
时分双工系统上下行时隙比例信息通知方法及装置
【摘要】本发明公开了一种时分双工系统上下行时隙比例信息通知方法及装置，该方法及装置将主广播信息中的物理混合自动请求重传指示信道PHICH资源大小信息与时分双工系统上下行时隙比例信息进行关联，通过主广播信息将与PHICH资源大小信息有关联关系
一种估计噪声功率的方法和装置
【摘要】本发明公开了一种估计噪声功率的方法和装置，其中，方法包括：确定当前用户的时频单元的每个导频点的信道估计值；根据事先确定的时频域均衡颗粒度，将当前用户的所有时频单元划分为Ntf个时频均衡相关块；所述时频均衡相关块内各导频点间的信
邻小区列表配置方法及设备
【摘要】本发明公开了一种邻小区列表配置方法及设备，所述方法包括：接收并保存网络侧下发的服务小区的邻小区列表；当用户设备UE工作频率发生变化时，确定是否需要自主生成邻小区列表；如果需要，则根据保存的邻小区列表、以及变化后的工作频率，生成新的邻

产品分类

最新文章

语音端点检测中短时能频值的提取方法专利