24小时服务热线
效率高速
品质保障
厂家直供
售后保障
行业新闻
当前位置:行业新闻>

一种浅层自然口语理解系统及方法专利

发布时间:2026-06-14

【摘要】 本发明涉及一种浅层自然口语理解系统及方法,该系统包括:预处理模块、词 汇特征提取模块、上下文特征提取模块、实体模糊匹配模块、最大熵分类模块及 Viterbi模块。该系统及方法首先通过预处理解决部分口语现象,以简化后续处 理;接着对语句进行特征提取,包括基本字词特征,上下文字词特征和实体特征; 采用最大熵分类器进行识别;对整句进行优化得到最后分类标记序列;最后从分类 标记序列中提取出命名实体。本发明的系统及方法能够有效地、鲁棒地解决口语中 特有的重复、停顿、填充词等不连贯口语现象以及口语识别中可能出现的识别错误 等问题。 微信 【专利类型】发明申请 【申请人】中国科学院声学研究所; 北京中科信利技术有限公司 【申请人类型】企业,科研单位 【申请人地址】100190北京市海淀区北四环西路21号中国科学院声学研究所 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810239727.X 【申请日】2008-12-16 【申请年份】2008 【公开公告号】CN101645064A 【公开公告日】2010-02-10 【公开公告年份】2010 【授权公告号】CN101645064B 【授权公告日】2011-04-06 【授权公告年份】2011.0 【发明人】徐为群; 包长春; 李亚丽; 潘接林; 颜永红 【主权项内容】1、一种浅层自然口语理解系统,该系统包括: 一预处理模块,用于将输入的口语中无意义的填充词去除,并将预处理后的语 音序列输出; 一最大熵分类模块,对输入序列的每一点,通过选取该点的词汇特征、上下文 特征等特征,通过最大熵算法取得该点的所有可能的分类的后向概率分布; 一维特比模块,用于在最大熵输出的分类标记序列网上最优路径,得 到最优的分类标记序列,从而得出命名实体; 其特征在于,最大熵模型选择的特征模块包括: 一词汇特征提取模块,用于通过各个实体类和非实体类经常出现的词汇,判 断预处理后的语音序列中的词的实体类别,并将该实体类别送入最大熵分类模 块; 一上下文特征提取模块,用于通过实体前、后的特定的词汇,判断预处理后 的语音序列中的词的实体类别,并将该实体类别送入最大熵分类模块;和 一实体模糊匹配模块,用于利用实体知识库,通过模糊匹配算法,在输入的 预处理后的语音序列中探测并识别出知识库中已有的实体类别,并将该实体类别 送入最大熵分类模块。 【当前权利人】中国科学院声学研究所; 北京中科信利技术有限公司 【当前专利权人地址】北京市海淀区北四环西路21号中国科学院声学研究所; 北京市海淀区北四环西路21号DSP大楼1层 【专利权人类型】; 其他有限责任公司 【统一社会信用代码】12100000400883447M; 911101087400715928 【被引证次数】TRUE 【家族被引证次数】TRUE

  • 【摘要】本发明提供在线通讯录管理伸延服务的办法和系统。当收到一个用户在一个服务器上建立一个在线通讯录,所述用户就可以通过所述服务器所建立一个电子邀请,通过自己的在线通讯录选出一些联系人,所述服务器用所述用户的名以发出所述电子邀请给所述一些联
  • 【摘要】一种直接在SiO2介电层上制备并五苯薄膜晶体管的方法,包括:在衬底层上制备栅电极;在栅电极上制备SiO2介电层;在SiO2介电层上制备并五苯薄膜;和在并五苯薄膜上分别制备源电极和漏电极;在SiO2介电层上制备并五苯薄膜的步骤为:先用
  • 【摘要】本发明涉及到一种Fe-Ga基磁致伸缩丝及其制备方法,所使用的合金成分(原子分数)为Fe1-x-y-zGaxAlyMz,M选自Co、B、Cr,V、Nb、Zr、Be、Y、Ti等中的一种或多种,其中x=0.10~0.30,y=0.01~0
  • 【摘要】本发明公开了一种多业务调度方法,包括:A.计算当前调度时隙之前一 定时间段的业务传输速率,统计业务的L2分组丢包率以及头分组等待时长, 之后,计算业务间的调度优先级;B.从调度队列中获取优先级最高的业务, 确定该业务为GBR业务时,
  • 【摘要】一导光板设计方法包括:提供一导光板,该导光板包括一入光面及与入 光面相对的出光面;获得该导光板出光面的光照度分布;通过ΔE=Emax-Emina 及|E(rn)-E0|=nΔE确定导光板入光面及出光面的环形区域,其中,E为导光板 出
  • 【摘要】提供一种日语输入方法和终端,所述方法包括步骤:在日语输入模式下, 围绕触摸始点在屏幕的有效区域显示被划分成多个组的日语字符区域;当所 述触摸始点向待输入日语字符所在的某一组移动时,所述组的日语字符区域 向触摸点移动的相反方向移动;并