24小时服务热线
效率高速
品质保障
厂家直供
售后保障
行业新闻
当前位置:行业新闻>

一种采用层次管道过滤器体系结构的多语言信息抽取方法专利

发布时间:2026-06-12

【摘要】 本发明公开了一种采用层次管道过滤器体系结构的多语言信息抽取方法。该方法中,对于待处理的语言材料,首先由多语种自动识别构件进行判别,然后由简单命名实体识别构件识别时间、日期、百分比、金额这四种简单命名实体,由人名地名识别构件提取人名和地名;然后由语种独立的分词构件进行分词,由词性标注构件进行词性标注;再由组织机构名识别构件进行组织机构名的识别,由最长名词短语识别构件进行最长名词短语的识别。本发明提供了信息抽取系统的实用基础框架,成功解决了多个相互交叉重叠的算法的重用和泛化问题,改进了软件的可重用、可维护和可扩展性能,提高了信息抽取应用系统研发效率。 【专利类型】发明申请 【申请人】华建机器翻译有限公司 【申请人类型】企业 【申请人地址】100083 北京市海淀区北四环中路257号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810239836.1 【申请日】2008-12-19 【申请年份】2008 【公开公告号】CN101751385A 【公开公告日】2010-06-23 【公开公告年份】2010 【授权公告号】CN101751385B 【授权公告日】2013-02-06 【授权公告年份】2013.0 【IPC分类号】G06F17/27 【发明人】黄河燕 【主权项内容】一种采用层次管道过滤器体系结构的多语言信息抽取方法,包括作为任务层构件的多语种自动识别构件、简单命名实体识别构件、语种独立的分词构件、词性标注构件、人名地名识别构件、组织机构名识别构件和最长名词短语识别构件实现,各构件之间通过连接件传递数据流,其特征在于:(1)对于待处理的语言材料,首先由所述多语种自动识别构件进行判别,然后由所述简单命名实体识别构件识别时间、日期、百分比、金额这四种简单命名实体,由所述人名地名识别构件提取人名和地名;(2)在步骤(1)的基础上,由语种独立的分词构件进行分词,由所述词性标注构件进行词性标注;(3)由所述组织机构名识别构件进行组织机构名的识别,由所述最长名词短语识别构件进行最长名词短语的识别。 【当前权利人】华建机器翻译有限公司 【当前专利权人地址】北京市海淀区北四环中路257号 【专利权人类型】有限责任公司(法人独资) 【统一社会信用代码】91110108710925470H 【被引证次数】15 【被他引次数】15.0 【家族引证次数】3.0 【家族被引证次数】15

  • 【摘要】一种字元输入方法,包括:生成字元显示区,根据第一方向或第二方向 的方向指示动作在字元浏览区的第一方向子区或第二方向子区中显示字元, 当侦测到前后二方向指示动作的指示方向发生变化时,将字元浏览区中显示 的当前字元显示在输入字元显示区,
  • 【摘要】本发明公开了一种西番莲树式营养液栽培方法,主要是将西番莲苗定植于温室中的DFT栽培系统中,利用营养生长期和生殖生长期不同的营养液,并结合控制营养液的温度、pH、EC,以及温室的温度、湿度、光照等条件等。使用本发明方法可以充分发挥营养
  • 【摘要】一种织物烘干装置和方法,属于织物烘干领域。所述装置包括:辊道、烘干托盘、箱体部件、在线检测系统和PLC控制系统;所述箱体部件包括:烘干功率逐个递减的多个加热箱体,所述加热箱体之间相通且所述加热箱体的内壁安装磁控管。所述方法包括:将织
  • 【摘要】本发明实施例公开了在高速共享数据信道上重传数据的方法、系统及装置,解决了现有技术在进行HSDPA操作,每次重传数据时,都需要通过HS-SCCH发送控制信令,使得控制信令在数据传输中所占资源的比例过大,导致无线资源的利用效率低的问题。
  • 【摘要】本发明公开了一种接口装置,包括:接口模块以及为接口模块进行供电的电源;此外还包括:低压差线性稳压器LDO;所述LDO的输入管脚与所述电源相连,输出管脚与所述接口模块相连;所述LDO用于将由所述电源输入的电压延迟后输出给所述接口模块。
  • 【摘要】本发明涉及一种耐电痕化和耐蚀损性的室温硫化硅橡胶组合物,其配方包括:30~70重量份聚有机硅氧烷、5~40重量份补强填料、10~70重量份耐电蚀稳定剂、5~15重量份助剂和10~80重量份稀释剂。本发明提供的耐电痕化和耐蚀损性的室温