行业新闻

基于领域本体结合机器学习模型的汉语文本共指消解方法专利

发布时间:2026-06-16

【摘要】本发明公开了一种基于领域本体结合机器学习模型的汉语文本共指消解方法，包括如下步骤：(1)构建完成领域本体；(2)输入待处理的汉语文本；(3)对步骤(2)中的汉语文本进行分词与词性标注处理；(4)将汉语文本中的命名实体分为常规命名实体和领域命名实体两类，利用步骤(1)中构建的领域本体通过形式化实例获取词性规则模板，结合CRF模型，针对领域命名实体进行识别处理；(5)针对领域命名实体之外的普通名词短语进行归并处理；(6)利用步骤(1)中构建的领域本体，获取语义类特征，结合机器学习模型，针对领域命名实体及普通名词短语进行共指消解处理。本汉语文本共指消解方法对人工成本要求较低，能够在短时间内获取高准确率的共指消解处理结果。【专利类型】发明申请【申请人】华建机器翻译有限公司【申请人类型】企业【申请人地址】100083 北京市海淀区北四环中路257号【申请人地区】中国【申请人城市】北京市【申请人区县】海淀区【申请号】CN200810246639.2 【申请日】2008-12-31 【申请年份】2008 【公开公告号】CN101770453A 【公开公告日】2010-07-07 【公开公告年份】2010 【IPC分类号】G06F17/27 【发明人】黄河燕【主权项内容】一种基于领域本体结合机器学习模型的汉语文本共指消解方法，其特征在于：(1)构建完成领域本体；(2)输入待处理的汉语文本；(3)对步骤(2)中的汉语文本进行分词与词性标注处理；(4)将汉语文本中的命名实体分为常规命名实体和领域命名实体两类，利用步骤(1)中构建的领域本体通过形式化实例获取词性规则模板，结合条件随机场模型，针对领域命名实体进行识别处理；(5)针对领域命名实体之外的普通名词短语进行归并处理；(6)利用步骤(1)中构建的领域本体，获取语义类特征，结合机器学习模型，针对领域命名实体及普通名词短语进行共指消解处理。【当前权利人】华建机器翻译有限公司【当前专利权人地址】北京市海淀区北四环中路257号【专利权人类型】有限责任公司(法人独资) 【统一社会信用代码】91110108710925470H 【被引证次数】55 【被他引次数】55.0 【家族被引证次数】55

造粒型研磨纸及其制备方法和应用
【摘要】本发明提供一种能够增强自锐性和具有持久研磨力的造粒型研磨纸及其制备方法和应用，包括通过胶粘剂涂布于基材表面、成球形团聚体的复合磨料颗粒，该复合磨料颗粒中的磨料粉体分散在一种或几种金属氧化物溶胶中，该金属氧化物溶胶与有机粘结剂或无机粘
单组分水性硅橡胶防水涂料及其制备方法
【摘要】本发明涉及一种单组分水性硅橡胶防水涂料及其制备方法，属于建筑材料技术领域。该涂料由有机硅一丙烯酸酯乳液、防水剂、成膜助剂、阻燃剂、硅灰石、碳酸钙、增稠剂、消泡剂制备而成。该涂料系单组分水性涂料，施工方便，延伸率大，拉伸强度高，防水性
一种数据差分更新的方法及系统
【摘要】本发明公开了一种数据差分更新的方法及系统，所述的方法包括：参考已有的经过格式化处理的地图数据的分块方法及其块编号，从母库数据中提取发生变化的地图数据，进行格式化处理；所述地图数据中包含有块编号、路线计算、道路名称、背景的地图数据项，
基于压电陶瓷技术的动态压力校准器
【摘要】本发明属于动态压力校准技术，涉及一种基于压电陶瓷技术的动态压力校准器。装置包括谐振管道、压电叠堆和电压激励电路组成；其中电压激励电路部分包括正弦电压信号发生器、功率放大器和LC谐振电路，LC谐振电路的输出端与压电叠堆相接，压电叠堆
个人数字助理
【摘要】一种个人数字助理，包括：一本体，该本体上设置有一显示屏；以及一触摸屏，该触摸屏设置于所述显示屏表面，该触摸屏包括至少一透明导电层；其中，所述触摸屏中的透明导电层为一碳纳米管层。。【专利类型】发明申请【申请人】清华大学; 鸿富锦精
移动终端位置切换方法、系统、移动管理实体及服务网关
【摘要】本发明公开了一种移动终端UE位置切换方法、系统、移动管理实体 MME及服务网关Serving GW，通过在UE的切换完成过程中，目标MME 根据接收到的位置切换的触发信息，向目标Serving GW发送终端的位置信息，及目标Ser

产品分类

最新文章

基于领域本体结合机器学习模型的汉语文本共指消解方法专利