24小时服务热线
效率高速
品质保障
厂家直供
售后保障
行业新闻
当前位置:行业新闻>

一种借助网络知识辅助的汉英机构名翻译方法及装置专利

发布时间:2026-06-12

【摘要】 本发明为一种汉英机构名翻译方法和装置,将待翻译的中文机构名 使用基于字的条件随机场模型切分为四种语块,并对四种语块进行分词 处理。选择具有一定信息量和翻译置信度的词进行统计翻译,得到机构 名中若干词的翻译结果,并同待翻译的中文机构名构成一个双语查询。 借助引擎对该查询进行检索,得到若干中英双语混合网页的片段。 抽取出网页片段中的英文,并借助中英文非对称对齐技术,筛选英文句 子中与该中文机构名对齐概率最高的片段。通过统计每个片段出现的频 率等信息,确定一个最优片段作为中文机构名的翻译。该方法克服统计 翻译模型在机构名翻译过程中容易出现的结构、顺序和选词错误,机构 名翻译精确率提高了35.26%。 【专利类型】发明申请 【申请人】中国科学院自动化研究所 【申请人类型】科研单位 【申请人地址】100080北京市海淀区中关村东路95号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810222335.2 【申请日】2008-09-17 【申请年份】2008 【公开公告号】CN101676898A 【公开公告日】2010-03-24 【公开公告年份】2010 【授权公告号】CN101676898B 【授权公告日】2011-12-07 【授权公告年份】2011.0 【IPC分类号】G06F17/28; G06F17/30 【发明人】赵军; 杨帆 【主权项内容】1、一种借助网络知识辅助的汉英机构名翻译方法,包括步骤如下: 步骤S1:使用基于字的条件随机场序列标注模型将待翻译的中文机 构名切分为四种语块的序列,并对每个语块分别进行分词处理,得到一 个中文机构名的分词序列; 步骤S2:从中文机构名的分词序列中选择若干词,使用统计翻译模 块将所选择中文机构名的待翻译中文词语翻译为对应的英文单词并生成 查询; 步骤S3:将待翻译的中文机构名和翻译得到的部分单词组合为一个 查询,利用引擎得到包含该查询的若干网页片段,提取网页片段中 的英文部分; 步骤S4:将待翻译的中文机构名与提取的英文句子进行非对称对齐, 计算英文句子中每个片段与中文机构名的对齐概率,并结合所述片段出 现的频率信息以及与中文机构名的距离,筛选出最优翻译候选。。 【当前权利人】中国科学院自动化研究所 【当前专利权人地址】北京市海淀区中关村东路95号 【统一社会信用代码】12100000400010945B 【被引证次数】27 【被他引次数】27.0 【家族引证次数】5.0 【家族被引证次数】27

  • 【摘要】本发明涉及一种有源矩阵有机发光二极管像素结构及其制造方法。有源矩阵有机发光二极管像素结构包括形成在基板上并限定了像素区域的栅线、信号线和电源线,所述像素区域内分别形成有第一薄膜晶体管、第二薄膜晶体管、像素电极和公共电极线,所述第一薄
  • 【摘要】一种血管内裸支架,属于生物医学工程技术领域。该支架为可沿血管壁放置于血管内的管状丝网支架1,其特征在于:所述的丝网支架1的网丝横截面为梯形,梯形的长边为丝网支架外侧3,梯形的短边为丝网支架内侧2,且梯形的短边与长边之比小于50%;所
  • 【摘要】本发明公开了一种自走式喷雾机减震系统及应用其的自走式喷雾机,该减震系统包括前悬挂系统和后悬挂系统,其中,所述前悬挂系统进一步包括:前桥组件,与所述喷雾机的车架单点连接;左前半轴总成和右前半轴总成,对称安装在所述前桥组件两侧;弹性部件
  • 【摘要】本发明公开了一种多媒体广播组播业务的组网方法,包括:根据已知的同时隙网(UTN)组网方式,将每个UTN网络标识为一个单频网(SFN),建立每个UTN网络与每个SFN标识之间的一一对应关系;当需要开始一个多媒体广播组播业务(MBMS)
  • 【摘要】本发明公开了一种EPS承载管理的方法,包括:移动性管理实体MME获取SGSN上下文;当该SGSN上下文指示存在PDP上下文时,根据预先确定的系统间承载映射规则将其PDP上下文映射为EPS承载上下文,在TAU过程中和或系统间切换过程中
  • 【摘要】本发明公开了一种无人机固定半径盘旋领航方法,根据既定的盘旋半径、期望的盘旋方 式以及由传感器获得的飞机位置、高度及地速信息,连续实时计算飞机期望轨迹的侧向偏离 及侧偏移速度等导航参数,并同由姿态运动传感器获得的飞机姿态运动信息一同输