24小时服务热线
效率高速
品质保障
厂家直供
售后保障
行业新闻
当前位置:行业新闻>

一种中文引擎中查询词的拼写校正方法专利

发布时间:2026-06-16

【摘要】 本发明公开了一种中文引擎中查询词的拼写校正方法,属于网络信息处理领域。该方法包括:判断输入中文引擎的英文查询词是否为正确的英文查询词;对非正确的英文查询词,生成所述非正确的英文查询词的候选形式,按照预设规则将所述候选形式列入候选集合;对所述候选集合中的所有候选形式进行评分,将分值最高的候选形式作为校正后的形式返回给用户。本发明通过对错误的查询词的候选形式进行度量,选出分值最高的候选形式作为查询词的校正形式,有效地避免拼写错误对引擎的误导,使得引擎更加智能。。 【专利类型】发明授权 【申请人】清华大学; 北京搜狗科技发展有限公司 【申请人类型】企业,学校 【申请人地址】100084 北京市海淀区清华园1号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810224323.3 【申请日】2008-10-17 【申请年份】2008 【公开公告号】CN101369285B 【公开公告日】2010-06-02 【公开公告年份】2010 【授权公告号】CN101369285B 【授权公告日】2010-06-02 【授权公告年份】2010.0 【IPC分类号】G06F17/30 【发明人】周博; 刘奕群; 张敏; 金奕江; 马少平; 茹立平; 佟子健 【主权项内容】 。一种中文引擎中查询词的拼写校正方法,其特征在于,所述方法包括:判断输入中文引擎的英文查询词是否为正确的英文查询词;对非正确的英文查询词,生成所述非正确的英文查询词的候选形式,按照预设规则将所述候选形式列入候选集合;根据α*Edsim/max(Edsim)+β*LogSim/max(LogSim)+(1-α-β)*ErrorTrend/max(ErrorTrend),对所述候选集合中的所有候选形式进行评分,将分值最高的候选形式作为校正后的形式返回给用户;其中,EdSim代表字型相似性特征,LogSim代表词频相似性特征,ErrorTrend代表错误倾向性特征,max表示对括号内的特征取最大值,α代表字型相似性特征在公式中的所占的比重,β代表词频相似性特征在公式中的所占的比重。 【当前权利人】清华大学; 北京搜狗科技发展有限公司 【当前专利权人地址】北京市海淀区清华园; 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 【专利权人类型】公立; 有限责任公司(台港澳法人独资) 【统一社会信用代码】12100000400000624D; 911101087839553124 【家族被引证次数】9

  • 【摘要】本发明公开了车用气体燃料发动机的宽域氧传感器控制器,它由电源模块(3)、加热模块(4)和由信号放大模块(5)、信号判断模块(6)、反馈控制模块(7)、输出放大模块(8)组成的控制模块连成。控制器接受氧传感器反馈电压(Vs),将其放大
  • 【摘要】本发明公开一种曲面网孔金属板深凹造型的实现工艺,包括以下步骤: 在已加工好网孔的金属板上加工出预定造型轮廓的曲面;在所述曲面的预定 位置上进行第一阶段冲压,形成凹形的沉窝,所述沉窝深度为预定沉窝深度 的12~23;在所述沉窝底面局部
  • 【摘要】一种电弧炉能量分段输入控制方法,属于电弧炉炼钢领域。该技术通过基于PLC的控制系统,按金属料的不同配料方式,电弧炉能量分段输入控制技术首先进行电弧炉炼钢过程的能量分段,以物料衡算与能量衡算模块为基础,定量计算不同段中能量的需求。电弧
  • 【摘要】本发明涉及一种二维码传播、储存和显示的方法和系统。具体地,一种二维码传播、 储存和显示的方法,包括:移动终端从本地储存装置获取条码信息;所述移动终端基于所 述条码信息生成二维码;以及在所述移动终端上显示所述二维码,以供扫码装置读取识
  • 【摘要】本发明公开了一种制作P型金属氧化物半导体的方法,包括:对硅片进行磷离子注入以及砷离子注入,形成N阱;对所述形成N阱后的硅片进行P型金属氧化物半导体PMOS阈值电压VTP注入;对经过所述VTP注入的硅片进行栅极制作;对经过所述栅极制作
  • 【摘要】本发明公开了一种含有吲达帕胺的缓释药物制剂,它由有效剂量的吲达帕胺和生理上可接受的辅料组成。本发明制备的吲达帕胺缓释药物制剂,可以使吲达帕胺持续释放,降低了食物效应和增加了生物利用度。【专利类型】发明申请【申请人】北京科信必成医药科