24小时服务热线
效率高速
品质保障
厂家直供
售后保障
行业新闻
当前位置:行业新闻>

一种字符切分方法和装置专利

发布时间:2026-06-14

【摘要】 本发明公开了一种字符切分方法及装置,其能够识别出包含粘连字符的字符单元图像块及包含偏旁部首的字符单元图像块,保证字符切分结果的正确性。本发明技术方案中,通过对文本图像进行行切分和列切分,获得若干个字符单元图像块,识别包含粘连字符的字符单元图像块,并继续切分所述包含粘连字符的字符单元图像块,识别汉字字符单元图像块区域和英文字符单元图像块区域,并在所述汉字字符单元图像块区域中识别由汉字字符偏旁部首占用的字符单元图像块,将相邻的汉字字符的偏旁部首占用的字符单元图像块合并为一个字符单元图像块。使得字符切分结果不用过分依赖于字符识别反馈机制,进一步提高了字符的识别率。 【专利类型】发明授权 【申请人】北大方正集团有限公司; 北京大学; 北京北大方正电子有限公司 【申请人类型】企业,学校 【申请人地址】100871 北京市海淀区成府路298号中关村方正大厦513 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810101591.6 【申请日】2008-03-07 【申请年份】2008 【公开公告号】CN101251892B 【公开公告日】2010-06-09 【公开公告年份】2010 【授权公告号】CN101251892B 【授权公告日】2010-06-09 【授权公告年份】2010.0 【IPC分类号】G06K9/20; G06K9/68; G06K9/72 【发明人】亓文法; 程道放; 李晓龙; 卢书一 【主权项内容】一种字符切分方法,其特征在于,包括:对文本图像进行行切分和列切分,获得若干个字符单元图像块;识别包含粘连字符的字符单元图像块,并继续切分所述包含粘连字符的字符单元图像块;识别汉字字符单元图像块区域和英文字符单元图像块区域,并在所述汉字字符单元图像块区域中识别由汉字字符偏旁部首占用的字符单元图像块;将相邻的汉字字符的偏旁部首占用的字符单元图像块合并为一个字符单元图像块;以及当字符单元图像块的宽度小于等于该字符单元图像块的高度,且该字符单元图像块完全在文本行中心线位置的上面或者下面时,确定字符单元图像块包含标点符号,或者当字符单元图像块的高度小于文本行的高度,宽度小于汉字字符单元图像块平均宽度的1/4,且该字符单元图像块与其相邻的前一字符单元图像块或后一字符单元图像块之间的距离值中,至少有一个距离值大于相邻中英文字符单元图像块之间距离范围的上限时,确定字符单元图像块包含标点符号。 【当前权利人】新方正控股发展有限责任公司; 北京大学; 北京北大方正电子有限公司 【当前专利权人地址】广东省珠海市横琴新区华金街58号横琴国际金融中心大厦3007; 北京市海淀区颐和园路5号; 北京市海淀区上地五街9号方正大厦 【专利权人类型】其他有限责任公司; 公立; 有限责任公司(台港澳法人独资) 【统一社会信用代码】91110108101974963M; 12100000400002259P; 9111010860004164XH 【引证次数】2.0 【被引证次数】2 【他引次数】2.0 【被他引次数】2.0 【家族引证次数】2.0 【家族被引证次数】78

  • 【摘要】一种用于从发布队列中选择用于在多个功能单元执行的指令同时减少指令冲突的机会的技术实施例。处理器中每一功能单元可以包括从发布队列中选择具体指令用于执行的选择逻辑电路。为了避免指令冲突,功能单元可以具有可以从指令队列中选择两个指令的选择
  • 【摘要】本发明公开了一种基于模板的字幕渲染效率的统计系统,属于广电领域 电视节目制播机构的字幕编播技术领域。现有技术中评估字幕渲染效率主要 以主观评价为主,存在评估结果不准确和工作量大等缺陷。本发明所述的系 统包括创建渲染源模型库的装置和创
  • 【摘要】一种旋转磁制冷用永磁磁体系统。定子是一个基于Halbach旋转定理的中空圆柱形永磁磁体。中空的圆柱形磁体由永磁块以磁体横截面上的中心轴对称拼装而成,这些永磁块的充磁方向由Halbach旋转定理来确定。转子主要包括导磁铁心、磁工质和转
  • 【摘要】一种非晶镁合金差压压射成型方法及其设备,属于合金制备工程及设备技术领域。模具(10)冷却;母合金从压室(7)上端加入;上冲杆(3)下行到压室(7)上方处;真空泵(16)对工作腔体进行抽真空;加热线圈(6)对压室(7)加热使母合金熔化
  • 【摘要】一种双层行星轮系变速器,利用液压或是电子控制湿式多片离合器、带式 制动器的动作组合,将输入轴的动力和转速经过双层行星轮系进行合成后从 输出轴输出,使得变速器具有10个前进挡和1个倒挡,该变速器易于实现自 动控制,可以达到准无级变速的
  • 【摘要】本发明公开一种图象采集的方法与装置,采集场景图象得到帧序列并根据该帧序列得到背景图象,根据采集所得当前帧和所述背景图象检测当前帧是否包含目标物图象,若是,则在采集当前帧的后续帧之前,根据帧序列和当前帧得到后续帧中目标物图象的预期位置