行业新闻

快速文本识别方法专利

发布时间:2026-06-15

【摘要】本发明公开了一种快速文本识别方法，属于OCR技术领域，用OCR识别引擎对两种语言的混排文字图像进行识别，首先切分文本行，接着根据每个所述文本行所包含的第一语言或第二语言的字符的多少对所述文本行进行排序；然后用中文OCR识别引擎进行识别，提取英文可疑区域，再用英文OCR识别引擎进行识别；若判断当前行识别结果为英文行，在下一行识别时OCR识别策略是首先用英文OCR识别引擎识别，提取中文可疑区域，再用中文OCR识别引擎进行识别；最后对识别结果融合。本发明提高了识别速度、降低了字符错误识别率，为嵌入式装置提供了高效版本。【专利类型】发明申请【申请人】汉王科技股份有限公司【申请人类型】企业【申请人地址】100094 北京市海淀区东北旺西路8号5号楼三层【申请人地区】中国【申请人城市】北京市【申请人区县】海淀区【申请号】CN200810239540.X 【申请日】2008-12-12 【申请年份】2008 【公开公告号】CN101751567A 【公开公告日】2010-06-23 【公开公告年份】2010 【授权公告号】CN101751567B 【授权公告日】2012-10-17 【授权公告年份】2012.0 【IPC分类号】G06K9/20 【发明人】万鑫; 刘正珍; 朱军民【主权项内容】一种快速文本识别方法，其特征在于，包括以下步骤：a.切分文本行的步骤：将所述文本切分为多个文本行，每个所述文本行至少包括第一语言和第二语言中的一种字符；b.文本行排序的步骤：根据每个所述文本行所包含的第一语言的字符的多少，或第二语言的字符的多少对所述文本行进行排序；c.逐行判断识别方式并进行识别的步骤：如果当前行是排序后的第一个所述文本行，则采用判定方式一进行识别；如果当前行不是排序后的第一个所述文本行，则据前一行或多行的识别结果判断当前行的识别方式：前一行或多行的识别结果均为第二语言，则采用识别方式二识别该行；否则，采用识别方式一识别该行；其中方式一包括：调用第一语言OCR识别引擎：使用所述第一语言OCR识别引擎识别当前行，保存其中的第一语言识别结果；而对于所述第一语言OCR识别引擎识别得到的第二语言字符、或识别结果低于可信阈值T1的第一语言字符，归入第二语言字符可疑区域；调用第二语言OCR识别引擎：使用所述第二语言OCR识别引擎识别所述第二语言字符可疑区域，得到第二语言可疑区域识别结果；识别结果融合：对于所述第二语言可疑区域中的字符，通过所述第一语言OCR识别引擎和所述第二语言OCR识别引擎得到的两个识别结果，若所述第一语言OCR识别引擎得到的识别结果为第二语言，则保存第二语言引擎识别结果；若所述第一语言OCR识别引擎得到的识别结果为第一语言字符，若经过第二语言OCR识别引擎的再次识别，得到的字符可信度阈值高于第二语言字符可信阈值T2，则保存第二语言引擎识别结果、而若经过第二语言OCR识别引擎的再次识别，得到的字符可信度阈值低于第二语言字符可信阈值T2，则保存第一语言引擎识别结果；其中方式二包括：调用第二语言OCR识别引擎：使用所述第二语言OCR识别引擎识别当前行图像，保存其中的第二语言识别结果；而对于第二语言OCR识别引擎不能识别的或识别结果低于可信阈值T2的第二语言字符，归入第一语言字符可疑区域；调用第一语言OCR识别引擎：使用所述第一语言OCR识别引擎识别所述第一语言可疑区域，得到第一语言字符可疑区域识别结果；d.识别结果融合的步骤：对于所述第一语言字符可疑区域中的字符，通过所述第二语言OCR识别引擎和所述第一语言OCR识别引擎得到的两个识别结果，若所述第一语言OCR识别引擎得到的再次识别结果为第二语言，则保存第二语言引擎识别结果；若所述第一语言OCR识别引擎得到的再次识别结果为高于可信阈值T1的第一语言字符，则保存第一语言引擎识别结果；而若所述第一语言OCR识别引擎得到的再次识别结果为低于可信阈值T1的第一语言字符，则保存第二语言引擎识别结果。【当前权利人】汉王科技股份有限公司【当前专利权人地址】北京市海淀区东北旺西路8号5号楼三层【专利权人类型】其他股份有限公司(上市) 【统一社会信用代码】911100006337095702 【被引证次数】33 【被自引次数】1.0 【被他引次数】32.0 【家族引证次数】5.0 【家族被引证次数】33

一种中、低合金特殊钢的生产方法
【摘要】一种中、低合金特殊钢的生产方法，包括以下步骤：电炉冶炼，在电炉中将高炉输送来的铁水加入部分废钢，进行熔化和脱磷；氩氧脱碳炉精炼，将电炉输送来的钢水进行氧化、还原步骤，该氧化、还原步骤包括脱碳、脱硫、脱氮、脱氢和脱氧；连铸，将氩
一种基于群落的结构化路由方法
【摘要】本发明公开了一种基于群落的结构化路由方法，属于计算机网络领域。本发明首先使计算节点具有接收请求和发送请求的能力，然后发布者根据发布数据特征确定接收节点后进行数据发布，之后在群落发起者之间建立群落关系，在节点之间建立邻居关系，通过
一种非母语语音识别系统及方法
【摘要】本发明涉及一种基于混合模型状态修正的非母语语音识别系统及方法。该系统包括：非母语语音接口、母语模型模块、非母语模型模块、母语状态解码模块、非母语状态强制对齐模块、母语与非母语状态相似度矩阵计算模块、母语与非母语状态映射表计算模
基于基因网络的药物组合协同作用确定方法
【摘要】从基因网络和药物作用有效基因确定与一种疾病有关的两种药物的药物组合协同作用的方法，包括：确定所述两种药物的协同因子(ST1，2)；确定所述两种药物的药物相似性因子(AS1，2)；从所述协同因子和所述相似性因子的积，确定所述两种药物的
一种电话远程控制和报警装置
【摘要】一种电话远程控制和报警装置，属于智能家电和家庭安防系统领域，其特征在于，数据接入管理芯片实现振铃检测，自动摘挂机，并将电话线路与双音频收发芯片、语音芯片以及单片机连通。单片机控制振铃计数、摘挂机和双音频收发芯片、语音芯片，利用内
一种对复杂叶片的快速简化和绘制方法
【摘要】本发明为一种对复杂叶片的快速简化和绘制方法，输入树模型提取树叶信息，对叶簇内复杂叶片完成一层次简化；迭代地叶片合并完作二层次简化；迭代地对树冠中的叶片合并操作完成叶片的三层次简化；计算叶片密度；用数组结构把叶片几何和简化信息分别保存

产品分类

最新文章

快速文本识别方法专利