【摘要】 本发明公开了一种快速文本识别方法,属于OCR技术领域,用OCR识别引擎对两种语言的混排文字图像进行识别,首先切分文本行,接着根据每个所述文本行所包含的第一语言或第二语言的字符的多少对所述文本行进行排序;然后用中文OCR识别引擎进行识别,提取英文可疑区域,再用英文OCR识别引擎进行识别;若判断当前行识别结果为英文行,在下一行识别时OCR识别策略是首先用英文OCR识别引擎识别,提取中文可疑区域,再用中文OCR识别引擎进行识别;最后对识别结果融合。本发明提高了识别速度、降低了字符错误识别率,为嵌入式装置提供了高效版本。 【专利类型】发明申请 【申请人】汉王科技股份有限公司 【申请人类型】企业 【申请人地址】100094 北京市海淀区东北旺西路8号5号楼三层 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810239540.X 【申请日】2008-12-12 【申请年份】2008 【公开公告号】CN101751567A 【公开公告日】2010-06-23 【公开公告年份】2010 【授权公告号】CN101751567B 【授权公告日】2012-10-17 【授权公告年份】2012.0 【IPC分类号】G06K9/20 【发明人】万鑫; 刘正珍; 朱军民 【主权项内容】一种快速文本识别方法,其特征在于,包括以下步骤:a.切分文本行的步骤:将所述文本切分为多个文本行,每个所述文本行至少包括第一语言和第二语言中的一种字符;b.文本行排序的步骤:根据每个所述文本行所包含的第一语言的字符的多少,或第二语言的字符的多少对所述文本行进行排序;c.逐行判断识别方式并进行识别的步骤:如果当前行是排序后的第一个所述文本行,则采用判定方式一进行识别;如果当前行不是排序后的第一个所述文本行,则据前一行或多行的识别结果判断当前行的识别方式:前一行或多行的识别结果均为第二语言,则采用识别方式二识别该行;否则,采用识别方式一识别该行;其中方式一包括:调用第一语言OCR识别引擎:使用所述第一语言OCR识别引擎识别当前行,保存其中的第一语言识别结果;而对于所述第一语言OCR识别引擎识别得到的第二语言字符、或识别结果低于可信阈值T1的第一语言字符,归入第二语言字符可疑区域;调用第二语言OCR识别引擎:使用所述第二语言OCR识别引擎识别所述第二语言字符可疑区域,得到第二语言可疑区域识别结果;识别结果融合:对于所述第二语言可疑区域中的字符,通过所述第一语言OCR识别引擎和所述第二语言OCR识别引擎得到的两个识别结果,若所述第一语言OCR识别引擎得到的识别结果为第二语言,则保存第二语言引擎识别结果;若所述第一语言OCR识别引擎得到的识别结果为第一语言字符,若经过第二语言OCR识别引擎的再次识别,得到的字符可信度阈值高于第二语言字符可信阈值T2,则保存第二语言引擎识别结果、而若经过第二语言OCR识别引擎的再次识别,得到的字符可信度阈值低于第二语言字符可信阈值T2,则保存第一语言引擎识别结果;其中方式二包括:调用第二语言OCR识别引擎:使用所述第二语言OCR识别引擎识别当前行图像,保存其中的第二语言识别结果;而对于第二语言OCR识别引擎不能识别的或识别结果低于可信阈值T2的第二语言字符,归入第一语言字符可疑区域;调用第一语言OCR识别引擎:使用所述第一语言OCR识别引擎识别所述第一语言可疑区域,得到第一语言字符可疑区域识别结果;d.识别结果融合的步骤:对于所述第一语言字符可疑区域中的字符,通过所述第二语言OCR识别引擎和所述第一语言OCR识别引擎得到的两个识别结果,若所述第一语言OCR识别引擎得到的再次识别结果为第二语言,则保存第二语言引擎识别结果;若所述第一语言OCR识别引擎得到的再次识别结果为高于可信阈值T1的第一语言字符,则保存第一语言引擎识别结果;而若所述第一语言OCR识别引擎得到的再次识别结果为低于可信阈值T1的第一语言字符,则保存第二语言引擎识别结果。 【当前权利人】汉王科技股份有限公司 【当前专利权人地址】北京市海淀区东北旺西路8号5号楼三层 【专利权人类型】其他股份有限公司(上市) 【统一社会信用代码】911100006337095702 【被引证次数】33 【被自引次数】1.0 【被他引次数】32.0 【家族引证次数】5.0 【家族被引证次数】33