【摘要】 本发明公开了一种基于笔段网格的汉字字形信息表示方法、手写汉字输入法和无需训练的汉字识别法。汉字字形信息表示方法是设定一个由N×N个小矩形组成的笔段网格,笔段具有有线或无线两种状态,有线状态笔段的集合表示一个字形。输入方法是在笔段网格中描画笔段,计算机获取所有描画过的笔段并将其状态标为有线。识别方法是:输入待识汉字的笔段网格字形,将它与比对汉字信息库中每个汉字的笔段网格字形进行基本笔画和复合笔画的配对,获得最优的笔画配对方式,计算出距离,把距离最小的前M个比对网格字形作为候选识别结果输出,供输入者选定。本发明的方法可以按原貌输入和识别各种汉字,包括错字、异体字等,促进汉字的教学和研究。 【专利类型】发明授权 【申请人】北京语言大学 【申请人类型】学校 【申请人地址】100083 北京市海淀区学院路15号北京语言大学信息科学学院 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810056489.9 【申请日】2008-01-18 【申请年份】2008 【公开公告号】CN101216947B 【公开公告日】2010-08-18 【公开公告年份】2010 【授权公告号】CN101216947B 【授权公告日】2010-08-18 【授权公告年份】2010.0 【IPC分类号】G06T11/80; G06K9/62 【发明人】宋柔; 林民 【主权项内容】1.一种基于笔段网格的手写汉字输入方法,其特征在于:该方法包括以下步骤: 步骤1:预先建立一个笔段网格平面,具体步骤为: 步骤1.1:首先,设定一个大矩形区域,将该矩形区域划分为大小相等的N×N个小矩形区域; 步骤1.2:在每个小矩形区域内,设定以下三种类型笔段,构成用来描画汉字的笔段网格: ◆小矩形上水平边框线被它的中点分为2段,称为水平笔段; ◆小矩形左竖直边框线被它的中点分为2段,称为竖直笔段; ◆小矩形4个顶点到其2条对边中点的连线,以及连接相对顶点的2条对角线,共4×2+2=10段,称为倾斜笔段; 把以上三种类型笔段作为描画汉字的基本单元,每个小矩形共14个笔段,笔段网格平面内N×N个小矩形区域共有14N2个笔段,共同构成用来描画汉字的笔段网格;这些笔段的集合可以表示为 其中,元素Si,jk代表一个笔段,下标i、j为笔段所属小矩形在大矩形中的行、列编号,N表示整个大矩形划分为小矩形的行/列数,上标k为笔段在所属小矩形内呈现不同方位的编号:0、1代表两种水平方位笔段,2、3代表两种竖直方位笔段,4至13代表10种不同方位的倾斜笔段; 每个笔段存在有线和无线两种状态;该笔段被描画过,则为有线状态;没有被描画过,则为无线状态; 步骤2:输入者只能在笔段网格平面内沿所设定的笔段描画汉字; 步骤3:计算机检测输入者落笔和抬笔之间笔的运动轨迹,获取描画汉字所有笔画的有线笔段序列,得到一个基于笔段网格字形的汉字。 【当前权利人】北京语言大学 【当前专利权人地址】北京市海淀区学院路15号北京语言大学信息科学学院 【统一社会信用代码】12100000400883084R 【引证次数】1.0 【他引次数】1.0 【家族引证次数】1.0 【家族被引证次数】8