【摘要】 本发明提供一种基于笔矢量特征的联机手写中文词组切分方法,采用N个 笔段构成词组,词组记为WN={S1,S2,S3,…SN},每一个笔段由多个点Pk构成,记 为Si={P1,P2,P3,…Pt},而第k个点Pk=(x,y),其中x、y分别为横、纵坐标大小, 第i个笔段的起点和终点分别为Pib和Pie,定义第i个笔段Si和第i+1个笔段Si+1 之间的笔矢量特征如下:Veci,i+1=Dis(Pib,Pi+1b),Dis表示计算两个 点之间的距离,则词组WN={S1,S2,S3,…SN}存在一组笔矢量特征序列如下: V={Vec1,2,Vec2,3,Vec3,4,…VecN-1,N},取其中最大的数值所对应的笔段 最右点作切分线,将手写词组进行切分。本发明不仅运算复杂度低,而且切分 效果较好,提切分候选线的效率高,为联机手写中文词组的切分提供了一种有 效的解决方法。 【专利类型】发明授权 【申请人】华南理工大学 【申请人类型】学校 【申请人地址】510640广东省广州市天河区五山路381号 【申请人地区】中国 【申请人城市】广州市 【申请人区县】天河区 【申请号】CN200810029421.1 【申请日】2008-07-11 【申请年份】2008 【公开公告号】CN100587707C 【公开公告日】2010-02-03 【公开公告年份】2010 【授权公告号】CN100587707C 【授权公告日】2010-02-03 【授权公告年份】2010.0 【发明人】金连文; 郭锐 【主权项内容】1、一种基于笔矢量特征的联机手写中文词组切分方法,其特征在于采用N 个笔段构成词组,词组记为WN={S1,S2,S3,...SN},每一个笔段由多个点Pk构成, 记为Si={P1,P2,P3,...Pt},而第k个点Pk=(x,y),其中x、y分别为横、纵坐标大 小,第i个笔段的起点和终点分别为Pib和Pie,定义第i个笔段Si和第i+1个笔 段Si+1之间的笔矢量特征如下: Veci,i+1=Dis(Pib,Pi+1b),Dis表示计算两个点之间的距离,则词 组WN={S1,S2,S3,...SN}存在一组笔矢量特征序列如下: V={Vec1,2,Vec2,3,Vec3,4,...VecN-1,N} 取其中最大的数值所对应的笔段最右点作切分线,将手写词组进行切分, 所述切分线根据词组的中文字数确定,包含M个字数的词组采用M-1条切分 线,切分线根据词组WN={S1,S2,S3,...SN}的笔矢量特征序列组的取值大小依次确 定,当切分线包括两条或两条以上候选线,将笔矢量特征序列组的最大值所对 应的切分线作为首选,第二大值所对应的切分线作为第二候选,依次类推。 【当前权利人】华南理工大学 【当前专利权人地址】广东省广州市天河区五山路381号 【统一社会信用代码】12100000455414429R