【摘要】 本发明涉及一种用于汉字输入法的自动词组提取技术。当输入一组输入码 ABCDEF之后,该技术先从预先储备的海量自然文本中检索到符合输入码A的 汉字,再查表得到其后一字对应的输入码X,如果X=B,则继续将后续汉字的 输入码分别与CDEF比较,直至完成。最终得到的一串输入码分别与ABCDEF 匹配的汉字序列,即为自动提取出的词组。其意义在于,对于一个既有的海量 自然文本,其中的任意连续汉字序列均可成为有效的词组。 【专利类型】发明申请 【申请人】侯伟华 【申请人类型】个人 【申请人地址】100831北京市三里河路11号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】西城区 【申请号】CN200810132524.0 【申请日】2008-07-16 【申请年份】2008 【公开公告号】CN101630198A 【公开公告日】2010-01-20 【公开公告年份】2010 【发明人】侯伟华 【主权项内容】1.一种自动词组提取技术,其特征在于,在汉字输入的过程中,根据用户 的输入码,从预先准备的自然文本中自动提取出所期望的词组,这些词组都不 需要预先预先特别定义。。 【当前权利人】侯伟华 【当前专利权人地址】北京市三里河路11号