24小时服务热线
效率高速
品质保障
厂家直供
售后保障
行业新闻
当前位置:行业新闻>

基于海量自然文本的自动词组提取技术专利

发布时间:2026-06-16

【摘要】 本发明涉及一种用于汉字输入法的自动词组提取技术。当输入一组输入码 ABCDEF之后,该技术先从预先储备的海量自然文本中检索到符合输入码A的 汉字,再查表得到其后一字对应的输入码X,如果X=B,则继续将后续汉字的 输入码分别与CDEF比较,直至完成。最终得到的一串输入码分别与ABCDEF 匹配的汉字序列,即为自动提取出的词组。其意义在于,对于一个既有的海量 自然文本,其中的任意连续汉字序列均可成为有效的词组。 【专利类型】发明申请 【申请人】侯伟华 【申请人类型】个人 【申请人地址】100831北京市三里河路11号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】西城区 【申请号】CN200810132524.0 【申请日】2008-07-16 【申请年份】2008 【公开公告号】CN101630198A 【公开公告日】2010-01-20 【公开公告年份】2010 【发明人】侯伟华 【主权项内容】1.一种自动词组提取技术,其特征在于,在汉字输入的过程中,根据用户 的输入码,从预先准备的自然文本中自动提取出所期望的词组,这些词组都不 需要预先预先特别定义。。 【当前权利人】侯伟华 【当前专利权人地址】北京市三里河路11号

  • 【摘要】一种导盲磁电子罗盘,涉及方向测量和导盲技术。本发明利用地磁传感器测量地磁场水平分量,经模数转换器后送入微处理器,在微处理器内通过计算得到地磁方位角,将地磁方位角与存放在存储器中的磁偏角数据相加得到相对于真北的方向数据;将测得的0~3
  • 【摘要】本发明提供一种离子风散热装置,其特征在于,包括电源和由包含两 条或两条以上导电线的第一组导电线与包含两条或两条以上导电线的第 二组导电线彼此交叉形成的散热网,所述第一组导电线电连接至所述电源 的一个输出端,所述第二组导电线电连接至所
  • 【摘要】一种自动设置广告的方法,包括:获取希望在上面放置广告的至少 一个第一网页,计算该至少一个第一网页中每一个第一网页上的内容的 第一文档向量,获取广告所对应的第二网页,计算该第二网页上的内容 的第二文档向量,计算第二文档向量与所有或部分
  • 【摘要】本发明涉及一种牧草干燥与茎叶分离装置,其特征在于:它包括热风炉、预热干燥滚筒、三回程干燥滚筒、分离排料箱、旋风分离器、风机和除尘器;所述热风炉通过一热风管连接所述预热干燥滚筒,所述热风管上设置有一连接喂料关风器的进料斗,所述预干燥滚
  • 【摘要】具有神经元的管道的方法及装置;涉及管道应用领域,尤其涉及具有神经元的管道的方 法及装置;目前的传输管道的铺设或搭建不太方便,费时费力,尤其是高空跨距离搭建时这 种情况更为突出;还有对任意地方的规律动作时常因要求过多而不易实现;本发明
  • 【摘要】本发明公布了一种性能优良的膨润土润滑脂的制备方法,该润滑脂组分以及重量百分比是:膨润土:5-20%;基础油:80-95%;磷酸:1-3%;防锈剂:1-4%;覆盖剂:1-4%。热安定性能很高,没有明显的滴点;具有良好的温稠性,锥入度随