24小时服务热线
效率高速
品质保障
厂家直供
售后保障
行业新闻
当前位置:行业新闻>

一种变异关键词的提取方法专利

发布时间:2026-06-22

【摘要】 本发明公开了一种变异关键词的提取方法,通过字符区位将噪音字符去除, 提取出噪音字符的变异关键词;通过拼音文件将分词后文本和关键词转换为文 本整数串,然后提取拼音替换、谐音替换的变异关键词;通过建立形近字库, 比较分词后文本的每个汉字与关键词库中的关键词的每个汉字是否为同一组形 近字,提取形近字替换的变异关键词,这样实行了变异关键词的正常提取。 【专利类型】发明授权 【申请人】电子科技大学 【申请人类型】学校 【申请人地址】611731四川省成都市高新西区西源大道2006号 【申请人地区】中国 【申请人城市】成都市 【申请人区县】郫都区 【申请号】CN200810045712.X 【申请日】2008-07-31 【申请年份】2008 【公开公告号】CN100589098C 【公开公告日】2010-02-10 【公开公告年份】2010 【授权公告号】CN100589098C 【授权公告日】2010-02-10 【授权公告年份】2010.0 【发明人】傅彦; 陈安龙; 周俊临; 尚明生; 史伟; 王全礼; 关娜 【主权项内容】1、一种变异关键词的提取方法,其特征在于,包括以下步骤: (1)、如果分词后文本中有非汉字噪音符号,则将分词后文本中其区位码 属于01-09区内的特殊字符去掉,从而去除分词后文本中的非汉字噪音符号,然 后进行下一步,否则,直接进行下一步; (2)、建立关键词库,将分词后文本送到关键词库中进行匹配,如果匹配 成功,则提取,否则,进行下一步; (3)、建立一个拼音文件,将分词后文本中拼音相同的汉字和拼音转换成 对应的整数,从而将其从字符串转换为文本整数串;将步骤(2)中的关键词库 中的所有关键词通过拼音文件也转换为关键词整数串;比较文本整数串和关键 词整数串,如果相同,则提取,否则,进行下一步; (4)、对汉字进行形近字分组,建立一个形近字库;将分词后文本的每一 个汉字与关键词库中的关键词的每一个汉字根据该形近字库的汉字分组进行匹 配,如果分词后文本的每一个汉字与关键词库中的关键词的每一个汉字属于同 一组,则提取,否则,不是关键词。 【当前权利人】电子科技大学 【当前专利权人地址】四川省成都市高新西区西源大道2006号 【专利权人类型】公立 【统一社会信用代码】121000004507193117 【被引证次数】TRUE 【家族被引证次数】TRUE

  • 【摘要】本发明涉及一种文具,特别是涉及一种出口倒置式方便胶水瓶,它由瓶身、橡胶塞、隔片、筒管、溢液碗、取液瓶和橡皮囊构成。瓶身为筒状,取液瓶为筒状且处于隔片下的瓶身内的圆柱形空间内,取液瓶的上端有一凹陷的溢液碗,溢液碗的底部的中央有一筒管,
  • 【摘要】省略其它视图。【专利类型】外观设计【申请人】朱要成【申请人类型】个人【申请人地址】610041四川省成都市武侯区武侯大道双楠段60号5栋5单元10号【申请人地区】中国【申请人城市】成都市【申请人区县】武侯区【申请号】CN200830
  • 【摘要】一种表演手帕,包括手帕1,手帕1上设置至少一个发光二极管2。手帕 1上设置至少两个以上的发光二极管2。多个发光二极管2以手帕1上的任一 点为中心呈同心圆排列,最好以手帕1的正中为中心;多个发光二极管2以手 帕1上的任一点为中心呈放射
  • 【摘要】本发明实施例公开了一种文件权限控制的方法,包括:监测文件作者的 身份信息;根据所述文件作者的身份信息,确定所述文件的至少一个授权对 象;根据所述文件作者的身份信息和所述文件的至少一个的授权对象,确定 所述文件不同的授权对象的相应权限
  • 【摘要】本发明实施例公开一种泛洪攻击检测方法及检测装置。所述方法包括:获取源报文的关键字总数;获取对应所述源报文的特征参数的数目;将所述特征参数的数目占所述关键字总数的比例值与预设阈值进行比较,若大于等于所述预设阈值,则判断出发生泛洪攻击。
  • 【专利类型】外观设计【申请人】陈旺【申请人类型】个人【申请人地址】611741四川省成都市郫县三道堰镇平定村五社【申请人地区】中国【申请人城市】成都市【申请人区县】郫都区【申请号】CN200830264273.2【申请日】2008-10-2