【摘要】 本发明涉及一种电子词典模糊检索方法,属于模糊识别领域,该电子词典包括储存有多个词条的词条词典、储存有多个关键词的关键词词典、以及关键词索引表;其中每个词条由一个或多个关键词组成,索引表记录了每一个关键词与包含该关键词的词条的对应关系,方法包括以下步骤:将用户输入的单词分成一个或多个关键词;检索每个关键词对应的一个或多个词条,分别计算输入的单词与这些词条之间的编辑距离;对编辑距离进行排序并选取至少一个编辑距离最小的词条作为检索结果。由于支持模糊检索,使得用户在输入词条中有若干错误单字时,原本通过传统精确检索方式不能检索到的结果,通过本发明的方法很快就得到检索结果。 【专利类型】发明申请 【申请人】汉王科技股份有限公司 【申请人类型】企业 【申请人地址】100193 北京市海淀区东北旺西路8号5号楼三层 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810239543.3 【申请日】2008-12-12 【申请年份】2008 【公开公告号】CN101751430A 【公开公告日】2010-06-23 【公开公告年份】2010 【IPC分类号】G06F17/30 【发明人】王琛; 朱军民 【主权项内容】一种电子词典模糊检索方法,其特征是:所述电子词典包括储存有多个词条的词条词典、储存有多个关键词的关键词词典、以及关键词索引表;其中每个词条由一个或多个关键词组成,所述索引表记录了所述关键词词典的每一个关键词与所述词条词典中所有包含了该关键词的词条的对应关系,所述方法包括以下步骤:(a)分词:对用户输入的单词使用关键词词典进行分词,将输入的单词分成一个或多个关键词;(b)计算编辑距离:根据分词步骤得到的关键词从所述关键词索引表中检索到其中每个关键词对应的一个或多个词条,分别计算所述输入的单词与这些词条之间的编辑距离;(c)选取检索结果:对编辑距离进行排序并选取至少一个编辑距离最小的词条作为检索结果。。 【当前权利人】汉王科技股份有限公司 【当前专利权人地址】北京市海淀区东北旺西路8号5号楼三层 【专利权人类型】其他股份有限公司(上市) 【统一社会信用代码】911100006337095702 【被引证次数】20 【被他引次数】20.0 【家族被引证次数】20