【摘要】 本发明涉及一种全文检索方法,包括以下步骤:接收包括检索词 的检索表达式,并对检索词进行分词处理;根据分词处理后得到的词 条在全文数据库中的VIF文件中查找词条在全文数据库中的BIF文件 中的位置信息;根据位置信息在BIF文件中查找与词条对应的记录信 息;根据记录信息在全文数据库中的BAF文件中提取对应的数据信息 作为检索结果。本发明还涉及一种全文检索系统,包括:BAF文件存 储模块、BIF文件存储模块、VIF文件存储模块、分词模块和检索模 块。本发明在BIF文件中采用了倒排文件索引技术,由于散列码的唯 一性检索时可以迅速的找到被检索信息,并通过对BIF文件进行连符 的索引,保证了检索时达到高度的查全率和查准率。 【专利类型】发明申请 【申请人】全国组织机构代码管理中心 【申请人类型】机关团体 【申请人地址】100029北京市西城区德外裕民路裕中西里46号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】西城区 【申请号】CN200810126025.0 【申请日】2008-07-01 【申请年份】2008 【公开公告号】CN101620607A 【公开公告日】2010-01-06 【公开公告年份】2010 【IPC分类号】G06F17/30 【发明人】张红彬; 周斯 【主权项内容】1、一种全文检索方法,包括以下步骤: 接收包括检索词的检索表达式,并对所述检索词进行分词处理; 根据分词处理后得到的词条在全文数据库中的虚拟信息文件文 件中查找所述词条在全文数据库中的字节索引文件中的位置信息; 根据所述位置信息在所述字节索引文件中查找与所述词条对应 的记录信息; 根据所述记录信息在全文数据库中的字节加速文件中提取对应 的数据信息作为检索结果。 【当前权利人】全国组织机构代码管理中心 【当前专利权人地址】北京市西城区德外裕民路裕中西里46号 【统一社会信用代码】12100000400009880K 【被引证次数】18 【被他引次数】18.0 【家族被引证次数】18