【摘要】 本发明公开了一种基于领域知识的语义查询扩展方法,包括:以概 念表达和知识树体系为基础,构建领域知识;对用户的查询短语进行初 步语义分析,形成语义项列表;利用初步语义分析的结果,以领域知识 为基础,构建带有扩展类型和扩展权重的语义图;计算语义图中每个顶 点到初始顶点间的语义距离;根据语义距离,确定语义项列表中每一项 的可扩展项;最后依靠“与”“或”逻辑关系合并所有可扩展项,得到表 示用户查询意向的语义项集合,并提交系统进行。本发明计算 时间短,充分利用了领域知识,新增加的扩展语义项与原查询短语之间 具有明确的语义关系,能有效的提高系统的查全率和查准率。 【专利类型】发明申请 【申请人】中国科学院自动化研究所 【申请人类型】科研单位 【申请人地址】100080北京市海淀区中关村东路95号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810116729.X 【申请日】2008-07-16 【申请年份】2008 【公开公告号】CN101630314A 【公开公告日】2010-01-20 【公开公告年份】2010 【授权公告号】CN101630314B 【授权公告日】2011-12-07 【授权公告年份】2011.0 【发明人】杨一平; 马良俊; 高一波; 卢朋; 陈琳; 任禾 【主权项内容】1、一种基于领域知识的语义查询扩展方法,其特征在于:包括如下 步骤: 步骤S1:根据对领域知识和用户查询语句特征的分析,构建领域知 识库,形成描述领域知识的领域知识库; 步骤S2:利用领域知识库内容,对用户输入的查询语句进行初步语 义处理,获得一个语义项列表; 步骤S3:利用语义项列表,结合领域知识库内容,对语义项列表中 的每一语义项生成语义图; 步骤S4:根据语义图中顶点间的语义距离计算公式,计算每个语义 图中各顶点与初始顶点间的语义距离,通过设定的阈值,选择可扩展顶 点,作为查询扩展的可扩展项; 步骤S5:根据语义项列表中各语义项的逻辑关系,归并由每个语义 图确定的可扩展项,将所获得的可扩展项提交系统进行查询,并对 系统的查询结果进行分析; 步骤S6:参考系统查询结果的召回率和准确率,调节语义图中 用于计算语义距离的各可变参数,重新组织领域知识库内的知识。。 【当前权利人】中国科学院自动化研究所 【当前专利权人地址】北京市海淀区中关村东路95号 【统一社会信用代码】12100000400010945B 【被引证次数】105 【家族被引证次数】111