【摘要】 本发明公开了一种基于用户兴趣模型的个性化摘要系统,该个性化摘要系统由Web信息检索单元、用户兴趣单元和个性化摘要单元组成。该个性化摘要系统通过分析用户检索日志,利用概念聚类方法建立和/或更新以层次概念结构描述的用户兴趣模型;然后依据该用户兴趣模型与检索结果进行用户兴趣与检索结果中句子相似度的解析,从而得到满足用户的个性化摘要。采用的个性化句子评分处理得到的个性化摘要充分考虑了用户的兴趣特点,使摘要的生成过程根据用户的兴趣进行匹配,可以提高摘要的有效性以及用户的满意度。 【专利类型】发明授权 【申请人】北京航空航天大学 【申请人类型】学校 【申请人地址】100191 北京市海淀区学院路37号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810224285.1 【申请日】2008-10-16 【申请年份】2008 【公开公告号】CN101373486B 【公开公告日】2010-06-02 【公开公告年份】2010 【授权公告号】CN101373486B 【授权公告日】2010-06-02 【授权公告年份】2010.0 【IPC分类号】G06F17/30 【发明人】刘永利; 欧阳元新; 袁满; 熊璋 【主权项内容】一种基于用户兴趣模型的个性化摘要系统,该个性化摘要系统由Web信息检索单元、用户兴趣单元和个性化摘要单元组成;其特征在于:所述Web信息检索单元根据查询请求负责完成对Web页面的索引和检索任务,并将检索结果WR输出给个性化摘要单元、将检索日志WLOG输出给用户兴趣单元;所述用户兴趣单元根据Web信息检索单元提供的检索日志WLOG,利用概念聚类法建立以层次概念结构描述的用户兴趣模型IC,所述用户兴趣模型IC为用户在通过Web信息检索单元进行检索时,所访问的Web页面对象的并集;表达形式为IC={p1,p2,p3,......,pM},其中,p表示Web页面对象,M表示Web页面的数量;所述个性化摘要单元(A)根据用户兴趣单元提供的用户兴趣模型IC与Web信息检索单元输出的检索结果WR进行用户兴趣与检索结果中句子相似度的解析,获得相似度I(s),I(s)=max(I(c1,s),I(c2,s),……,I(cn,s))输出给个性化句子评分处理;I(s)=max(I(c1,s),I(c2,s),……,I(cn,s))中,c表示概念,s表示一个句子,n表示用户兴趣的概念个数;(B)利用检索结果WR计算出句子中的查询关键词的逆文本频率IDF,然后依据逆文本频率IDF计算每一个句子s的分值Sidf(s),并将分值Sidf(s)输出给个性化句子评分处理;(C)利用检索结果WR计算出每一个句子s中的信息量Sic(s),并将信息量Sic(s)输出给个性化句子评分处理;(D)个性化句子评分处理依据最终评分对每一个句子s进行重要性排序,并将排序结果中前K项组成一个个性化摘要输出给用户,从而完成在用户模型下的个性化摘要的订制;其中,最终评分中的α表示分值Sidf(s)的系数,β表示信息量Sic(s)的系数,γ表示相似度I(s)的系数。F2008102242851C00011.tif, F2008102242851C00012.tif 【当前权利人】北京航空航天大学 【当前专利权人地址】北京市海淀区学院路37号 【统一社会信用代码】12100000400011227Y 【引证次数】4.0 【被引证次数】1 【自引次数】1.0 【他引次数】3.0 【被他引次数】1.0 【家族引证次数】4.0 【家族被引证次数】23