【摘要】 本发明公开了一种多文档摘要的生成方法及装置,用以解决现有技术中生成的多文档摘要的可读性差的问题。该方法从多篇文档中选择若干个摘要句;按照设置的至少一种排序规则将所述若干个摘要句进行排序生成多文档摘要,其中,每种排序规则根据摘要句包含的日期信息、摘要句位于文档的位置信息或摘要句与摘要主题内容上的相关性设置。如本发明提出的方案,充分考虑了摘要句间的连续性和与主题内容的相关性,从而可以有效的提高生成的多文档摘要的可读性。 【专利类型】发明申请 【申请人】北京大学; 北大方正集团有限公司; 北京方正电子政务信息科技有限公司 【申请人类型】企业,学校 【申请人地址】100871 北京市海淀区颐和园路5号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810226101.5 【申请日】2008-11-13 【申请年份】2008 【公开公告号】CN101739426A 【公开公告日】2010-06-16 【公开公告年份】2010 【IPC分类号】G06F17/30; G06F17/21 【发明人】贾候萍; 万小军; 黄小江; 杨建武; 肖建国 【主权项内容】一种多文档摘要的生成方法,其特征在于,包括:从多篇文档中选择若干个摘要句;按照设置的至少一种排序规则将所述若干个摘要句进行排序生成多文档摘要,其中,每种排序规则根据摘要句包含的日期信息、摘要句位于文档的位置信息或摘要句与摘要主题内容上的相关性设置。 【当前权利人】北京大学; 北大方正集团有限公司; 北京方正电子政务信息科技有限公司 【当前专利权人地址】北京市海淀区颐和园路5号; 北京市海淀区成府路298号中关村方正大厦9层; 【专利权人类型】公立; 其他有限责任公司; 有限责任公司 【统一社会信用代码】12100000400002259P; 91110108101974963M; 91110108676602263P 【被引证次数】10 【被他引次数】10.0 【家族被引证次数】10