【摘要】 本发明公开了一种基于版式文件的文档流式信息处理方法及装置,具体公开了如下技术方案:获得版式文件的文档流式信息,所述文档流式信息为所述版式文件中文档内容结构信息和/或所述版式文件中文档版面自适应呈现信息;根据所述获得的文档流式信息,对所述版式文件的文档内容进行内容块划分;描述所述版式文件的内容块划分结果信息;根据所述内容块划分结果信息,描述基于内容块划分后的该版式文件的文档流式信息。从而使得描述版式文件的文档流式信息更加切实可行,可以灵活对版式文件中的任意内容进行文档流式信息的描述,描述范围更加准确,并且文档流式信息的处理更加灵活、简化。 【专利类型】发明授权 【申请人】北京大学; 北大方正集团有限公司; 北京方正阿帕比技术有限公司 【申请人类型】企业,学校 【申请人地址】100871 北京市海淀区颐和园路5号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810114437.2 【申请日】2008-06-05 【申请年份】2008 【公开公告号】CN101308488B 【公开公告日】2010-06-02 【公开公告年份】2010 【授权公告号】CN101308488B 【授权公告日】2010-06-02 【授权公告年份】2010.0 【IPC分类号】G06F17/21 【发明人】仇睿恒; 王毅; 汤帜 【主权项内容】一种基于版式文件的文档流式信息处理方法,其特征在于,包括:获得版式文件的文档流式信息,所述文档流式信息为所述版式文件中文档内容结构信息和/或所述版式文件中文档版面自适应呈现信息;根据所述获得的文档流式信息,对所述版式文件的文档内容进行内容块划分;描述所述版式文件的内容块划分结果信息;根据所述内容块划分结果信息,描述基于内容块划分后的该版式文件的文档流式信息,其中描述基于内容块划分后的该版式文件的文档流式信息,是指描述各内容块本身的文档流式信息和各内容块之间的关系。。 【当前权利人】北京大学; 新方正控股发展有限责任公司; 北京方正阿帕比技术有限公司 【当前专利权人地址】北京市海淀区颐和园路5号; 广东省珠海市横琴新区华金街58号横琴国际金融中心大厦3007; 北京市海淀区花园路2号牡丹科技大厦B座5层502 【专利权人类型】公立; 其他有限责任公司; 有限责任公司 【统一社会信用代码】12100000400002259P; 91110108101974963M; 91110108787754390J 【引证次数】6.0 【被引证次数】5 【他引次数】6.0 【被自引次数】1.0 【被他引次数】4.0 【家族引证次数】19.0 【家族被引证次数】57