24小时服务热线
效率高速
品质保障
厂家直供
售后保障
行业新闻
当前位置:行业新闻>

一种自动识别数字文档目录的方法及装置专利

发布时间:2026-06-14

【摘要】 本发明公开了一种自动识别数字文档目录的方法及装置,用以解决现有技术中数字文档的目录人工识别效率低的问题。该方法根据数字文档的总页数及保存的目录页占总页数的比例参数,确定数字文档目录页所在的候选页;根据设置的至少一个特征信息,在候选页中确定候选目录页;在候选目录页中确定数字文档目录页;确定该一页中表示各章节内容的页码标识的位置;根据保存的层次关系,在每页版心范围内根据每行的属性信息,确定每行在目录中的层次,根据字符的间隔,将每行划分为不同的字符段,分别存储识别的层次信息及每个字符段。如本发明提出的方案自动识别数字文档的目录,有效的提高了数字文档的制作速度。 数据由整理 【专利类型】发明授权 【申请人】北京大学; 北大方正集团有限公司; 北京方正阿帕比技术有限公司 【申请人类型】企业,学校 【申请人地址】100871 北京市海淀区颐和园路5号 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810119333.0 【申请日】2008-09-03 【申请年份】2008 【公开公告号】CN101458680B 【公开公告日】2010-12-01 【公开公告年份】2010 【授权公告号】CN101458680B 【授权公告日】2010-12-01 【授权公告年份】2010.0 【IPC分类号】G06F17/21 【发明人】高良才; 陶欣; 褚一民; 汤帜 【主权项内容】一种自动识别数字文档目录的方法,其特征在于,包括:根据数字文档的总页数及保存的目录页占数字文档的总页数的比例参数,确定数字文档目录页所在的候选页区间;根据设置的至少一个特征信息,在所述候选页区间中确定候选目录页;将为候选目录页的候选页按照页码的大小顺序排列,从所述排列中选择候选页的页码连续,并且包含的候选页最多的候选页区间,将该候选页区间包含的候选页确定为数字文档目录页;在所述数字文档目录页中选择一页,根据该页的属性信息,确定该页中表示各章节内容的页码标识的位置;根据保存的层次关系,在所述数字文档目录页的每页版心范围内根据每行的属性信息,确定每行在目录中的层次,所述层次关系根据数字文档中每行包含的章节信息划分,并根据字符的间隔,将每行划分为若干个字符段,根据所述页码标识的位置及每个字符段的属性信息,分别存储层次信息、页码标识信息和对应每个属性的字符段信息。 【当前权利人】北京大学; 新方正控股发展有限责任公司; 北京方正阿帕比技术有限公司 【当前专利权人地址】北京市海淀区颐和园路5号; 广东省珠海市横琴新区华金街58号横琴国际金融中心大厦3007; 北京市海淀区花园路2号牡丹科技大厦B座5层502 【专利权人类型】公立; 其他有限责任公司; 有限责任公司 【统一社会信用代码】12100000400002259P; 91110108101974963M; 91110108787754390J 【引证次数】4.0 【被引证次数】3 【他引次数】4.0 【被自引次数】3.0 【家族引证次数】4.0 【家族被引证次数】18

  • 【摘要】1.本外观设计专利产品所属领域为通信类电子产品,主要用途有钟表、通话、定位、报警、一键拨打 接听、自动监听周边环境,使用方法为可佩戴于手腕上,也可在拆卸表带后,将产品佩戴于上臂部、 腰部、书包等随身物件上,使用场所为室内、室外的日常
  • 【摘要】本发明实施例公开了一种数据同步的方法,该方法为:第一系统对本系统 存储的树结构数据进行节点更新后,将所述树结构数据中根节点到更新的节点 间的路径的信息发送给第二系统;所述第二系统根据所述路径的信息对本系统 存储的树结构数据进行节点更
  • 【摘要】一种基于运动补偿的去隔行处理方法,其特征在于包括以下三个主要部分:一为运动检测,即通过对所捕获的图像与无运动物体时的静态的背景图像进行的像素级的比对确定运动的物体,并得到初步的运动矢量;二为运动估计,在第一步确定运动物体的基础上,通
  • 【摘要】本发明涉及自动开合式太阳能集热设备,属于太阳能应用技术领域,该设备包括上下 两个集热器、两端有轴杆的空心轴、轴套、液压伸缩杆,该各集热器为具有一面开口的两 层箱壁的箱体,开口处由涂有渐变铝氮铝膜的单层平面不锈钢板封闭。该内箱壁构成储
  • 【摘要】本发明公开了一种硅基集成化的光学向量-矩阵乘法器,该光学向量- 矩阵乘法器由周期性排列的纳米线微环谐振器构成,用于实现N×N矩阵 与N×1向量的乘法,其中N×N矩阵与N×1向量中的元素均为0或1。该 光学向量-矩阵乘法器采用绝缘体上
  • 【摘要】本发明公开了一种基于计算机视觉的飞行器航向跟踪方法。针对现有的航向跟踪方法,提供多角度的改进方案:通过在图像匹配源上引入梯度信息,丰富了图像模板匹配的信息量,提高了图像匹配精度,即提高了航向跟踪精度;在保证模板匹配运算量不增加的前提