24小时服务热线
效率高速
品质保障
厂家直供
售后保障
行业新闻
当前位置:行业新闻>

一种数字报刊版面信息的自动提取方法专利

发布时间:2026-06-13

【摘要】 本发明涉及计算机信息处理领域的模式识别技术,具体涉及一种数字报刊版面信息的自动提取方法。本发明首先对版面中独立的文字进行合并,将其组织成为若干个内容块,然后根据相关内容在报纸版面上的位置与语义信息,自动提取版面上的出版日期、版次、版名数据,通过简单、方便的自动化操作,提高了大量版面数据成批处理时的处理效率,在减轻工作人员劳动强度的同时,也使得数字报刊的标引工作更加快捷、准确。 【专利类型】发明申请 【申请人】北大方正集团有限公司; 北京方正阿帕比技术有限公司 【申请人类型】企业 【申请人地址】100871 北京市海淀区成府路298号方正大厦 【申请人地区】中国 【申请人城市】北京市 【申请人区县】海淀区 【申请号】CN200810225320.1 【申请日】2008-10-30 【申请年份】2008 【公开公告号】CN101727438A 【公开公告日】2010-06-09 【公开公告年份】2010 【授权公告号】CN101727438B 【授权公告日】2012-07-18 【授权公告年份】2012.0 【IPC分类号】G06F17/22; G06F17/27 【发明人】徐剑波; 董宁 【主权项内容】一种数字报刊版面信息的自动提取方法,包括如下步骤:(1)对版面中独立的文字进行合并,将其组织成为若干个内容块;(2)根据可能包含所需版面信息的位置筛选出候选内容块;(3)根据日期内容的特征筛选步骤(2)中获得的候选内容块,判断其是否为包含出版日期的内容块,并对包含出版日期的内容块进行提取;(4)根据版次内容的特征筛选步骤(2)中获得的候选内容块,判断其是否为包含版次的内容块,并对包含版次的内容块进行提取;(5)根据版名内容的特征筛选步骤(2)中获得的候选内容块,判断其是否为包含版名的内容块,并对包含版名的内容块进行提取。 【当前权利人】新方正控股发展有限责任公司; 北京方正阿帕比技术有限公司 【当前专利权人地址】广东省珠海市横琴新区华金街58号横琴国际金融中心大厦3007; 北京市海淀区花园路2号牡丹科技大厦B座5层502 【专利权人类型】其他有限责任公司; 有限责任公司 【统一社会信用代码】91110108101974963M; 91110108787754390J 【被引证次数】13 【被自引次数】6.0 【被他引次数】7.0 【家族引证次数】7.0 【家族被引证次数】13

  • 【摘要】本发明提供了乳杆菌在冷却肉保鲜中的应用,同时也提供了一种植物乳杆菌(Lactobacillus plantarum)新菌株A18,其保藏号为CGMCC No.2227。该菌株具有良好的培养特性,其发酵液具有良好的抑菌能力,可用于食品
  • 【摘要】本发明提供了一种可分级视频传输处理方法及装置,该方法包括:可分级信源编码得到原始待传输数据包集合;进行权重估计,得到待传输数据包的权重;按权重从大到小的顺序,为待传输数据包进行子载波分配,分配到子载波的待传输数据包组成的第一待传输数
  • 【摘要】本发明提供了一种检测X、Y精子分离纯度的引物,该引物是针对牛Y染色体上性别决定基因Sry通过PCR错配技术设计而成,通过该引物可扩增片段大小为295bp,为了防止假阳性出现,本发明根据牛3号常染色体报道序列设计了一对内标引物C34,
  • 【摘要】本发明公开了一种基于图像中目标区域的自动曝光方法,包括:对当前检测帧的图像进行目标检测,判断是否存在目标;根据当前检测帧和或先前检测帧中的目标区域的亮度值确定当前检测帧的亮度值;根据当前检测帧的亮度值对后续图像进行自动曝光调整。采用
  • 【摘要】本发明公开了一种数据处理装置及方法,该数据处理装置包括交织器和分量编码器,分量编码器对输入信息序列编码后,对分量编码器反馈回的比特进行编码并分配到信息位比特和校验位比特的最后并输出上述比特。本发明公开的技术方案,只采用一个分量编码器
  • 【摘要】本发明提供了一种微生物菌剂及其制备方法,和使用该微生物菌剂的畜 禽粪便的处理方法。本发明提供的微生物菌剂能够快速的分解畜禽粪便有机 物,有效地去除畜禽粪便中的臭味,降低粪便中的有害物质含量。此外,本 发明提供的畜禽粪便的处理方法中,