【摘要】 本发明实施例提供一种网页收集方法及其系统。所述网页收集方法包括:从URL数据库中逐条获取URL,并根据URL获得对应的host名进行网页内容的获取;根据所述host名,进行DNS请求;进行域名服务系统DNS请求的同时,根据DNS请求成功的URL,进行页面获取。通过本发明实施例提供的技术方案,DNS请求和页面获取分别同时进行,因此当获取页面代码时,也在不断的进行DNS请求,从而提高了网页收集的运转效率。 【专利类型】发明授权 【申请人】成都市华为赛门铁克科技有限公司 【申请人类型】企业 【申请人地址】611731 四川省成都市高新区西部园区清水河片区 【申请人地区】中国 【申请人城市】成都市 【申请人区县】郫都区 【申请号】CN200810111298.8 【申请日】2008-06-13 【申请年份】2008 【公开公告号】CN101303700B 【公开公告日】2010-04-21 【公开公告年份】2010 【授权公告号】CN101303700B 【授权公告日】2010-04-21 【授权公告年份】2010.0 【IPC分类号】G06F17/30 【发明人】辛阳; 雷宇; 李娜; 刘利锋 【主权项内容】一种网页收集的方法,其特征在于,包括:从URL数据库中逐条获取URL,并根据URL获得对应的主机host名;根据所述host名,进行域名服务系统DNS请求,对DNS请求的结果进行管理,所述管理包括将请求成功的DNS请求结果保存在DNS数据库中;进行域名服务系统DNS请求的同时,根据所述DNS数据库中DNS请求成功的URL,进行页面获取。 【当前权利人】华为数字技术(成都)有限公司 【当前专利权人地址】四川省成都市高新区西部园区清水河片区 【引证次数】3.0 【他引次数】3.0 【家族引证次数】3.0 【家族被引证次数】5