【摘要】 本发明涉及一种被动式网络信息自动高效采集系统及方法,所述网络信息自动高效采集系统包括:运行于信息需求端的信息采集工作部;运行于信息提供端的信息收集发送工作部;所述信息采集工作部与所述信息收集发送工作部为通信连接关系。所述网络信息自动高效采集方法包括步骤:将所述信息采集工作部与所述信息收集发送工作部建立有效的联系;所述信息采集工作部根据所述信息收集发送工作部的通知或定期获取所述信息收集发送工作部内存储的所述信息提供端信息。将本发明技术应用于引擎中后,能及时、快速、高效的获取互联网上的文本信息和音频、视频特征信息等网站相关内容,并可显著降低系统开销以及网络带宽占用量。 【专利类型】发明授权 【申请人】哈尔滨工业大学深圳研究生院 【申请人类型】学校 【申请人地址】518055 广东省深圳市南山区西丽深圳大学城哈工大校区 【申请人地区】中国 【申请人城市】深圳市 【申请人区县】南山区 【申请号】CN200810066892.X 【申请日】2008-04-29 【申请年份】2008 【公开公告号】CN101261635B 【公开公告日】2010-09-01 【公开公告年份】2010 【授权公告号】CN101261635B 【授权公告日】2010-09-01 【授权公告年份】2010.0 【IPC分类号】G06F17/30 【发明人】陈清财; 王晓龙; 郭鸿志; 马天明; 翁家才 【主权项内容】一种被动式网络信息自动高效采集系统,其特征在于:所述网络信息自动高效采集系统包括:运行于信息需求端的信息采集工作部;运行于信息提供端的信息收集发送工作部;所述信息采集工作部与所述信息收集发送工作部为通信连接关系,所述的网络信息自动高效采集系统工作时包括以下步骤:A:将所述信息采集工作部与所述信息收集发送工作部建立有效的联系,由所述信息采集工作部查询新的、运行有所述信息收集发送工作部的网站,并获取所述信息收集发送工作部网站相关信息;B:所述信息采集工作部根据所述信息收集发送工作部的通知,获取所述信息收集发送工作部内存储的所述信息提供端信息;所述步骤B包括子步骤:B1:通过所述信息收集发送工作部检测其所在网站下相关内容的更新情况,并进行更新内容的存储;B2:所述信息收集发送工作部向所有已成功注册的所述信息采集工作部发送内容下载通知;B3:在所述信息采集工作部与所述信息收集发送工作部之间建立点对点(P2P)传输网络,由所述收集发送工作部提供下载的种子文件,供所述信息采集工作部进行下载。 【当前权利人】哈尔滨工业大学深圳研究生院 【当前专利权人地址】广东省深圳市南山区西丽深圳大学城哈工大校区 【统一社会信用代码】12440300455753420H 【家族被引证次数】7