(12)发明专利申请
(21)申请号 CN201710222875.X (22)申请日 2017.04.07 (71)申请人 武汉大学
地址 430072 湖北省武汉市武昌区珞珈山武汉大学
(10)申请公布号 CN107066569A
(43)申请公布日 2017.08.18
(72)发明人 高靖宇;刘科科;李武昭
(74)专利代理机构 武汉科皓知识产权代理事务所(特殊普通合伙)
代理人 魏波
(51)Int.CI
权利要求说明书 说明书 幅图
(54)发明名称
一种分布式网络爬虫系统及信息爬取的方法
(57)摘要
本发明公开了一种分布式网络爬虫系统及
信息爬取的方法,系统包括若干控制节点和若干爬取节点;所有节点根据网络距离进行分组,网络距离在预算范围内的节点被分为一组;每组设有一个控制节点,其余为爬取节点;同一分组的控制节点和爬取节点之间为主从关系,所有的控制节点组成一个对等式网络,共同控制整个系统的运行。本发明能根据爬取列表,动态分配爬取任务,实现多个节点并行爬取海量数据,是一种
成本低廉、性能高效的分布式网络爬虫系统。
法律状态
法律状态公告日
2017-08-18 2017-08-18 2017-09-12
公开 公开
实质审查的生效
法律状态信息
公开 公开
法律状态
实质审查的生效
权利要求说明书
一种分布式网络爬虫系统及信息爬取的方法的权利要求说明书内容是....请下载后查看
说明书
一种分布式网络爬虫系统及信息爬取的方法的说明书内容是....请下载后查看
因篇幅问题不能全部显示,请点此查看更多更全内容