为什么要做爬虫?

首先请问:都说现在是"大数据时代",那数据从何而来?

爬虫是什么?

百度百科:网络爬虫

关于Python爬虫,我们需要学习的有:

1. Python基础语法学习(基础知识)
2. HTML页面的内容抓取(数据抓取)
3. HTML页面的数据提取(数据清洗)
4. Scrapy框架以及scrapy-redis分布式策略(第三方框架)
6. 爬虫(Spider)、反爬虫(Anti-Spider)、反反爬虫(Anti-Anti-Spider)之间的斗争....
Copyright © BigCat all right reserved,powered by Gitbook「Revision Time: 2017-01-14 23:07:28」