简介:本课程通过3.5小时入门Python爬虫,完成一整套爬虫代码,实现抓取当当网5星图书排行榜视频数据,并通过IP代理隐藏爬虫。
第2章 环境配置
本章讲解在windows10中安装mongodb,以及如何使用Navicat连接Mongodb数据库。
第3章 爬虫基础
本章讲解requests模块、HTTP请求,入门xpath基础语法,学习lxml模块实例化html并通过xpath解析。
第4章 项目实战-电商网站数据抓取
本章全面细致开始爬虫项目实战,包括分析抓取需求、分析电商网站页面结构、爬虫数据解析和数据入库。