Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

使用urllib2 无法下载<div data-reactroot>类型

最新回答 / 侠客岛的含笑

不知道

1 回答 1931 浏览 5-2 Python爬虫urlib2下载器网页的三种方法

2016-11-14

No module named baike_spider

最赞回答 / 幕布斯7985579

没有baike_spider这个模块

2 回答 547 浏览 7-1 Python爬虫实例-分析目标

2016-11-14

慕粉4373732

对于3.x，可以自己做一些修改，对自己还是有帮助的

0 5-2 Python爬虫urlib2下载器网页的三种方法

2016-11-14

出现这个问题怎么解决

最新回答 / Spider_Maker4260916

需要看你的完整代码

4 回答 411 浏览 7-7 开始运行爬虫和爬取结果展示

2016-11-13

过去式_PL

完善：_get_new_data方法里的title_node与summary_node要先检查是否为None再进行下一步

3 7-5 HTML解析器html_parser

2016-11-12

过去式_PL

还要加上超时检测
if url is not None:
try:
request = urllib.request.urlopen(url, timeout=10)
if request.getcode() == 200:
return request.read()
else:
return None
except Exception as e:
print(str(e))
else:
return None

9 7-4 HTML下载器html_downloader

2016-11-12

Trister

感觉全文最重要的一句就是：大家的路还长着呢！
/(ㄒoㄒ)/~~

6 8-1 课程总结

2016-11-12

urllib2中的request.add_data()的作用

已采纳回答 / 慕粉3962690

www.baidu.com 只是首页你要用他干什么呢比如你要用它搜索 python 他的链接请求就会变成 www.baidu.com?wd=python (这只是给你简单解释下真实的链接比较复杂做了很多处理) 自己搜下看下地址栏就知道了，简单来说就根据不同的请求参数可以让我抓取不同的页面和内容。ps:去了解HTTP协议的get请求和post请求。

3 回答 4371 浏览 5-2 Python爬虫urlib2下载器网页的三种方法

2016-11-11

bedrock32

Ubuntu14.04、Python2.7环境下本实例的实现：https://github.com/shfanzie/spider_baike

2 7-7 开始运行爬虫和爬取结果展示

2016-11-11

bedrock32

Ubuntu14.04、Python2.7环境下本实例的实现：https://github.com/shfanzie/spider_baike

2 7-1 Python爬虫实例-分析目标

2016-11-11

慕粉3344825

output里面是空的

0 7-7 开始运行爬虫和爬取结果展示

2016-11-11

我怎么输出1000条但是没有生成output.html啊

最新回答 / JoshuaShang

楼主F5更新下目录试下

3 回答 793 浏览 7-7 开始运行爬虫和爬取结果展示

2016-11-11

慕粉3344825

我怎么输出1000条但是没有生成output.html啊

1 7-7 开始运行爬虫和爬取结果展示

2016-11-11

第二个问题url没有定义

最新回答 / qq_Missmissing_04388

<...code...>

2 回答 484 浏览 5-2 Python爬虫urlib2下载器网页的三种方法

2016-11-10

首页上一页 128 129 130 131 132 133 134 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空