Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

一样的代码，只能爬取几条数就结束了

最新回答 / 慕九州3106485

请问你的问题解决了么？我遇到跟你类似的问题

2 回答 717 浏览 7-7 开始运行爬虫和爬取结果展示

2018-08-20

求解啊啊啊啊啊啊啊救命

+ 我来回答回答最高可+2积分

3 回答 997 浏览 5-3 Python爬虫urlib2实例代码演示

2018-08-20

python3

最新回答 / RookieBoy666

参考如下：https://blog.csdn.net/zjsxxzh/article/details/77914478

2 回答 1033 浏览 5-3 Python爬虫urlib2实例代码演示

2018-08-20

代码对了好几遍，没有发现什么错误，但是控制台什么也没有输出，求高手指点

最新回答 / 211苹果西瓜柚

我也一样没错，没输出醉了

1 回答 841 浏览

2018-08-19

output_html和控制台都为空，谁能帮我看看代码哪里错了

最新回答 / 慕斯卡2697514

我的错误分布一样的我debug追踪到是bs4中，builder_class = builder_registry.lookup(*features) 构建解析器的时候这里返回为空，目前还不知道怎么解决

2 回答 1216 浏览 7-7 开始运行爬虫和爬取结果展示

2018-08-16

output_html和控制台都为空，谁能帮我看看代码哪里错了

最新回答 / 慕姐3323389

需要将解析器里改成这样

links = soup.find_all('a',href=re.compile(r"/item/"))

2 回答 710 浏览 7-2 调度程序

2018-08-16

提示urllib无相关模块

最新回答 / Vsolution

我是这个情况,请问怎么解决的???

2 回答 947 浏览 7-7 开始运行爬虫和爬取结果展示

2018-08-14

我爬出来的链接后缀都是16进制和% ？？

最赞回答 / 葬酒为安

这是汉字的url编码，可以调用quote（）和unquote（）互相转换

4 回答 1240 浏览 7-7 开始运行爬虫和爬取结果展示

2018-08-13

只能输出一个链接，去掉try....except 后就变成这样了，怎么解决呢

最新回答 / 慕丝5066221

你的错误NameError: global name 'new_url' is not defined是不是new__url没定义，你检查看看带脉是否完整

1 回答 750 浏览 7-7 开始运行爬虫和爬取结果展示

2018-08-12

只能输出一个链接，去掉try....except后显示如下，该怎么调试

最新回答 / 努力学习的泽羽

检查一下def parse的缩进对不对，还有对应的方法名是不是正确的（我也是这样，现在已经可以了）

2 回答 1054 浏览 7-7 开始运行爬虫和爬取结果展示

2018-08-12

AttributeError: 'SpiderMian' object has no attribute 'urls'

最赞回答 / 宝慕林5424413

<...图片...> 是init

1 回答 1039 浏览 7-7 开始运行爬虫和爬取结果展示

2018-08-11

为什么下载器里面url为None return 后面None，URL管理器里面return后面什么也没有？

+ 我来回答回答最高可+2积分

2 回答 942 浏览 7-4 HTML下载器html_downloader

2018-08-10

if response.getcode() != 200

最新回答 / 慕妹9374715

200 OK 正常返回信息详情请查询 Http状态码大全

1 回答 2432 浏览 7-4 HTML下载器html_downloader

2018-08-09

很多自带变量未定义

最新回答 / 慕雪6363006

请问电脑上python 的版本是多少？我也是初学，是不是版本的问题？

1 回答 653 浏览 1-1 Python开发简单爬虫课程介绍

2018-08-09

add_new_urls ctrl+1 不能at到url_manager里

最新回答 / 耿直不好么

urls 你后面用了逗号，应该用.self.urls.

1 回答 744 浏览 7-2 调度程序

2018-08-09

控制台什么都没有输出

最新回答 / pickleRick

这位同学先发截图吧....

1 回答 778 浏览 7-6 HTML输出器

2018-08-07

首页上一页 21 22 23 24 25 26 27 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫