课程
                    
                        /后端开发
                        
                            /Python
                        
                        /Python开发简单爬虫

爬了两条就停下来了，还出来个中文

换了几个页面都是这个结果，想问下史记是哪里来的？？？

还有就是这样就中断了可能有什么原因啊？

上面的编码问题怎么解决？

糖水_

2018-04-15

源自：Python开发简单爬虫 7-7

关注问题我要回答

1197

操作

收起

3 回答

慕容2517008 回答被采纳 +2 积分
2018-06-04

嗯。。。。因为python的那个百度百科的页面的html代码升级了一哈，原本的抓取URl的代码不能用了，你把parser里面的_get_new_urls这个函数的re.compile语句后面的正则表达式改一下，改成这样re.compile(r"/item/")就ok了

0 回复有任何疑惑可以回复我~

收起回答

syblogs
2018-07-02

craw 1:https://baike.baidu.com/item/Python/407313

craw failed

还没有爬呢，就死了！！！求教

0 回复有任何疑惑可以回复我~

收起回答

慕仰9275077
2018-04-16

url编码的问题

0 回复有任何疑惑可以回复我~

收起回答

糖水_ 提问者

方便解释一下吗……要怎么改才可以

2018-04-16 回复有任何疑惑可以回复我~

团子wwwxxx 回复糖水_ 提问者

请问你解决了吗？

2018-04-23 回复有任何疑惑可以回复我~

糖水_ 提问者回复团子wwwxxx

没有…换了别的网站也只能爬两个……

2018-04-24 回复有任何疑惑可以回复我~

查看3条回复

0/150

提交

取消

Python开发简单爬虫

参与学习 227558 人
解答问题 1288 个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

爬了两条就停下来了，还出来个中文

我要回答关注问题

热搜

最近搜索清空

爬了两条就停下来了，还出来个中文

3 回答

爬了两条就停下来了，还出来个中文