课程
/后端开发
/Python
/Python开发简单爬虫
换了几个页面都是这个结果,想问下史记是哪里来的???
还有就是这样就中断了可能有什么原因啊?
上面的编码问题怎么解决?
2018-04-15
源自:Python开发简单爬虫 7-7
正在回答
嗯。。。。因为python的那个百度百科的页面的html代码升级了一哈,原本的抓取URl的代码不能用了,你把parser里面的_get_new_urls这个函数的re.compile语句后面的正则表达式改一下,改成这样re.compile(r"/item/")就ok了
craw 1:https://baike.baidu.com/item/Python/407313
craw failed
还没有爬呢,就死了!!!求教
url编码的问题
糖水_ 提问者
团子wwwxxx 回复 糖水_ 提问者
糖水_ 提问者 回复 团子wwwxxx
Masc 回复 团子wwwxxx
举报
本教程带您解开python爬虫这门神奇技术的面纱