为了账号安全,请及时绑定邮箱和手机立即绑定

求大神!!关于url乱码的问题

该加utf-8的地方都加了,url还是显示乱码,但title和summary不会乱码

http://static.mukewang.com/img/59aea3d80001b51109690922.jpg

正在回答

2 回答

在spider_main 函数中

from urllib import request


然后 把原来的 print 改成 print('count %d : %s'%(count , request.unquote(new_url)))

0 回复 有任何疑惑可以回复我~
#1

qq_大屎_0 提问者

是2.7版本,不是3.5版本哦
2017-09-09 回复 有任何疑惑可以回复我~
#2

Mr_nothing 回复 qq_大屎_0 提问者

额,查一下2.7版本的unquote函数在 urllib库的什么地方 引用下就行,反正就是个编码问题,希望能帮助到你
2017-09-11 回复 有任何疑惑可以回复我~

这个url不是乱码,中文的打印过来就是这样,你直接复制到浏览器里是可以正确连接的

0 回复 有任何疑惑可以回复我~
#1

qq_大屎_0 提问者

你说的这个我知道,但问题是,爬取的结果,url地址也是乱码哦
2017-09-09 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

求大神!!关于url乱码的问题

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信