为了账号安全,请及时绑定邮箱和手机立即绑定

网址中有汉字怎么才能正确爬取?

网址中有汉字怎么才能正确爬取?

mxspring 2016-09-13 21:59:56
比如:http://www.ed2000.com/Type/图书   这个网址,好像就会报错,请问:#-*-coding:utf-8-*- from urllib.request  import urlopen from bs4 import BeautifulSoup import re resp = urlopen("http://www.ed2000.com/Type/图书").read().decode("utf-8")报错:UnicodeEncodeError: 'ascii' codec can't encode characters in position 10-11: ordinal not in range(128)该怎么写?
查看完整描述

1 回答

?
this_life

TA贡献3条经验 获得超0个赞


用urlencode()将url转码

查看完整回答
反对 回复 2016-09-15
  • 1 回答
  • 2 关注
  • 1643 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号