已解决430363个问题，去搜搜看，总会有你想问的

爬网页时 unicode 和 utf-8的编码问题

首页猿问爬网页时 unicode 和...

JavaScript

翻阅古今 2019-04-23 15:35:46

我爬的网页源码顶端写的是我在浏览器打开源码看到我想要的信息也是中文，不过在urllib2.urlopen(url).read()输出来的却是类似于陈颖这种unicode编码然后我使用.encode('utf-8')也没有效果。。请问该怎么转成中文？（我的python程序是coding:utf-8）

查看完整描述

2 回答

慕容森

TA贡献1853条经验获得超18个赞

importHTMLParserh=HTMLParser.HTMLParser()printh.unescape("陈颖").encode("utf-8")陈颖

反对回复 2019-04-23

陪伴而非守候

TA贡献1757条经验获得超8个赞

那可以试试这样：>>>h=HTMLParser.HTMLParser()>>>importHTMLParser>>>h=HTMLParser.HTMLParser()>>>printh.unescape('陈颖')陈颖

反对回复 2019-04-23

关注

0/150

提交

取消

购课补贴
联系客服咨询优惠详情

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号