为了账号安全,请及时绑定邮箱和手机立即绑定

我使用 .encode('utf-8')也没有效果,请问该怎么转成中文?

我使用 .encode('utf-8')也没有效果,请问该怎么转成中文?

梵蒂冈之花 2023-04-25 19:15:23
我爬的网页源码顶端写的是 <meta charset="utf-8">我在浏览器打开源码看到我想要的信息也是中文,不过在urllib2.urlopen(url).read()输出来的却是类似于&#38472;&#39062;这种unicode编码(我的python程序是coding:utf-8)
查看完整描述

3 回答

?
有只小跳蛙

TA贡献1824条经验 获得超8个赞

那可以试试这样:

>>> h = HTMLParser.HTMLParser()>>> import HTMLParser>>> h = HTMLParser.HTMLParser()>>> print h.unescape('&#38472;&#39062;')


查看完整回答
反对 回复 2023-04-28
?
斯蒂芬大帝

TA贡献1827条经验 获得超8个赞

&#开头都是HTTP转义的,可以用HTTPParser解码啊

查看完整回答
反对 回复 2023-04-28
?
宝慕林4294392

TA贡献2021条经验 获得超8个赞

import HTMLParser 
h = HTMLParser.HTMLParser() 
print h.unescape("&#38472;&#39062;").encode("utf-8")


查看完整回答
反对 回复 2023-04-28
  • 3 回答
  • 0 关注
  • 428 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信