为了账号安全,请及时绑定邮箱和手机立即绑定

如何在Python 3.1中的字符串中取消对HTML实体的转义?

如何在Python 3.1中的字符串中取消对HTML实体的转义?

蝴蝶刀刀 2019-10-09 16:57:08
我到处都是,只找到了适用于python 2.6和更早版本的解决方案,没什么关于如何在python 3.X中做到这一点的。(我只能访问Win7框。)我必须能够在3.1中做到这一点,最好不要使用外部库。当前,我已经安装了httplib2并可以访问命令提示符curl(这就是我获取页面源代码的方式)。不幸的是,据我所知,curl不能解码html实体,我在文档中找不到用于对其进行解码的命令。是的,我尝试过“美丽的汤”,但是在3.X中很多次都没有成功。如果您可以提供有关如何使其在MS Windows环境中的python 3中运行的EXPLICIT说明,我将不胜感激。因此,明确地说,我需要将这样Suzy & John的字符串转换为这样的字符串:“ Suzy&John”。
查看完整描述

3 回答

?
梦里花落0921

TA贡献1772条经验 获得超6个赞

您可以xml.sax.saxutils.unescape用于此目的。该模块包含在Python标准库中,可在Python 2.x和Python 3.x之间移植。


>>> import xml.sax.saxutils as saxutils

>>> saxutils.unescape("Suzy & John")

'Suzy & John'


查看完整回答
反对 回复 2019-10-09
  • 3 回答
  • 0 关注
  • 836 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信