有没有一种标准的方法(最好是Pythonic方法)将&#xxxx;表示法转换为正确的unicode字符串?例如,מפגשי应转换为:מפגשי使用字符串操作可以很容易地做到这一点,但是我想知道是否有一个标准的库。
1 回答
慕运维8079593
TA贡献1876条经验 获得超5个赞
用途HTMLParser.HTMLParser():
>>> from HTMLParser import HTMLParser
>>> h = HTMLParser()
>>> s = "מפגשי"
>>> print h.unescape(s)
מפגשי
它也是标准库的一部分。
但是,如果您使用的是Python 3,则必须从导入html.parser:
>>> from html.parser import HTMLParser
>>> h = HTMLParser()
>>> s = 'מפגשי'
>>> print(h.unescape(s))
מפגשי
添加回答
举报
0/150
提交
取消