我已经使用电子邮件模块将该字符串从Quoted-printable解码为ISO-8859-1。这给了我像“ \ xC4pple”这样的字符串,它对应于“Äpple”(瑞典语中的Apple)。但是,我无法将这些字符串转换为UTF-8。>>> apple = "\xC4pple">>> apple'\xc4pple'>>> apple.encode("UTF-8")Traceback (most recent call last): File "<stdin>", line 1, in <module>UnicodeDecodeError: 'ascii' codec can't decode byte 0xc4 in position 0: ordinal not in range(128)我该怎么办?
3 回答
斯蒂芬大帝
TA贡献1827条经验 获得超8个赞
对于Python 3:
bytes(apple,'iso-8859-1').decode('utf-8')
我将其用于错误编码为iso-8859-1(显示类似VeÅ\x99ejné之类的单词)的文本,而不是utf-8。此代码产生正确的版本Veřejné。
添加回答
举报
0/150
提交
取消