如何在Python中打印带有双反斜杠特殊字符的字符串（如\\xe7）

我有一个字符串（从 HTML 网页请求获得），其中包含特殊字符：'Dimarts, 10 Mar\\xe7 2020'如果我打印此字符串，它会正确转义双反斜杠并仅打印一个：Dimarts, 10 Mar\xe7 2020但我想要的是打印真实的字符，即字符 92 = çDimarts, 10 Març 2020我尝试过用一个反斜杠替换双反斜杠，甚至使用 html 库取消转义，但没有成功。如果我用文本手动设置一个新变量，然后打印它，它会起作用：print('Original: ', repr(text))print('Direct : ', text)print('Option 1: ', text.replace('\\\\', '\\'))print('Option 2: ', text.replace(r'\\', '\\'))print('Option 3: ', text.replace(r'\\', chr(92)))print('Option 4: ', text.replace('\\', chr(92)))print('Option 5: ', html.unescape(text))text = 'Dimarts, 10 Mar\xe7 2020'print('Manual: ', text)结果却从来没有像预期的那样：Original: 'Dimarts, 10 Mar\\xe7 2020'Direct : Dimarts, 10 Mar\xe7 2020Option 1: Dimarts, 10 Mar\xe7 2020Option 2: Dimarts, 10 Mar\xe7 2020Option 3: Dimarts, 10 Mar\xe7 2020Option 4: Dimarts, 10 Mar\xe7 2020Option 5: Dimarts, 10 Mar\xe7 2020Manual: Dimarts, 10 Març 2020有没有办法让Python正确处理特殊字符？

查看完整描述

2 回答

慕妹3242003

TA贡献1824条经验获得超6个赞

好吧，事实证明我在 Windows 中对文件进行编码时遇到了问题。我必须在处理之前对其进行解码。因此，这样做解决了问题：

htmlfile = urllib.request.urlopen('http://www.somewebpage.com/')

for line in htmlfile:

line = line.decode('cp1252')

也可以解码整个 html：

htmlfile = urllib.request.urlopen('http://www.somewebpage.com/').read()

htmldecoded = htmlfile.decode('cp1252')

这样做解决了问题，我可以正确打印字符串。

反对回复 2024-01-03

白猪掌柜的

TA贡献1893条经验获得超10个赞

不确定这是否是您想要的，但是：

print(chr(231))

将打印您想要的字符。

它还将由以下人员打印：

print(u"\xe7")

反对回复 2024-01-03

热搜

最近搜索清空

如何在Python中打印带有双反斜杠特殊字符的字符串（如\\xe7）

如何在Python中打印带有双反斜杠特殊字符的字符串（如\\xe7）

2 回答

添加回答