为了账号安全,请及时绑定邮箱和手机立即绑定

Python 读取文件时怎么防止其在转义字符前加 \

Python 读取文件时怎么防止其在转义字符前加 \

红颜莎娜 2018-06-27 17:18:53
今天突然遇到一个问题,在文本处理的时候需要去除一些停用词,停用词都放在一个txt文件中,其中一个字符串是 "\xa0",用python读取后便会自动变为 “\\xa0”. 以前都是字符串前面加 “r” ,但是从文件中读取这个真的没想出来...
查看完整描述

2 回答

?
陪伴而非守候

TA贡献1757条经验 获得超8个赞

方法一,用二进制的方式读取文件,并对内容进行细致的解析,来避免这个问题。

方法二,由于我猜测这可能是编码造成的问题,所以建议用 open 函数的 errors 参数来测试这个问题,有可能解决。

此外,因为没有测试,我不确定你这是不是实际上被添加了一个反斜杠,还是 Python 打印时为了显示,比如因 repr 函数等因素,而造成的显示型反斜杠。


查看完整回答
反对 回复 2018-07-14
  • 2 回答
  • 0 关注
  • 1886 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信