为了账号安全,请及时绑定邮箱和手机立即绑定

Python爬虫中编码设置问题,系统编码如何正确处理?

Python爬虫中编码设置问题,系统编码如何正确处理?

白猪掌柜的 2019-04-19 16:29:30
有个问题想请交一下。Python中为了确定源文件的编码,所以在文件第一行可以进行设置。在Windows下最简单的方法例子就是#coding=utf-8(Linux下还需要加一行的样子,(不确定))。然后我导入了sys模块,printsys.getdefaultencoding()来看一下默认的编码方式,结果还是ascii而不是utf-8。不解下一步要如何解决这个问题,据说Python3都是utf-8编码的。其次,在Python文件输入unicode时会成为一个类型,而我输入utf-8,或者ascii是会报错没有这个变量之类的。这个问题是如何解决的?谢谢!题主系统为win7
查看完整描述

2 回答

?
眼眸繁星

TA贡献1873条经验 获得超9个赞

你可以这样:
importsys
reload(sys)
sys.setdefaultencoding('utf-8')
应该就可以
                            
查看完整回答
反对 回复 2019-04-19
?
潇潇雨雨

TA贡献1833条经验 获得超4个赞

将所有的输入内容decode,decode后字符串格式为unicode,然后统一encode后输出,utf-8还是GBK随便你。
推荐阅读PYTHON-进阶-编码处理小结PragmaticUnicode
其实你提问我就没看很明白。还是推荐你先了解了解字符编码相关知识吧
                            
查看完整回答
反对 回复 2019-04-19
  • 2 回答
  • 0 关注
  • 713 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信