代码如下:#-*-encoding=utf-8-*-importurllib2importsyscontent=urllib2.urlopen('http://www.douban.com').read()type=sys.getfilesystemencoding()printcontentprintcontent.decode("UTF-8").encode(type)打印content的内容就是一堆乱七八糟的东西:��}isI��w�����,U�$��i���o�tOL��{_��)(���b���q+٭}o˖e��M��E�7!�Eܟb�U��ᝬ*�Ul$��V@-�'3�~2O�--�_����������?�~�������-�CD��tyt��6}����xܣ���,��0+0�����Y���6�t�c然后decode的时候又报错:UnicodeDecodeError:'utf8'codeccan'tdecodebyte0x8binposition1:invalidstartbyte系统环境是Ubuntu1204,Python2,7,这究竟是什么问题呢?先谢谢了!
添加回答
举报
0/150
提交
取消