课程
                    
                        /后端开发
                        
                            /Python
                        
                        /Python开发简单爬虫

编码问题无法解决，对百度百科词条的爬虫

这个错误怎么解决啊，python 3.5

UnicodeEncodeError: 'gbk' codec can't encode character '\u02c8' in position 19: illegal multibyte sequence

DeanSamCasteil

2016-05-28

源自：Python开发简单爬虫 7-7

关注问题我要回答

1352

操作

收起

6 回答

慕移动9181930
2022-03-24

建议使用subliemtext3这个想要弄得清楚，最好学一下后台语言，如 p h p 了解表单数据是怎么提交给服务器端的。就能完全明白。

0 回复有任何疑惑可以回复我~

收起回答

慕娘9876636
2016-08-26

我用的python3

加了下面两行代码就行了

fout = open('output.html','w',encoding='utf-8')
fout.write('<head><meta charset="utf-8"></head>')

1 回复有任何疑惑可以回复我~

收起回答

ABSmiLT

赞一个。。这个最优雅

2016-10-08 回复有任何疑惑可以回复我~

leve__9

啊我也是用的3，但是都快给乱码的问题搞死了，什么都可以就是乱码搞不定，试过好多种方法都不行，你的也试了

2016-10-11 回复有任何疑惑可以回复我~

那些月亮
2016-07-22

可以尝试一下 gb2312编码，ignore参数，我猜是因为打开时用的utf-8

fout.write("<td>%s</td>"% data['title'].encode('gb2312', 'ignore'))

1 回复有任何疑惑可以回复我~

收起回答

慕课的浩浩

谢谢，你这个方法解决了我的问题

2016-09-28 回复有任何疑惑可以回复我~

mk908429705
2016-07-19

在html_outputer中加fout.write('<head><meta charset="utf-8"></head>')，可以试一下

1 回复有任何疑惑可以回复我~

收起回答

charsandrew
2016-06-26

编码格式的问题，最好把错误信息贴出来！

0 回复有任何疑惑可以回复我~

收起回答

yurn
2016-05-30

把gbk改成utf-8

0 回复有任何疑惑可以回复我~

收起回答

0/150

提交

取消

Python开发简单爬虫

参与学习 227558 人
解答问题 1288 个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

编码问题无法解决，对百度百科词条的爬虫

我要回答关注问题

热搜

最近搜索清空

编码问题无法解决，对百度百科词条的爬虫

6 回答

编码问题无法解决，对百度百科词条的爬虫