为了账号安全,请及时绑定邮箱和手机立即绑定

python爬虫

我也是只出来了第一条记录,可能会是什么问题啊?


正在回答

4 回答

问题是你写错了,或者你没做好网页分析

0 回复 有任何疑惑可以回复我~
#1

weibo_Lmagic__0 提问者

这个解决了,但是解析出来的中文 变成了\xe4\xba\x8e1991\xe5\xb9\xb4\xe3\x80\x82Python\
2016-07-25 回复 有任何疑惑可以回复我~
#2

qq_贪嗔痴傻_0 回复 weibo_Lmagic__0 提问者

请问你的那个问题是怎么解决的啊?
2016-08-20 回复 有任何疑惑可以回复我~
encoding="utf-8"
file_out.write('<head><meta http-equiv=\"content-type\" content=\"text/html;charset=utf-8\"></head>')


0 回复 有任何疑惑可以回复我~

终于解决了 浏览器不显示中文的问题,我用的是python3

代码 :

fout = open('output.html', 'w', encoding="utf-8")

在fout.write("<html>") 之后添加

fout.write("<head><meta http-equiv=\"content-type\" content=\"text/html;charset=utf-8\"></head>") 

然后 去掉.encode('utf-8')  

fout.write("<td>%s</td>" % data['url'])    

fout.write("<td>%s</td>" % data['title'])    

fout.write("<td>%s</td>" % data['summary'])    

百度百科的网页编码,本身就是utf-8,所以只要我使用utf-8的格式打开,则输出器中直接输出得到的内容,但需要在html文件的<head><meta>标签内声明网页的编码格式为utf-8,否则浏览器默认的是gbk



0 回复 有任何疑惑可以回复我~

这个解决了,但是解析出来的中文 变成了\xe4\xba\x8e1991\xe5\xb9\xb4\xe3\x80\x82Python\  

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

python爬虫

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信