为了账号安全,请及时绑定邮箱和手机立即绑定

输出爬虫内容的编码问题

编码问题怎么解决呀?

<meta charset='utf-8'>怎么加进去

正在回答

4 回答

def output_html(self):
    fout = open("output.html", "w", encoding='utf-8')
    fout.write("<html>")
    fout.write("<head>")
    fout.write("<meta charset='utf-8'>")
    fout.write("</head>")
    fout.write("<body>")
    fout.write("<table>")
    for data in self.datas:
        print(data['title'])
        fout.write("<tr>")
        fout.write("<td>%s</td>" % data['url'])
        fout.write("<td>%s</td>" % data['title'])
        fout.write("<td>%s</td>" % data['summary'])
        fout.write("</tr>")
    fout.write("</table>")
    fout.write("</body>")
    fout.write("</html>")


0 回复 有任何疑惑可以回复我~
def output_html(self):
    fout = open("output.html", "w", encoding='utf-8')
    fout.write("<html>")
    fout.write("<head>")
    fout.write("<meta charset='utf-8'>")
    fout.write("</head>")
    fout.write("<body>")
    fout.write("<table>")
    for data in self.datas:
        print(data['title'])
        fout.write("<tr>")
        fout.write("<td>%s</td>" % data['url'])
        fout.write("<td>%s</td>" % data['title'])
        fout.write("<td>%s</td>" % data['summary'])
        fout.write("</tr>")
    fout.write("</table>")
    fout.write("</body>")
    fout.write("</html>")

亲测

0 回复 有任何疑惑可以回复我~

其实主要是改变你的output.html解析格式(eclipse workspace默认是gbk——就是说你的内容是按照utf-8记录,可是eclipse给改成gbk解析)————一般把文件改成utf-8就行   而且最好把workspace全都改成utf-8   实际开发都是utf-8

1 回复 有任何疑惑可以回复我~

fout.write("<html>")

后加上

fout.write("<head>")
fout.write("<meta charset='utf-8'>")
fout.write("</head>")


0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

输出爬虫内容的编码问题

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信