为了账号安全,请及时绑定邮箱和手机立即绑定

output输出问题

为什么爬取的内容是字节码的格式?

正在回答

4 回答

class HtmlOutputer(object):
    def __init__(self):
        self.datas=[]
   
    def collect_data(self,data):
        if data is None:
            return
        self.datas.append(data)
       
    def output_html(self):
        fout = open('output.html', 'w', encoding='utf-8')
        fout.write("<html>")
        fout.write("<head>")
        fout.write('<meta charset="UTF-8">')
        fout.write("</head>")
        fout.write("<body>")
        fout.write("<table>")
       
        #ascii
        for data in self.datas:
            fout.write("<tr>")
            fout.write("<td>%s</td>"%data['url'])
            fout.write("<td>%s</td>"%data['title'])
            fout.write("<td>%s</td>"%data['summary'])
        fout.write("</table>")
        fout.write("</body>")
        fout.write("</html>")

0 回复 有任何疑惑可以回复我~

Python2.X 默认编码方式为 ascii

0 回复 有任何疑惑可以回复我~

python3.4.4不存在编码问题

0 回复 有任何疑惑可以回复我~

这个貌似是python2 默认的asc码,python3 改成unicode了。

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

output输出问题

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信