最赞回答 / Effortjohn
html_outputer代码里,在写入<html>和<body>之间,再写入<head><meta charset="utf-8"></head>像下面这样: fout=open('output.html','w') fout.write("<html>") fout.write("<body>") fout.write("<head>") ...
2016-02-10
最新回答 / 梨狗子
https://docs.python.org/3.5/library/urllib.request.html 有改动试一下import urllib.request然后使用rullib.request.urlopen()方法详细介绍可到相对应的python版本的官方文档Library Reference查看
2016-02-03
最赞回答 / Effortjohn
出错原因应该是你没把 HtmlOutputer 给实例化。可以检查调度程序spider_main.py中的class SpiderMain里的def __init__(self):有没有这个语句:self.outputer = html_outputer.HtmlOutputer()
2016-01-27
最赞回答 / Ariesfish
代码中设定了输出编码是utf-8,但是没有在html head中加入该网页的编码格式,浏览器就用默认的编码方式去解析了。在<...code...>下面追加输出<...code...>就可以解决了。
2016-01-27