最赞回答 / WHXSCNU
本人系统win7,Python3.5,按照百度上win10的做法:fileout = open('output.html', 'w', encoding='utf-8'),能显示中文
2016-03-07
最赞回答 / 迷茫的小点点
这样生成地htm网页是utf-8编码的,但浏览器显示时不是按utf-8读取的,所以乱码。例:我用360的默认GBK,右键编码选utf-8显示就好。或者在输出网页加上以下: fout.write('<head><meta charset="utf-8"></head>')这样浏览器会识别出是utf-8编码。
2016-03-01
最新回答 / stonesray
不好做吧,毕竟就算是指定页面,当页面更新后还需要更新代码,通用的爬虫适配是个大问题,除非针对某类网站格式相同的页面......我感觉是这个样的哈~
2016-02-21
最赞回答 / PhoebeChen
参考许多人的问题可以通过把try和except的部分注解掉然后执行的时候会出现TypeError: unbound method parse() must be called with HtmlParser instance as first argument (got str...错误里面提到HtmlParser出错原因应该是你没把 HtmlParser 给实例化检查调度程序spider_main.py中的class SpiderMain里的def __init__(self):发现 self.pars...
2016-02-19