已采纳回答 / Yaffy
#coding:utf-8import urllib2import cookieliburl = "http://www.baidu.com"print '第一种方法'response1 = urllib2.urlopen(url)print response1.getcode()print len(response1.read)第一种方法做后获取长度时response1.read 你少个括号应该是response1.read()
2016-02-24
最新回答 / stonesray
不好做吧,毕竟就算是指定页面,当页面更新后还需要更新代码,通用的爬虫适配是个大问题,除非针对某类网站格式相同的页面......我感觉是这个样的哈~
2016-02-21
最赞回答 / PhoebeChen
参考许多人的问题可以通过把try和except的部分注解掉然后执行的时候会出现TypeError: unbound method parse() must be called with HtmlParser instance as first argument (got str...错误里面提到HtmlParser出错原因应该是你没把 HtmlParser 给实例化检查调度程序spider_main.py中的class SpiderMain里的def __init__(self):发现 self.pars...
2016-02-19