first method
200
Traceback (most recent call last):
File "C:/Python27/test/pachong.py", line 9, in <module>
print len(response1.read())
File "C:\Python27\lib\socket.py", line 355, in read
data = self._sock.recv(rbufsize)
200
Traceback (most recent call last):
File "C:/Python27/test/pachong.py", line 9, in <module>
print len(response1.read())
File "C:\Python27\lib\socket.py", line 355, in read
data = self._sock.recv(rbufsize)
2017-05-16
大家写代码真的如果没有IDE的话,如果有IDE的话 其实还是很容易出错,
刚开始应该不用try
因为 这样很容易找不到出错的地方,
去掉后找错误 那是编译器帮你找了 =-=
刚开始应该不用try
因为 这样很容易找不到出错的地方,
去掉后找错误 那是编译器帮你找了 =-=
2017-05-15
我第一次看也没看下去。后来因为需要在网上看了一些教程,都是一笔带过,或者直接给源码。只有了解了一下名词和流程,再看老师的视频,感觉真是简单易懂。
2017-05-15
已采纳回答 / 请叫我百度
第一:baike_spider是你创建的包,你所说的url_manager肯定是放在包中的代码,是可以import进去了。第二:只爬取一个网址就结束应该是html_parser中的代码有问题,比如课程中的匹配策略与现在的百度Python词条不匹配,需要改成href = re.compile(r"/item/.*") 再或者find_all 不要丢了下划线,我就没注意到下划线,所以只输出了1条记录就craw faild了。
2017-05-15