Python2和Python3中urllib的区别
http://blog.csdn.net/drdairen/article/details/51149498
http://blog.csdn.net/drdairen/article/details/51149498
2017-08-01
Python2和Python3的区别
http://blog.csdn.net/drdairen/article/details/51149498
http://blog.csdn.net/drdairen/article/details/51149498
2017-08-01
大家可以把输出的<table>改为<table border='1'>,加上边框输出后的表格更美观
2017-07-28
很开心,这是自己的代码,其他同学可以参考。可以爬取1000条数据呢嘿嘿https://github.com/jamieacejiang/baike_spider
https://github.com/Hiccup1/baike_spider 这是我的代码,可以成功爬取的,我也遇到第二条就failed,还有其他乱七八糟的错误,找了半天其实都是不细心写错了,写错字母什么的,少下划线,这代码是可以的,如果能点个star,点个星就更好了
2017-07-26
我觉得应该在add_new_urls方法下for循环中添加一个if判断,判断下获取的url是否在old_urls中。
for url in urls:
if url not in self.old_urls:
self.new_urls.add(url);
for url in urls:
if url not in self.old_urls:
self.new_urls.add(url);
2017-07-26