Python2.7
两个地方要改
1、正则表达式这里改成soup.find_all('a',href = re.compile(r"/item/"))
2、html_outputer向文件写东西时改成fout.write(("<td>%s</td>" % data['summary']).encode('utf-8'))这种格式
我的代码有一些改动,想看的朋友去下面
git代码:https://github.com/DongChengrong/imooc/tree/master/src/baike_spider
两个地方要改
1、正则表达式这里改成soup.find_all('a',href = re.compile(r"/item/"))
2、html_outputer向文件写东西时改成fout.write(("<td>%s</td>" % data['summary']).encode('utf-8'))这种格式
我的代码有一些改动,想看的朋友去下面
git代码:https://github.com/DongChengrong/imooc/tree/master/src/baike_spider
2017-09-09
如果不能CTRL +1 快速创建类或者函数的话,看看自己使用的是什么编译器,百度快捷键。
例如我用的是pycharm,快捷键是alt + 回车。
或者自己去settings里面的keymap找一找自己的快捷键是什么。
例如我用的是pycharm,快捷键是alt + 回车。
或者自己去settings里面的keymap找一找自己的快捷键是什么。
2017-09-09
特殊情境处理:
1.需要用户登录才能访问(HTTPCookieProcessor)
2.需要代理才能访问(ProxyHandler)
3.协议使用HTTPS加密访问(HTTPSHandler)
4.URL自动跳转(HTTPRedirectHandler)
1.需要用户登录才能访问(HTTPCookieProcessor)
2.需要代理才能访问(ProxyHandler)
3.协议使用HTTPS加密访问(HTTPSHandler)
4.URL自动跳转(HTTPRedirectHandler)
2017-09-04
视频教程要比文字教程好很多很多,一篇千字的文档内容可能会折磨你几个钟。但是慕课的视频教程都是几分钟,每个视频慢慢看,不明白就停顿或者多看几遍,总比看着文档钻牛角尖好!
学习就是一个纠错矫正的过程。个人觉得老师也不是万能的,老师的精力也是有限,哪些基础知识不懂,也就只能返回去看一些基础的,有征对性的教材。
根据二八定律,技能重要的是那20%的基础,往往要我们在整个学习的过程中付出80%的的精力和时间放在这上面。
学习就是一个纠错矫正的过程。个人觉得老师也不是万能的,老师的精力也是有限,哪些基础知识不懂,也就只能返回去看一些基础的,有征对性的教材。
根据二八定律,技能重要的是那20%的基础,往往要我们在整个学习的过程中付出80%的的精力和时间放在这上面。
2017-09-03