为了账号安全,请及时绑定邮箱和手机立即绑定

python遇见数据采集

难度初级
时长 2小时 5分
学习人数
综合评分9.63
95人评价 查看评价
9.7 内容实用
9.5 简洁易懂
9.7 逻辑清晰

已采纳回答 / 慕斯9498634
设置环境变量,把C:\Python27\Lib\site-packages这个路径加进去

最赞回答 / BekeyChao
from pdfminer.converter import PDFPageAggregatorfrom pdfminer.layout import LAParams
感谢老师的讲解~~
听的有些晕 不过老师总体讲得不错~ 感谢~

最新回答 / qq_清蒸红烧_03602510
右键点击urls表,选设计表,然后点下面的自动增长,我就是这样可以了
老师使用的pdf例子好牛
超級贊,下一個亿万富翁應該是你

最赞回答 / syaofox
看这里 http://outofmemory.cn/code-snippet/37910/python-requests-request-http-post-payload-method

最新回答 / 滴滴艾斯
自己解答一波,是因为漏掉一个逗号。。。

已采纳回答 / 慕粉3773557
是的,因为python提供了大量的包,下载网页用urllib 解析网页用bs 数据分析用xx 还有很多的开源数据挖掘平台,如weka,都提供了python的接口,在python里调用他们会很简单
车神太厉害了,佩服and感谢!
看了这个视频才知道了postman的另一个用法 尤其是bulk那个用法 很实用啊
64位真是坑爹,设置不了环境变量
@老贤
https://github.com/PyMySQL/PyMySQL
PyMySQL的官方文档里的示例,就是 "import pymysql.cursors"

以前看到过相关的问题,刚才找到了。。。
http://stackoverflow.com/questions/14043920/how-can-module-be-visible-from-one-import-and-not-visible-from-another/14044082#14044082

建议还是按官方给的来,用 import pymysql.cursors
报告老师,,,agent 不读 鹅根特 读 A禁特
课程须知
熟悉Python语言的语法,掌握Python的正则表达式模块,懂得如何使用Python操作数据库
老师告诉你能学到什么?
使用Python内置urllib模块和第三方BeautifulSoup模块进行数据采集和提取、MySQL数据库的操作、TXT和PDF文档的读取,以及robots协议和相关注意事项

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消