为了账号安全,请及时绑定邮箱和手机立即绑定

python遇见数据采集

难度初级
时长 2小时 5分
学习人数
综合评分9.63
95人评价 查看评价
9.7 内容实用
9.5 简洁易懂
9.7 逻辑清晰
有点纳闷啊,里面的sql语句中,ID并没有赋值啊

最赞回答 / 益达吃益达
#个人见解#当使用的字段名、表名等与MySQL保留字冲突时(如创建名为desc的字段、往desc表中插入记录),如果不加反引号``,无法执行成功。因此,INSERT `desc` VALUES('aa','bb');可以执行成功。而INSERT desc VALUES('aa','bb');执行失败。而当你所使用的的字段名、表名不含有保留字时,可以不加反引号``

最新回答 / 芳芳菲菲
你要么写charset='utf8',要么写charset='utf8mb4',而不是'utf8md4'。
买一本图灵系列的 python网络数据采集 配合本视频学习效果最佳!!!
(这里其实就是将书里面的内容录的视频)
言简意赅,思路清晰,之前在书上懵懂的知识点 一下被点醒了, 期待作者出更多的视频
@开心与无限 选中LAParams alt+回车自动导入对应模块
mac 10.10 安装sudo pip3 pdfminer3k pypi网站上下载pdfminer3k文件解压2次
验证安装 cd ~/Downloads/pdfminer3k-1.3.1/tools
python3 pdf2txt.py ../samples/simple1.pdf
竟然成功了!!开心
终于有python3的视频了
#我的目的是数据的收集与分析,爬虫就是我收集数据的工具,
!以面向对象的编程范式来分功能模块的写爬虫,爬虫集合url管理,网页下载,网页解析,数据储存,以达到省时省力的获取数据,这才是一个好爬虫呢~~~
#这是我数据收集分析的开始(纯爱好),开始就有这么好的课,我多幸运啊~~哈~
谢谢,老师~
#秋名山上行人稀,常有车神较高低.如今车道依旧在,不见当年老司机.
#车神的这个课程,安全覆盖了一个爬虫的功能块———网页下载,网页解析,数据写于与储存,按使用的需求来说,已经完全够用的的,首先说,这个课程真的很好!我很开心。但是本课程我希望车神能用面向对象的编程范式,来做个示例,
因为慕课网另一个爬虫视频就是教以面向对象来写的,而且分了url管理器,网页下载器,网页解析器(这些应该是对象吧,我小白),但是我基础有点差,而且那位老师一直用快捷键,让我迷迷糊糊的,
#总之,这个课程教我实用的东西比较多(bs,文件写入,数据库储存),另一个教我的爬虫结构思想,

最新回答 / Explorer_C
原本我也是遇到这个问题搜索全网发现就这么一个帖子相关-。-其实程序输出没错,是理解错误的原因。BS4解析HTML文件,就很直接的,看到<p>这个标签符合条件,返回值为True,打印出来的就是<p>标签里的内容呀,只是恰好包含了几个<a>标签,因为这些<a>标签是<p>标签的子节点呀。而并没有单独地把<a>标签打印出来就说明程序的输出是没问题的。

最新回答 / 傻宝3
发现是自己写错的。。。太粗心了
```
ImportError: cannot import name &#039;request&#039;
```
这个错误是定义文件名成urllib.py引起的,解决方法是:重命名为其他名字
课程须知
熟悉Python语言的语法,掌握Python的正则表达式模块,懂得如何使用Python操作数据库
老师告诉你能学到什么?
使用Python内置urllib模块和第三方BeautifulSoup模块进行数据采集和提取、MySQL数据库的操作、TXT和PDF文档的读取,以及robots协议和相关注意事项

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消