为了账号安全,请及时绑定邮箱和手机立即绑定

python遇见数据采集

难度初级
时长 2小时 5分
学习人数
综合评分9.63
95人评价 查看评价
9.7 内容实用
9.5 简洁易懂
9.7 逻辑清晰
http://pypi.python.org/pypi/pdfminer3k
Traceback (most recent call last):
File "D:/PycharmProjects/untitled/imooc/wiki.py", line 12, in <module>
if not re.search("\.(jpg|JPG)$",url1["href"]):
TypeError: string indices must be integers
12306比湾湾反爬虫做的好多了
为beautifulsoup疯狂打call
收获很多,感觉是用python做爬虫,真的好简洁

最赞回答 / 愤怒的软绵绵
我也遇到过 说明pdfminer3k安装过程中有没装成功的部分 把没装成功的装一下就可以了

最赞回答 / 慕婉清5269197
在cmd命令行中输入pip install pymysql,如果不行换easy_install pymysql 。如图:<...图片...>
很好的教程,给老师一颗小❤️❤️
for 循环里面获取数据库连接吗?每次获取一次?
其实就是说,即使你爬他他也不能把你怎么样,只是盗亦有道
如果显示是类型错误的,可以先看一下自己数据库那个表id那栏有没有点下面的自动递增!

最新回答 / 天才小彩笔i
看下数据库启动了没有
课程须知
熟悉Python语言的语法,掌握Python的正则表达式模块,懂得如何使用Python操作数据库
老师告诉你能学到什么?
使用Python内置urllib模块和第三方BeautifulSoup模块进行数据采集和提取、MySQL数据库的操作、TXT和PDF文档的读取,以及robots协议和相关注意事项

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消