为了账号安全,请及时绑定邮箱和手机立即绑定

python遇见数据采集

难度初级
时长 2小时 5分
学习人数
综合评分9.63
95人评价 查看评价
9.7 内容实用
9.5 简洁易懂
9.7 逻辑清晰
副标题写的好y挡,哈哈
google应用postman
其实我更希望了解如何用Python编辑Excel
抓数据是我学Python的乐趣所在,不过我习惯对百度下手。
import re # 通过正则表达式查找a标签中的链接
pattern = '<a\s+.*href=["\'](.+)["\']\s*.*/*>'
href = re.findall(pattern,html)

讲师回答 / 秋名山车神
你试试安装64位的可以吗

最新回答 / ccc3ccc
纠结的方法 查看它生成的log file日志文件看什么原因导致(权限,环境变量,路径 等等...)简单的方法 重新下载一个新的安装包,再次安装
怎么一直是黑屏,视频无法观看
老师的课程是不是参照了python数据采集那本书,看过那本书,感觉有点像
确实测试中无法存储的错误出在这一句:with connection.cursor() as cursor
表面上是出现在这一句:cursor.execute(sql,('**','**'))
如楼下所言,改成如下后正常存储 cur = connection.cursor()
测试环境:py2.7 mysql5.7.15

最新回答 / 皓羽如风
我用的是Eclipse中PyDev 插件编程,Python2.7.12对应的MySQL版本是MySQL-python-1.2.4b4.win32-py2.7.exe,我一直使用的是cursor=connection.cursor()表达。Python2.7我没试过,但是在3.4.3中(需要安装pymysql插件),用那个语句会报错。
老师,怎么google用不了啊
终于有Python3的课了

最新回答 / 慕移动9181930
可以啊,我用谷歌试过,没有问题。你没有写其他浏览器的兼容代码,所以有问题能实现就行,不过你和题目要求还是有点差别哦~你可以在进行优化一下,没有点击的时候标签下有一条线的,你可以把这个优化掉
课程须知
熟悉Python语言的语法,掌握Python的正则表达式模块,懂得如何使用Python操作数据库
老师告诉你能学到什么?
使用Python内置urllib模块和第三方BeautifulSoup模块进行数据采集和提取、MySQL数据库的操作、TXT和PDF文档的读取,以及robots协议和相关注意事项

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消