为了账号安全,请及时绑定邮箱和手机立即绑定

python 实现汽车之家车型数据爬虫

标签:
Python


爬虫保存数据库的样子:

wKiom1d_RPmxOv9yAAE0EMsOK34224.jpg-wh_50

详细数据在json_text字段里面

安装使用方法:

git clone https://github.com/shancang/spider.git 

pip install -r requirements.txt

mysql spider< sql/createTable.sql

修改配置

spider/config.py

# -*- coding: utf-8

#日志----------------------------------------

#日志目录

LOG_DIR= "/tmp/spider"

#日志级别:debug,info,warning,error,critical

LOG_LEVEL = "info"

#process-----------------------------------

#pid 文件

PID_FILE = "/tmp/spider/spider.pid"

#线程数量

THARED_NUMBER = 6

#数据库------------------------------------

DB_USER = "spider"

PASSWORD = "123456"

DB_HOST = "localhost"

PORT = "3306"

DB_NAME = "spider"

进程管理

python setup.py start #启动

python setup.py stop  #停止

python setup.py status # 查看运行状态

具体详细请移步

https://github.com/shancang/spider   

代码仅供学习交流,不得做商业使用,不得恶意使用,造成后果请自行负责。

©著作权归作者所有:来自51CTO博客作者shancang的原创作品,如需转载,请与作者联系,否则将追究法律责任


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消