爬虫保存数据库的样子:
wKiom1d_RPmxOv9yAAE0EMsOK34224.jpg-wh_50
详细数据在json_text字段里面
安装使用方法:
git clone https://github.com/shancang/spider.git
pip install -r requirements.txt
mysql spider< sql/createTable.sql
修改配置
spider/config.py
# -*- coding: utf-8
#日志----------------------------------------
#日志目录
LOG_DIR= "/tmp/spider"
#日志级别:debug,info,warning,error,critical
LOG_LEVEL = "info"
#process-----------------------------------
#pid 文件
PID_FILE = "/tmp/spider/spider.pid"
#线程数量
THARED_NUMBER = 6
#数据库------------------------------------
DB_USER = "spider"
PASSWORD = "123456"
DB_HOST = "localhost"
PORT = "3306"
DB_NAME = "spider"
进程管理
python setup.py start #启动
python setup.py stop #停止
python setup.py status # 查看运行状态
具体详细请移步
https://github.com/shancang/spider
代码仅供学习交流,不得做商业使用,不得恶意使用,造成后果请自行负责。
©著作权归作者所有:来自51CTO博客作者shancang的原创作品,如需转载,请与作者联系,否则将追究法律责任
共同学习,写下你的评论
评论加载中...
作者其他优质文章