请问为什么这个爬虫没有爬出内容啊

Python

BIG阳 2019-02-26 12:45:33

item.py python-*- coding: utf-8 -* import scrapy class BokeItem(scrapy.Item): url=scrapy.Field() title=scrapy.Field() content=scrapy.Field() boke_spider.py python-*- coding: utf-8 -*- from scrapy.contrib.spiders import CrawlSpider ,Rule from scrapy.contrib.linkextractors import LinkExtractor from boke.items import BokeItem class BokeItem(CrawlSpider): name = 'blog' start_urls =['http://blog.sina.com.cn/s/blog_4701280b0102eo83.html'] def parse_torrent(self,response): torrent=BokeItem() torrent['url']=response.url torrent['title']=response.xpath("//h2[@class='titName SG_txta']/text()").extract()[0] torrent['content']=response.xpath("//div[@style='min-height:22px']/text()").extract()[0] return torrent

查看完整描述

3 回答

摇曳的蔷薇

TA贡献1793条经验获得超6个赞

from scrapy.contrib.spiders import CrawlSpider ,Rule

你调用的是CrawlSpider类,但是显然没有写任何的规则

建议改为Spider类,并将parse_torrent改名为parse,如下:

from scrapy.contrib.spiders import Spider
from boke.items import BokeItem
class BokeItem(Spider):

反对回复 2019-03-01

慕后森

TA贡献1802条经验获得超5个赞

试试去看看官方doc

反对回复 2019-03-01

忽然笑

TA贡献1806条经验获得超5个赞

试试看看这个博客，专门针对scrapy的

反对回复 2019-03-01

热搜

最近搜索清空

请问为什么这个爬虫没有爬出内容啊

请问为什么这个爬虫没有爬出内容啊

3 回答

添加回答