为了账号安全,请及时绑定邮箱和手机立即绑定

请问为什么这个爬虫没有爬出内容啊

请问为什么这个爬虫没有爬出内容啊

BIG阳 2019-02-26 12:45:33
item.py python-*- coding: utf-8 -* import scrapy class BokeItem(scrapy.Item): url=scrapy.Field() title=scrapy.Field() content=scrapy.Field() boke_spider.py python-*- coding: utf-8 -*- from scrapy.contrib.spiders import CrawlSpider ,Rule from scrapy.contrib.linkextractors import LinkExtractor from boke.items import BokeItem class BokeItem(CrawlSpider): name = 'blog' start_urls =['http://blog.sina.com.cn/s/blog_4701280b0102eo83.html'] def parse_torrent(self,response): torrent=BokeItem() torrent['url']=response.url torrent['title']=response.xpath("//h2[@class='titName SG_txta']/text()").extract()[0] torrent['content']=response.xpath("//div[@style='min-height:22px']/text()").extract()[0] return torrent
查看完整描述

3 回答

?
摇曳的蔷薇

TA贡献1793条经验 获得超6个赞

from scrapy.contrib.spiders import CrawlSpider ,Rule

你调用的是CrawlSpider类,但是显然没有写任何的规则

建议改为Spider类,并将parse_torrent改名为parse,如下:

from scrapy.contrib.spiders import Spider
from boke.items import BokeItem
class BokeItem(Spider):
查看完整回答
反对 回复 2019-03-01
?
慕后森

TA贡献1802条经验 获得超5个赞

试试去看看官方doc

查看完整回答
反对 回复 2019-03-01
?
忽然笑

TA贡献1806条经验 获得超5个赞

试试看看这个博客,专门针对scrapy

查看完整回答
反对 回复 2019-03-01
  • 3 回答
  • 0 关注
  • 817 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信