课程
                    
                        /后端开发
                        
                            /Python
                        
                        /Python最火爬虫框架Scrapy入门与实践

拿到下一页的链接就是没有翻页

# -*- coding: utf-8 -*-

import scrapy

from Lz.items import LzItem

class LzSpiderSpider(scrapy.Spider):

name = 'Lz_spider'

allowed_domains = ['xxgk.linzhang.gov.cn']

start_urls = ['http://xxgk.linzhang.gov.cn/zxxxgk/index_1.html']

def parse(self, response):

info_lists = response.xpath("//div[@class='lzgk_wenjianlist']/table//tr")

for content in info_lists:

lz_item = LzItem()

lz_item['title'] = content.xpath("./td[1]/a/text()").extract_first()

lz_item['times'] = content.xpath("./td[4]/text()").extract_first()

yield lz_item

next_link = response.xpath("//div[@class='page']/a[7]/@href").extract()

if next_link:

next_link = next_link[0]

yield scrapy.Request("http://xxgk.linzhang.gov.cn/zxxxgk/"+next_link,callback=self.parse)

慕粉1472488217

2020-03-29

源自：Python最火爬虫框架Scrapy入门与实践

关注问题我要回答

631

操作

收起

0/150

提交

取消

Python最火爬虫框架Scrapy入门与实践

参与学习 67422 人
解答问题 235 个

做为爬虫工程师Python Scrapy主流爬虫框架你必须要会！

进入课程

本课相似问答

2 回答未爬取到完整的电影链接，所有链接相同？

2 回答没有报错,但是没有抓取到任何网页信息

1 回答无法进入下一个页面

2 回答老师，如果在这个页面 https://movie.douban.com/top250中，只获取每条电影的链接，然后还要爬这个链接对应的页面信息。这样应该怎么设计和实现呢？

1 回答存入mongodb里的数据只有第一页的

搜索更多本课相关问答

拿到下一页的链接就是没有翻页

我要回答关注问题

热搜

最近搜索清空

拿到下一页的链接就是没有翻页

本课相似问答

拿到下一页的链接就是没有翻页