爬虫代码内容有疑问
content = i_item.xpath("//div[@class='info']//div[@class='bd']/p[1]/text()").extract() for i_content in content: content_s = "".join(i_content.split()) douban_item['introduce'] = content_s
老师这个地方的content获取的是50个段落,for循环的结果就是每一个douban_item['introduce']的赋值都只是遍历的最后一行“2011 / 法国 / 剧情 喜剧”,况且应该50个段落内容分成25份,每2个段落是一个内容