简介”introduce”在不用循环语句时信息全,但写了循环语句,只有第二行信息
content=i_item.xpath(".//div[@class='bd']/p[@class='']/text()").extract() #数据处理(多行数据)实现格式化,但未实现将所有信息整理 for i_content in content: content_s="".join(i_content.split()) douban_item['introduce']=content_s 和 douban_item['introduce']==i_item.xpath(".//div[@class='bd']/p[@class='']/text()").extract_first()
循环语句使用后,只显示:
1994 / 美国 / 犯罪 剧情
而我们用XPATH时,可以看到路径信息应该是:
导演: 弗兰克·德拉邦特 Frank Darabont 主演: 蒂姆·罗宾斯 Tim Robbins /...
1994 / 美国 / 犯罪 剧情
请问各位有啥办法爬取这个路径下的所有信息