为了账号安全,请及时绑定邮箱和手机立即绑定

python爬虫输出的时候输出内容如何去掉前五个内容。

python爬虫输出的时候输出内容如何去掉前五个内容。

格瑞克爱鲜荔枝 2017-04-04 11:36:44
from urllib import requestimport urllibfrom bs4 import BeautifulSoupimport xlwtimport rebook=xlwt.Workbook(encoding='utf-8',style_compression=0)sheet1=book.add_sheet('mymovie',cell_overwrite_ok=True)url='http://www.meijuworld.com/category/uk' req = request.Request(url)req.add_header('user-agentkk','Mozilla/5.0')response = request.urlopen(req)html_doc = response.read()wholepage = BeautifulSoup(html_doc,'html.parser',from_encoding='UTF-8')meiju = wholepage.find_all('div',class_='an-widget-title')ds = re.findall('http://www.meijuworld.com/.*.html',str(meiju))for i in ds:    print(i)print('ok')#输出的结果是把美剧网页面的另外五个链接也抓到了,我不想要这前面五个链接,怎么去除,输出的时候只要后面的12个链接
查看完整描述

1 回答

?
格瑞克爱鲜荔枝

TA贡献1条经验 获得超1个赞

for i in ds:

    if ds.index(i)>=5:

        print(i)

#盆友解决了

查看完整回答
1 反对 回复 2017-04-04
  • 1 回答
  • 1 关注
  • 2980 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信