为了账号安全,请及时绑定邮箱和手机立即绑定

python爬虫的问题

python爬虫的问题

Leo_clip 2017-08-16 09:33:38
import urllib.request import re user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' headers = { 'User-Agent' : user_agent } url='http://waimai.baidu.com/waimai/shoplist/7ff6ee1800f46e66' request=urllib.request.Request(url,headers=headers) response=urllib.request.urlopen(request) pagecode=response.read().decode('utf-8') pattern=re.compile('<li class="list-item shopcard data.*?<div class="title" title=(.*?)</div>') items=re.findall(pattern,pagecode) for item in items:     print(item[0])目的是爬取外卖商家的名称,url在代码里了不知道为什么爬取不到任何信息求解
查看完整描述

2 回答

?
慕先生4543078

TA贡献52条经验 获得超38个赞

有的网站是禁止爬取的。

查看完整回答
反对 回复 2017-08-21
  • 2 回答
  • 0 关注
  • 1705 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信