课程
                    
                        /后端开发
                        
                            /Python
                        
                        /python遇见数据采集

为什么正确输入代码后运行结果是空白呢？

from urllib.request import urlopen
from bs4 import BeautifulSoup as bs
import re

resp = urlopen("https://en.wikipedia.org/wiki/Main_Page").read().decode("utf-8")
soup = bs(resp,"html.parser")
listUrls = soup.findAll("a", herf=re.compile("^/wiki/"))
for url in listUrls:
print(url["herf"])

慕粉3878587

2016-09-01

源自：python遇见数据采集 3-5

关注问题我要回答

2307

操作

收起

4 回答

秋名山车神回答被采纳 +3 积分
2016-09-01

最后一行 print(url["herf"])

里面的 herf 改成 href 试试看

0 回复有任何疑惑可以回复我~

#1

慕粉3878587 提问者

非常感谢！

2016-09-03 回复有任何疑惑可以回复我~

#2

慕粉3878587 提问者

老师，假如程序没写错的情况下采集结果空白，怎么判断网站反爬虫机制起作用了呢？有没有相关的课程学习下？

2016-09-03 回复有任何疑惑可以回复我~

秋名山车神
2016-09-03

没有写错的情况下，我还没有遇到过采集空白的问题，如果网站有防爬虫的机制，一般都是采集了一个错误页面，或者是和你使用浏览器看到的样子不一样的HTML代码。

网站是服务器来判断的，而服务器没有多么的聪明，能够区分人和爬虫，再精密的检查，也能够通过程序代码来破解，所以大部分网站防爬虫最简单的手段就是通过验证码和验证问题，就算是百度也是这么做的。

0 回复有任何疑惑可以回复我~

慕粉3878587 提问者
2016-09-03

老师，假如程序没写错的情况下采集结果空白，怎么判断网站反爬虫机制起作用了呢？有没有相关的课程学习下？

0 回复有任何疑惑可以回复我~

慕粉3878587 提问者
2016-09-03

真是打错了！汗颜，谢谢老师！

0 回复有任何疑惑可以回复我~

举报

0/150

提交

取消

python遇见数据采集

参与学习 59666 人
解答问题 200 个

本教程让你初步掌握Python进行数据采集，创造属于你的价值

本课相似问答

1 回答运行结果是空

1 回答近照老师代码，没有结果输出怎么办？

1 回答resp=request.urlopen(req)这段代码为什么要运行两次？只运行一次为什么会出问题？

1 回答运行结果是一行为一段，没有像pdf版本一样，一段分为好几行

1 回答为什么我的运行不了啊

搜索更多本课相关问答

为什么正确输入代码后运行结果是空白呢？

我要回答关注问题

意见反馈帮助中心 APP下载