为了账号安全,请及时绑定邮箱和手机立即绑定

Python3 中的简单网络爬虫不产生输出。这是怎么回事?

Python3 中的简单网络爬虫不产生输出。这是怎么回事?

qq_笑_17 2021-09-11 19:11:34
我在运行此处列出的示例代码时遇到问题:https : //dev.to/pranay749254/build-a-simple-python-web-crawler。这是我试图运行的代码:import requestsfrom bs4 import BeautifulSoupdef web(page,WebUrl):    if(page>0):        url = WebUrl        code = requests.get(url)        plain = code.text        s = BeautifulSoup(plain, "html.parser")        for link in s.findAll('a', {'class':'s-access-detail-page'}):            tet = link.get('title')            print(tet)            tet_2 = link.get('href')            print(tet_2)web(1,'https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=Stomp+box&rh=i%3Aaps%2Ck%3AStomp+box')当我通过终端 shell(我正在运行 Ubuntu 16.04)运行上述代码时,程序不返回任何输出。我使用以下命令:$ python3 BasicCrawler.py我按回车键,终端上没有打印任何文本,就好像我没有运行任何脚本一样。我可以在程序中添加 print() 命令来验证它是否正在运行,但它似乎没有打印变量 tet 或 tet2。
查看完整描述

3 回答

?
波斯汪

TA贡献1811条经验 获得超4个赞

它没有打印任何内容,因为列表可能为空。这意味着类名“s-access-detail-page”的“a”标签在您解析的 html 文档中不包含任何内容。

打印 HTTP 响应的输出并尝试找出要迭代和获取数据的块的确切类。



查看完整回答
反对 回复 2021-09-11
  • 3 回答
  • 0 关注
  • 160 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号