我在运行此处列出的示例代码时遇到问题:https : //dev.to/pranay749254/build-a-simple-python-web-crawler。这是我试图运行的代码:import requestsfrom bs4 import BeautifulSoupdef web(page,WebUrl): if(page>0): url = WebUrl code = requests.get(url) plain = code.text s = BeautifulSoup(plain, "html.parser") for link in s.findAll('a', {'class':'s-access-detail-page'}): tet = link.get('title') print(tet) tet_2 = link.get('href') print(tet_2)web(1,'https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=Stomp+box&rh=i%3Aaps%2Ck%3AStomp+box')当我通过终端 shell(我正在运行 Ubuntu 16.04)运行上述代码时,程序不返回任何输出。我使用以下命令:$ python3 BasicCrawler.py我按回车键,终端上没有打印任何文本,就好像我没有运行任何脚本一样。我可以在程序中添加 print() 命令来验证它是否正在运行,但它似乎没有打印变量 tet 或 tet2。
3 回答

波斯汪
TA贡献1811条经验 获得超4个赞
它没有打印任何内容,因为列表可能为空。这意味着类名“s-access-detail-page”的“a”标签在您解析的 html 文档中不包含任何内容。
打印 HTTP 响应的输出并尝试找出要迭代和获取数据的块的确切类。
添加回答
举报
0/150
提交
取消