首页猿问无法计算...

无法计算 beautifulsoup 字符串总和

Python

至尊宝的传说 2023-07-27 16:27:45

你好，我想抓取一个网页。我发布了我的代码，但我的目标行很重要。它不起作用。我的意思是没有错误，但也没有输出。我的代码就在那里。我需要对字符串求和，这就出现了问题。import requestsfrom bs4 import BeautifulSoupimport pandas as pdurl='http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php'html_content = requests.get(url).textsoup = BeautifulSoup(html_content, "lxml")url_course_main='http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php?fb='url_course=url_course_main+soup.find_all('option')[1].get_text() <---this linehtml_content_course=requests.get(a).textsoup_course=BeautifulSoup(html_content_course,'lxml')for j in soup_course.find_all('td'): print(j.get_text())当我改变我所展示的线路时url_course=url_course_main+'AKM'有效。也soup.find_all('option')[1].get_text()等于AKM。你能猜出错误在哪里吗？

查看完整描述

2 回答

沧海一幻觉

TA贡献1824条经验获得超5个赞

尝试使用requestsPython 的标准urllib.request. requests模块打开页面时出现问题：

import urllib.request

from bs4 import BeautifulSoup

url='http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php'

html_content = urllib.request.urlopen(url).read()

soup = BeautifulSoup(html_content, "lxml")

url_course_main='http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php?fb='

url_course=url_course_main+soup.find_all('option')[1].get_text()

html_content_course=urllib.request.urlopen(url_course).read()

soup_course=BeautifulSoup(html_content_course,'lxml')

for j in soup_course.find_all('td'):

print(j.get_text(strip=True))

印刷：

2019-2020 Yaz Dönemi AKM Kodlu Derslerin Ders Programı

...

反对回复 2023-07-27

潇湘沐

TA贡献1816条经验获得超6个赞

问题是在末尾get_text()给出空格并发送带有此空格的 url - 服务器找不到带有空格的文件。'AKM 'requests'AKM '

我用><字符串'>{}<'.format(param)来显示这个空间 - >AKM <- 因为没有><它似乎没问题。

代码需要get_text(strip=True)或get_text().strip()删除这个空格。

import requests

from bs4 import BeautifulSoup

url = 'http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php'

html_content = requests.get(url).text

soup = BeautifulSoup(html_content, 'lxml')

url_course_main = 'http://www.sis.itu.edu.tr/tr/ders_programlari/LSprogramlar/prg.php?fb='

param = soup.find_all('option')[1].get_text()

print('>{}<'.format(param)) # I use `> <` to show spaces

param = soup.find_all('option')[1].get_text(strip=True)

print('>{}<'.format(param)) # I use `> <` to show spaces

url_course = url_course_main + param

html_content_course = requests.get(url_course).text

soup_course = BeautifulSoup(html_content_course, 'lxml')

for j in soup_course.find_all('td'):

print(j.get_text())

反对回复 2023-07-27

2 回答
0 关注
130 浏览

关注

添加回答

0/150

提交

取消

热搜

最近搜索清空

无法计算 beautifulsoup 字符串总和

无法计算 beautifulsoup 字符串总和

2 回答

添加回答