我正在尝试从网站上抓取数据以进行练习分析。我在特定网站上遇到了一些问题。该网站是关于西雅图地区的警方报告的。我已经阅读了很多文章,但无法得到答案。网址是:https ://data.seattle.gov/Public-Safety/real-time-911/nvqc-w7eg我知道我应该使用漂亮的汤并尝试找到一个关键字进行搜索,然后将类型转换为文本。但是,我一直没有。import requestsURL = 'https://data.seattle.gov/Public-Safety/real-time-911/nvqc-w7eg'page = requests.get(URL) from bs4 import BeautifulSoupsoup = BeautifulSoup(page.content)我的目标是将表格转换为.csv文件。有人可以帮我吗?
3 回答
慕尼黑5688855
TA贡献1848条经验 获得超2个赞
创建 BeautifulSoup 对象:
soup = BeautifulSoup(page.text, "lxml")
或者,
soup = BeautifulSoup(page.text, "html.parser")
或者,
soup = BeautifulSoup(page.content, 'html.parser')
我认为,您应该使用它,lxml
因为它具有良好的性能。
喵喵时光机
TA贡献1846条经验 获得超7个赞
lxml使用或解析 HTML html.parser。lxml有些比其他的有优势,包括非常快的事实。
URL = 'https://data.seattle.gov/Public-Safety/real-time-911/nvqc-w7eg'
page = requests.get(URL)
from bs4 import BeautifulSoup
soup = BeautifulSoup(page.text, "html.parser") #or lxml, htmlparser is just example
与其直接把它放在没有字符串的地方,不如把它和字符串一起放进去,这样 Python 就知道你正在处理解析器。
添加回答
举报
0/150
提交
取消