使用 python 将 HTML 表格转换为 CSV 文件

我对 pandas 很陌生，所以我想用 pandas 将此 HTML 表转换为 CSV 文件，但是我的 CSV 文件给了我一个奇怪的标志，并且它没有设法将所有表转换为 CSV。这是我的代码。我读到有关使用 beautifulsoup 但我不太确定如何使用该功能。import as pandasdf = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR' 'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1')df[0].to_csv('ENR3.0.csv')谢谢你！编辑：我已将导入更改为，import pandas as dp但仍然无法将所有 HTML 表转换为 CSV 文件。非常感谢您的所有帮助！

查看完整描述

2 回答

Cats萌萌

TA贡献1805条经验获得超9个赞

您可以使用pandas它本身来执行此操作。你把声明弄乱了import。以下是正确的做法：

import pandas as pd

df = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR'

'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1')

df[0].to_csv('ENR3.0.csv', index = False)

如果您想获取dataframes变量中的所有内容df，请将最后一行替换为：

for x in range(len(df)):

df[x].to_csv(f"CSV_File_{x+1}", index = False)

反对回复 2023-11-09

慕少森

TA贡献2019条经验获得超9个赞

import 语句存在问题
它应该是import pandas as pd而不是，因为您在下面的代码中import as pandas使用别名。pd

研究一下beautiful soup，使用lxml解析器解析所需数据（速度非常快）。

如果需要任何其他帮助，请在这篇文章中发表评论，我们将尝试解决您的问题:)

在您的代码中进行了更正：

import pandas as pd

df = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR'

'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1')

df[0].to_csv('ENR3.0.csv')

反对回复 2023-11-09

热搜

最近搜索清空

使用 python 将 HTML 表格转换为 CSV 文件

使用 python 将 HTML 表格转换为 CSV 文件

2 回答

添加回答