为了账号安全,请及时绑定邮箱和手机立即绑定

使用 python 将 HTML 表格转换为 CSV 文件

使用 python 将 HTML 表格转换为 CSV 文件

守着一只汪 2023-11-09 22:16:44
我对 pandas 很陌生,所以我想用 pandas 将此 HTML 表转换为 CSV 文件,但是我的 CSV 文件给了我一个奇怪的标志,并且它没有设法将所有表转换为 CSV。这是我的代码。我读到有关使用 beautifulsoup 但我不太确定如何使用该功能。import as pandasdf = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR'              'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1')df[0].to_csv('ENR3.0.csv')谢谢你!编辑:我已将导入更改为,import pandas as dp但仍然无法将所有 HTML 表转换为 CSV 文件。非常感谢您的所有帮助!
查看完整描述

2 回答

?
Cats萌萌

TA贡献1805条经验 获得超9个赞

您可以使用pandas它本身来执行此操作。你把声明弄乱了import。以下是正确的做法:


import pandas as pd

df = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR'

              'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1')


df[0].to_csv('ENR3.0.csv', index = False)

如果您想获取dataframes变量中的所有内容df,请将最后一行替换为:


for x in range(len(df)):

    df[x].to_csv(f"CSV_File_{x+1}", index = False)


查看完整回答
反对 回复 2023-11-09
?
慕少森

TA贡献2019条经验 获得超9个赞

import 语句存在问题
它应该是import pandas as pd而不是,因为您在下面的代码中import as pandas使用别名。pd

研究一下beautiful soup,使用lxml解析器解析所需数据(速度非常快)。

如果需要任何其他帮助,请在这篇文章中发表评论,我们将尝试解决您的问题:)



在您的代码中进行了更正:

import pandas as pd

df = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR'

              'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1')


df[0].to_csv('ENR3.0.csv')


查看完整回答
反对 回复 2023-11-09
  • 2 回答
  • 0 关注
  • 175 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信