为了账号安全,请及时绑定邮箱和手机立即绑定

Pyarrow 数据集读取特定列和特定行

Pyarrow 数据集读取特定列和特定行

白猪掌柜的 2022-05-24 10:12:26
有没有办法使用 pyarrow parquet 数据集来读取特定的列,如果可能的话过滤数据而不是将整个文件读入数据框?
查看完整描述

1 回答

?
慕桂英546537

TA贡献1848条经验 获得超10个赞

截至目前pyarrow==2.0.0,这至少是可能的pyarrow.parquet.ParquetDataset

读取特定的列,它的readread_pandas方法有一个columns选项。您也可以使用pandas.read_parquet.

读取特定行,它的__init__方法有一个filters选项。


查看完整回答
反对 回复 2022-05-24
  • 1 回答
  • 0 关注
  • 115 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信