为了账号安全,请及时绑定邮箱和手机立即绑定

将数据帧上传到 s3 python

将数据帧上传到 s3 python

蝴蝶不菲 2023-06-13 17:21:35
我正在尝试像下面这样划分数据框:from io import StringIOimport pandas as pddata = """A,B,C87jg,28,3012h372,28,3011kj87,27,30112yh8,54,3010802h,53,30105d8b,52,3010"""df = pd.read_csv(StringIO(data), sep=',')for key, group in df.groupby(['C','B']):    group.to_csv(f'df_{key}.csv', index=False)这会将按数据帧分组的结果导出到本地机器。有没有办法执行此操作并将这些多个拆分 csv 上传到 s3(类似于 boto3 的 put_object)
查看完整描述

2 回答

?
人到中年有点甜

TA贡献1895条经验 获得超7个赞

您也可以使用必须安装的s3fs 。可以使用 完成安装pip,例如:

pip install s3fs

根据您的代码验证的示例:


import os


from io import StringIO

import pandas as pd

import s3fs


# I did not use my default aws profile

# so had to provide key and secret. If you use

# the default aws profile, providing `key`

# and `secret` should not be required

fs = s3fs.S3FileSystem(

        anon=False,

        key='<access_key>',

        secret='<secret_key>')


data = """ 

A,B,C

87jg,28,3012

h372,28,3011

kj87,27,3011

2yh8,54,3010

802h,53,3010

5d8b,52,3010

"""

df = pd.read_csv(StringIO(data), sep=',')


for key, group in df.groupby(['C','B']):

    group.to_csv(fs.open(f's3://<bucket-name>/df_{key[0]}-M{key[1]}.csv', 'w'), index=False)

代码正确上传文件:

//img2.sycdn.imooc.com/6488353c00016f2102900301.jpg

查看完整回答
反对 回复 2023-06-13
?
一只萌萌小番薯

TA贡献1795条经验 获得超7个赞

from io import StringIO

import pandas as pd

import boto3



data = """

A,B,C

87jg,28,3012

h372,28,3011

kj87,27,3011

2yh8,54,3010

802h,53,3010

5d8b,52,3010

"""

df = pd.read_csv(StringIO(data), sep=',')


client = boto3.client('s3')

for key, group in df.groupby(['C', 'B']):

    group.to_csv(f'df_{key}.csv', index=False)

    client.upload_file(f'df_{key}.csv', 'my-another-test-bucket-2',

                       f'df_{key[0]}-M{key[1]}.csv')

S3 桶

//img1.sycdn.imooc.com//6488354900019e8806510497.jpg

查看完整回答
反对 回复 2023-06-13
  • 2 回答
  • 0 关注
  • 130 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信