2 回答
TA贡献1841条经验 获得超3个赞
当我这样编码时,将文件从 gcloud 导入到数据框工作:
from tensorflow.python.lib.io import file_io
from pandas.compat import StringIO
import pandas as pd
def read_data(gcs_path):
file_stream = file_io.FileIO(gcs_path, mode='r')
data = pd.read_csv(StringIO(file_stream.read()), names=['various', 'column', 'names'])
return data
my_df = read_data('gs://mybucket/data/file.csv')
但我无法逆转这个过程。
然而,GCS 对我有用:
import google.cloud.storage as gcs
client = gcs.Client()
bucket = client.bucket('my-bucket')
blobs = list(bucket.list_blobs(prefix='data/'))
my_df.to_csv('tmp.csv')
local_tmp_path = ('tmp.csv')
target_blob = bucket.blob('data/file.csv')
target_blob.upload_from_file(open(local_tmp_path, 'r'))
TA贡献1830条经验 获得超3个赞
您可以将 csv 文件保存在您的 VM 中,然后用于gsutil
将其保存在您的存储桶中。
Python:
my_df.to_csv("data.csv")
壳:
gsutil data.csv gs://my_bucket/
添加回答
举报