已解决430363个问题，去搜搜看，总会有你想问的

apache spark加载内部文件夹

首页猿问 apache spark加载内部文件夹

apache spark加载内部文件夹

Python

慕丝7291255 2021-08-14 16:07:35

import findsparkfindspark.init('C:\spark')from pyspark.sql import SparkSessionspark = SparkSession.builder.getOrCreate()a = []i=1880while i<2018: a.append(str(i)+'/'+str(i)+'verr.csv') i = i+1dataset1 = spark.read.format('csv').option('header','true').load('C://venq/uyh/'+ a)我运行代码，但出现错误；dataset1 = spark.read.format('csv').option('header','true').load('C://venq/uyh/'+ a) TypeError: can only concatenate str (not "list" ) 到 str我有一个“C:\venq\uyh\1880\1880\verr.csv”格式的循环。我在嵌套文件夹中有 csv 文件。我想用火花阅读它们。但是我收到以下错误。我该如何解决这个问题？谢谢

查看完整描述

1 回答

鸿蒙传说

TA贡献1865条经验获得超7个赞

变量“a”是文件列表。

dataset1 = spark.read.format('csv').option('header','true').load('C://venq/uyh/'+ a)

在这里，您尝试将字符串 'C://venq/uyh/' 与 'a' 连接起来，这是一个列表 - 这会引发错误。尝试

root = r"C://venq/uyh/"

while i<2018:

a.append(root + str(i)+'/'+ str(i)+'verr.csv')

i = i+1

然后直接使用

dataset1 = spark.read.format('csv').option('header','true').load(a)

反对回复 2021-08-14

1 回答
0 关注
193 浏览

关注

添加回答

0/150

提交

取消

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

热搜

最近搜索清空

apache spark加载内部文件夹

apache spark加载内部文件夹

1 回答

添加回答