课程
/云计算&大数据
/大数据
/Spark从零开始
就拿老师举的例子,我如果500G文件分成5个文件,那我rdds怎么引入这五个文件呢?按照这上面的说法一次就只能引一个分片的文件啊
2019-11-24
源自:Spark从零开始 4-1
正在回答
老师讲的那个500G文件分成5个文件是建立在文件在hdfs的基础上的,使用hdfs的文件系统路径,一次性拿文件全部内容
part-*
举报
本课程旨在让同学们了解Spark基础知识,掌握Spark基础开发.
1 回答导入问题。。
2 回答文件路径的问题
2 回答org.apache.spark的包导入失败
1 回答spark读取文件
1 回答文件的路径是hdfs上的吗