TA贡献7条经验 获得超0个赞
这种情况本地就只能想办法把你的中间结果序列化了存储到本地磁盘,然后接着计算,最后相当于用I/O来代替你的内存。
分布式的大数据平台也是一样的原理,如果数据量太大,你可以考虑自己弄个单节点的Spark来做,即使内存不足了它也会自动帮你去解决中间结果序列化的问题。
TA贡献12条经验 获得超1个赞
智能时代:写给想学习大数据的你
¥ 58.00
举报