已解决430363个问题，去搜搜看，总会有你想问的

火花流后立即火花RDD过滤器

首页猿问火花流后立即火花RDD过滤器

火花流后立即火花RDD过滤器

Java

明月笑刀无情 2021-09-29 13:16:54

我正在使用火花流，我从 Kafka 读取流。阅读此流后，我将其添加到榛子地图。问题是，我需要在从 Kafka 读取流后立即从地图中过滤值。我使用下面的代码来并行化地图值。List<MyCompObj> list = CacheManager.getInstance().getMyMap().values().stream().collect(Collectors.toList());JavaRDD<MyCompObj> myObjRDD = sparkContext.parallelize(list);但是在这个逻辑中，我在另一个是 JavaInputDStream.foreachRDD 中使用 JavaRDD，这会导致序列化问题。第一个问题是，如何通过事件驱动运行我的 Spark 作业？另一方面，我只是想就预定的 Spark 作业获得一些意见。安排 Spark 作业在特定时间执行它的最佳做法是什么？

查看完整描述