已解决430363个问题，去搜搜看，总会有你想问的

如何使用 kafka 流以块/批次的形式处理数据？

首页猿问如何使用 kafka...

如何使用 kafka 流以块/批次的形式处理数据？

Python

元芳怎么了 2021-09-26 14:30:55

对于大数据中的许多情况，最好一次处理一小块记录缓冲区，而不是一次处理一条记录。自然的例子是调用一些支持批处理以提高效率的外部 API。我们如何在 Kafka Streams 中做到这一点？我在 API 中找不到任何看起来像我想要的东西。到目前为止，我有：builder.stream[String, String]("my-input-topic").mapValues(externalApiCall).to("my-output-topic")我想要的是：builder.stream[String, String]("my-input-topic").batched(chunkSize = 2000).map(externalBatchedApiCall).to("my-output-topic")在 Scala 和 Akka Streams 中，该函数被称为groupedor batch。在 Spark Structured Streaming 中，我们可以做到mapPartitions.map(_.grouped(2000).map(externalBatchedApiCall))。

查看完整描述

2 回答

2 回答
0 关注
240 浏览

关注

添加回答

0/150

提交

取消

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

热搜

最近搜索清空

如何使用 kafka 流以块/批次的形式处理数据？

如何使用 kafka 流以块/批次的形式处理数据？

2 回答

添加回答