我目前正在使用 Confluent HDFS Sink Connector (v4.0.0) 来替换 Camus。我们正在处理敏感数据,因此我们需要在切换到连接器期间保持偏移量的一致性。
割接计划:
我对汇合连接器行为的期望是否正确?
最佳答案
当您重新启动此连接器时,它将使用嵌入在文件中的偏移量,该文件具有最后写入 hdfs 的文件。它不会使用消费者组偏移量。它这样做是因为它使用预写日志来实现恰好一次交付到 hdfs。
关于hadoop - Camus Migration - Kafka HDFS Connect 不从设置的偏移量开始,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49837808/