在flinkcdc同步数据时,基于sql的实现方式中发现了作业DAG有个SinkMaterializer算子,而且检查checkpoint历史时发现该算子state越来越大,有必要搞清楚为什么会多了这个算子,作用又是什么。通过算子名称定位到了源码为类org.apache.flink.table.runtime.operators.sink.SinkUpsertMaterializer,这个算子将输入的记录以upsertkey作区分保存到state中,并为下游算子提供一下upsert视图。Anoperatorthatmaintainsincomingrecordsinstatecorrespon