HowtotransformboundedpcollectiontounboundedinPythonwithApacheBeam?我正在尝试在不使用太多内存的情况下转换存储在GCS中的几TB邮件日志。按照指南中的建议,我为每个元素添加时间戳,将其拆分为滑动窗口,并在将其发送到GroupByKey和之后的ParDo解析器之前指定了一个(聚合)触发器。这应该可以,但仍然GroupByKey等待所有数据到达。为什么?我也尝试过使用Direct和GoogleDataflowrunner。我错过了什么?这是代码的要点:123456789101112131415161718192021222324252