在AI绘画领域,阿里提出的Composer和斯坦福提出的基于Stablediffusion的ControlNet引领了可控图像生成的理论发展。但是,业界在可控视频生成上的探索依旧处于相对空白的状态。相比于图像生成,可控的视频更加复杂,因为除了视频内容的空间的可控性之外,还需要满足时间维度的可控性。基于此,阿里巴巴和蚂蚁集团的研究团队率先做出尝试并提出了VideoComposer,即通过组合式生成范式同时实现视频在时间和空间两个维度上的可控性。论文地址:https://arxiv.org/abs/2306.02018项目主页:https://videocomposer.github.io前段时间