草庐IT

CLIP打通文本图像壁垒,为AI图像生成打下基础

本文有5230字,阅读大概需要10分钟。10分钟你肯定看不完,老老实实看吧。碎碎念事情是这样的,前两天晚上我嵩突然发了DreamStudio让我们玩一下。其实我现在正在做的方向就是扩散模型,然后恰好这个DreamStudio就是扩散模型,更巧的是它列了四条技术,第一个就是CLIP。那我们就来说一下CLIP是什么东西。CLIP论文地址:[2103.00020]LearningTransferableVisualModelsFromNaturalLanguageSupervision(arxiv.org)代码地址:openai/CLIP:ContrastiveLanguage-ImagePretr

CLIP打通文本图像壁垒,为AI图像生成打下基础

本文有5230字,阅读大概需要10分钟。10分钟你肯定看不完,老老实实看吧。碎碎念事情是这样的,前两天晚上我嵩突然发了DreamStudio让我们玩一下。其实我现在正在做的方向就是扩散模型,然后恰好这个DreamStudio就是扩散模型,更巧的是它列了四条技术,第一个就是CLIP。那我们就来说一下CLIP是什么东西。CLIP论文地址:[2103.00020]LearningTransferableVisualModelsFromNaturalLanguageSupervision(arxiv.org)代码地址:openai/CLIP:ContrastiveLanguage-ImagePretr
12