GlyphDraw_草庐IT

扩散模型生成带汉字图像，一键输出表情包：OPPO等提出GlyphDraw

近来，文本生成图像领域取得了很多意想不到的突破，很多模型都可以实现基于文本指令创建高质量和多样化图像的功能。虽然生成的图像已经很逼真，但当前模型往往善于生成风景、物体等实物图像，但很难生成带有高度连贯细节的图像，例如带有汉字等复杂字形文本的图像。为了解决这个问题，来自OPPO等机构的研究者们提出了一个通用学习框架GlyphDraw，旨在让模型能够生成嵌入连贯文本的图像，这是图像合成领域首个解决汉字生成问题的工作。论文地址：https://arxiv.org/abs/2303.17870项目主页：https://1073521013.github.io/glyph-draw.github.io/

扩散模型生成带汉字图像，一键输出表情包：OPPO等提出GlyphDraw