近来,文本生成图像领域取得了很多意想不到的突破,很多模型都可以实现基于文本指令创建高质量和多样化图像的功能。虽然生成的图像已经很逼真,但当前模型往往善于生成风景、物体等实物图像,但很难生成带有高度连贯细节的图像,例如带有汉字等复杂字形文本的图像。为了解决这个问题,来自OPPO等机构的研究者们提出了一个通用学习框架GlyphDraw,旨在让模型能够生成嵌入连贯文本的图像,这是图像合成领域首个解决汉字生成问题的工作。论文地址:https://arxiv.org/abs/2303.17870项目主页:https://1073521013.github.io/glyph-draw.github.io/