草庐IT

ControlNet star量破万!2023年,AI绘画杀疯了?

从骑马的宇航员到三次元小姐姐,在不到一年的时间里,AI绘画似乎已经取得了革命性的进展。这个「骑马的宇航员」由OpenAI2022年4月推出的文生图模型DALL・E2绘制。它的前辈——DALL・E在2021年向人们展示了直接用文本生成图像的能力,打破了自然语言与视觉的次元壁。在此基础上,DALL・2更进一步,允许人们对原始图像进行编辑,比如在画面中添加一只柯基。这一个看似简单的操作其实体现了AI绘画模型可控性的提升。不过,就影响力而言,2022年最火的文生图模型并不是DALL・E2,而是另一个和它功能相似的模型——StableDiffusion。和DALL・E2一样,StableDiffusio

Pinta 2.1 开源绘画程序发布:新增 WebP 格式和 .NET 7 框架支持,改进 Wayland

1月5日消息,开源、免费、跨平台和简单的图像编辑和绘画程序Pinta2.1 已发布,采用GTK#编写,适用于GNU/Linux、macOS和Windows平台,现在可以作为重大更新下载,带来了众多新功能和改进。Pinta2.0在1年前发布,现在Pinta2.1引入了令人兴奋的变化,比如支持WebP现代图像格式(尽管Linux用户必须先安装webp-pixbuf-loader包),还有新的渐变工具的“透明模式”,从虚拟文件系统打开文件的能力,以及对标准GTK对话框的支持。IT之家了解到,此主要更新中存在许多改进,以修复在Wayland下截取屏幕截图、加速画布渲染、加载具有未知扩展名但具有有效内容

Pinta 2.1 开源绘画程序发布:新增 WebP 格式和 .NET 7 框架支持,改进 Wayland

1月5日消息,开源、免费、跨平台和简单的图像编辑和绘画程序Pinta2.1 已发布,采用GTK#编写,适用于GNU/Linux、macOS和Windows平台,现在可以作为重大更新下载,带来了众多新功能和改进。Pinta2.0在1年前发布,现在Pinta2.1引入了令人兴奋的变化,比如支持WebP现代图像格式(尽管Linux用户必须先安装webp-pixbuf-loader包),还有新的渐变工具的“透明模式”,从虚拟文件系统打开文件的能力,以及对标准GTK对话框的支持。IT之家了解到,此主要更新中存在许多改进,以修复在Wayland下截取屏幕截图、加速画布渲染、加载具有未知扩展名但具有有效内容

AI绘画新思路:国产开源50亿参数新模型,合成可控性、质量实现飞跃

论文地址:https://arxiv.org/pdf/2302.09778v2.pdf项目地址:https://github.com/damo-vilab/composer近年来,在大数据上学习的大规模生成模型能够出色地合成图像,但可控性有限。可控图像生成的关键不仅依赖于条件,而且更重要的是依赖于组合性。后者可以通过引入巨大数量的潜在组合来指数级地扩展控制空间(例如100个图像,每个有8个表征,产生大约100^8种组合)。类似的概念在语言和场景理解领域得到了探索,其中的组合性被称为组合泛化,即从有限的已知成分中识别或生成潜在的无限数量的新组合的技能。最新的一项研究提供了一种新的生成范式——可以

AI绘画新思路:国产开源50亿参数新模型,合成可控性、质量实现飞跃

论文地址:https://arxiv.org/pdf/2302.09778v2.pdf项目地址:https://github.com/damo-vilab/composer近年来,在大数据上学习的大规模生成模型能够出色地合成图像,但可控性有限。可控图像生成的关键不仅依赖于条件,而且更重要的是依赖于组合性。后者可以通过引入巨大数量的潜在组合来指数级地扩展控制空间(例如100个图像,每个有8个表征,产生大约100^8种组合)。类似的概念在语言和场景理解领域得到了探索,其中的组合性被称为组合泛化,即从有限的已知成分中识别或生成潜在的无限数量的新组合的技能。最新的一项研究提供了一种新的生成范式——可以

斯坦福“草泥马”火了:100美元就能比肩GPT-3.5!手机都能运行的那种

一夜之间,大模型界又炸出个bignews!斯坦福发布Alpaca(羊驼,网友口中的“草泥马”):只花100美元,人人都可微调Meta家70亿参数的LLaMA大模型,效果竟可比肩1750亿参数的GPT-3.5(text-davinci-003)。而且还是单卡就能运行的那种,甚至树莓派、手机都能hold住!还有一个更绝的“骚操作”。研究所涉及到的数据集,是斯坦福团队花了不到500美元用OpenAI的API来生成的。所以整个过程下来,就等同于GPT-3.5自己教出了个旗鼓相当的对手AI。然后团队还说,用大多数云计算平台去微调训练好的模型,成本也不到100美元:复制一个GPT-3.5效果的AI,很便宜

斯坦福“草泥马”火了:100美元就能比肩GPT-3.5!手机都能运行的那种

一夜之间,大模型界又炸出个bignews!斯坦福发布Alpaca(羊驼,网友口中的“草泥马”):只花100美元,人人都可微调Meta家70亿参数的LLaMA大模型,效果竟可比肩1750亿参数的GPT-3.5(text-davinci-003)。而且还是单卡就能运行的那种,甚至树莓派、手机都能hold住!还有一个更绝的“骚操作”。研究所涉及到的数据集,是斯坦福团队花了不到500美元用OpenAI的API来生成的。所以整个过程下来,就等同于GPT-3.5自己教出了个旗鼓相当的对手AI。然后团队还说,用大多数云计算平台去微调训练好的模型,成本也不到100美元:复制一个GPT-3.5效果的AI,很便宜