AIGC-Stable_草庐IT

Stable Diffusion 3 Early Preview发布

2月22日，StabilityAI发布了 StableDiffusion3earlypreview，这是一种开放权重的下一代图像合成模型。据报道，它继承了其前身，生成了详细的多主题图像，并提高了文本生成的质量和准确性。这一简短的公告并未附带公开演示，但Stability今天为那些想尝试的人开放了Waitlist，想等着尝鲜的同学可以注册加入Waitlist。Waitlist地址：SD3Waitlist—StabilityAIStability表示，其StableDiffusion3系列模型（采用称为“prompt”的文本描述并将其转换为匹配图像）的参数大小从8亿到80亿不等。尺寸范围允许模型的

AIGC专题：Sora开启AIGC新纪元，海外龙头AI指引乐观

今天分享的是电子系列深度研究报告：《AIGC专题：Sora开启AIGC新纪元，海外龙头AI指引乐观》。（报告出品方：方正证券）报告共计：30页来源：人工智能学派Sora、Gemini1.5Pro相继发布，AIGC新时代已至大模型Sora震摅登场，Al生成视频领域里程碑0penAl在2024年2月16日发布文生视频模型Sora，突破了AIGC的高地，该模型完美继承DALL·E3的画质和遵循指令能力，并利用了GPT扩写，具备超长生成时间(60s，Pika1.0为3s)、单视频多角度镜头、理解物理世界三大突出优势。除文生视频外，该模型还能支持通过现有的静态图像生成视频，并能准确、细致地对图像内容进行

明道云入选亿欧智库《AIGC入局与低代码产品市场的发展研究》

2023年12月27日，亿欧智库正式发布**《AIGC入局与低代码产品市场的发展研究》**。该报告剖析了低代码/零代码市场的现状和发展趋势，深入探讨了大模型技术对此领域的影响和发展洞察。其中，亿欧智库将明道云作为标杆产品进行了研究和分析。明道云与AICG的结合场景自从AICG技术问世以来，明道云迅速整合了这项先进技术，极大地提升了其产品功能，为用户带来前所未有的便利性。截至目前，明道云产品中已融入AICG的功能包括：AI字段建议：智能推荐字段类型和配置，简化数据组织流程。AI生成代码块：AI生成代码，提升开发效率。展望未来，明道云计划进一步深入应用AICG技术，以实现更全面的技术升级。正在规划

秒速出图！体验 TensorRT 加速 Stable Diffusion 图像创作

TensorRT如何加速StableDiffusion？生成式AI图像内容生成技术近年来发展迅速，可以根据人类语言描述生成图片，在时尚、建筑、动漫、广告、游戏等领域有着广泛应用。StableDiffusionWebUI是Github上最为热门的利用生成式AI进行图像生成的项目。它采用ClipText对文字进行编码，然后采用UNet+Scheduler在潜在表示空间（latentspace）上进行Diffusion，最后采用AutoencoderDecoder将第二步生成的扩散信息再转为图像。StableDiffusionPipelineDiffusion模型最大的痛点是生成图片的速度过慢。St

【AIGC-AI人像生成系列-1】PhotoMaker：定制逼真的人体照片

目录一.项目概述与贡献a)项目概述b)主要贡献二. 方法详解a)PhotoMaker和ID导向的数据构建管道的概览 PhotoMaker： ID导向的数据构建管道：b)方法详细解读堆叠ID嵌入（StackedIDEmbedding）：2.ID导向的数据构建管道：3.训练过程：4.推理（Inference）：5.应用和灵活性：6.实验和评估：三. 重新语境化结果四.将艺术品/老照片中的人物带入现实结果五.风格化六.改变年龄或性别结果七.身份混合八.比较结果九.论文关注公众号【AI杰克王】继FaceChain,Easyphoto等AI人像工作,PhotoMaker横空出世。PhotoMaker通过

Stable Diffusion InstantID 炸裂！只需要一张图就可以换脸｜详细教程

最近AI换脸又火起来了，小红书InstantX团队发布了一款最新的换脸技术InstantID和之前的主流的训练lora换脸不同，InstantID只需要上传一张图就可以实现换脸以及姿势替换！一InstantID介绍InstantID主要分为了三部分IDEmbedding：通过预训练的面部识别模型，将语义人脸特征提取为FaceEmbedding。这种嵌入包含了丰富的语义信息，如面部特征、表情、年龄等，为后续的图像生成提供了坚实的基础。ImageAdapter：引入轻量级的适配模块，将提取的身份信息与文本提示结合。通过解耦的交叉注意力机制，图像和文本能够独立地影响生成过程，同时保持身份信息的同时允

Stable Diffusion的 webui 如何在Windows上使用 AMD GPU显卡？

根据StableDiffusion官方说明webui是不支持AMDGPU显卡的，所以在国内如果想省点事情要玩StableDiffusion(SD)推荐用黄教主的英伟达显卡NVIDIAGPU，可以省心不少。AMD显卡得用webui-directml，这是另外的包，按官方的说明实际操作并不难，下面先说在Windows上的步骤：安装Python3.10.6版（勾选addpython.exetoPATH，具体可以查看下面的参考文献1.），以及git2.39.2版；在DOS窗内执行gitclonehttps://github.com/lshqqytiger/stable-diffusion-webui-

Stable Diffusion插件：EasyPhoto之Lora训练、AI写真、AI视频、AI换装

大家好，我是程序员晓晓今天给大家分享一个特别强大的StableDiffusion插件：EasyPhoto，这个插件一直在迭代，从最开始的AI写真，然后是AI视频，到最近的AI换装，能力一直在持续增强。这个插件的基础能力是Lora训练，只需要5-20张特定人物或者风景的照片，不需要对图片进行任何格式化和打标的处理，也不需要理解各种复杂的参数，就可以生成一个独特的Lora模型；然后基于这个模型，我们就可以生成特定形象的照片、视频，可以文生图（视频），也可以图生图（视频）。下面是我的效果展示，人物形象来自寡姐，最左边这张是原图，右边两张是生成的图片。效果还不错，最有特色的就是寡姐的这个小鼻子，模仿的

【AIGC】Stable Diffusion的模型微调

为什么要做模型微调模型微调可以在现有模型的基础上，让AI懂得如何更精确生成/生成特定的风格、概念、角色、姿势、对象。StableDiffusion模型的微调方法通常依赖于您要微调的具体任务和数据。下面是一个通用的微调过程的概述：准备数据集：准备用于微调的数据集。这包括输入图像和相应的标签（如果适用）。确保数据集与您的微调任务相匹配，并且具有足够的样本量和多样性。选择模型：选择要微调的StableDiffusion模型。根据您的任务需求，选择合适的预训练模型。您可以根据任务的复杂性和数据集的大小选择不同的模型规模。冻结部分层（可选）：根据您的需求，决定是否冻结预训练模型的一部分层。通常，您可以选

AIGC实战——扩散模型(Diffusion Model)

AIGC实战——扩散模型0.前言1.去噪扩散概率模型1.1Flowers数据集1.2正向扩散过程1.3重参数化技巧1.4扩散规划1.5逆向扩散过程2.U-Net去噪模型2.1U-Net架构2.2正弦嵌入2.3ResidualBlock2.4DownBlocks和UpBlocks3.训练扩散模型4.去噪扩散概率模型的采样5.扩散模型分析5.1生成图像5.2调整逆扩散步数5.3在图像之间进行插值小结系列链接0.前言与生成对抗网络(GenerativeAdversarialNetwork,GAN)一样，扩散模型是过去十年中最有影响力的生成模型技术之一。在许多基准测试中，当前的扩散模型已经超过了以往最