草庐IT

Diffusion-GAN

全部标签

Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)

本篇是《DiffusionModel(扩散生成模型)的基本原理详解(一)DenoisingDiffusionProbabilisticModels(DDPM)》的续写,继续介绍有关diffusion的另一个相关模型,同理,参考文献和详细内容与上一篇相同,读者可自行查阅,本篇着重介绍Score-BasedGenerativeModeling(SGM)的部分,本篇的理论部分参考与上一节相同,当然涉及了一些原文的理论部分,笔者在这里为了更能让各位读懂,略掉了原文的一些理论证明,感兴趣读者可以自行阅读SongYangetal.SGM原文。笔者只介绍重要思想和重要理论,省略了较多细节篇幅。下一节介绍本基

搭建 AI绘图 Stable Diffusion- WebUI 制作属于自己版权的图片

前言StableDiffusion是一种深度学习文本到图像生成模型,它主要用于根据文本的描述产生详细图像,亦或者根据现有的图片生成相似的图片。在本地代建StableDiffusion-webUI需要准备Python环境(3.10.6版本)、可以上外网的梯子,Git拉取代码工具,电脑配置最低建议6G显存,1660TI显卡以上、安装在拥有100G空余空间的固体硬盘上,项目后续需要下载依赖,模型等会比较占用内存空间。下面教程开始,以window系统为例。教程开始一、环境安装1、python环境安装【官网】按下图操作之后直接默认安装就行2、Git安装【Git】,进入官网直接下载安装即可。二、项目安装上

由浅入深理解latent diffusion/stable diffusion(1):写给初学者的图像生成入门课

DiffusionModels专栏文章汇总:入门与实战前言:关于如何使用stablediffusion的文章已经够多了,但是由浅入深探索stablediffusionmodels背后原理,如何在自己的科研中运用stablediffusion预训练模型的博客少之又少。本系列计划写5篇文章,和读者一起遨游diffusionmodels的世界!本文主要介绍图像生成的历史,研读经典,细数发展历程。目录机器学习的艺术和设计运用2017-2019发展过程

Windows/Linux搭建Stable Diffusion WebUI

什么是StableDiffusionWebUI?能用来干嘛?StableDiffusionWebUI(以下简称SD)是一个基于Gradio库的StableDiffusion的浏览器界面,可以方便地配置和生成AI绘画作品,并且进行各种精细地配置。StableDiffusion是2022年发布的深度学习文字到图像生成模型。是一款功能异常强大的AI图片生成器。它不仅支持生成图片,使用各种各样的模型来达到你想要的效果,还能训练你自己的专属模型。SD的主要功能有两个:文生图(text2img)和图生图(img2img)。文生图是根据提示词(Prompt)的描述生成相应的图片,而图生图是将一张图片根据提示

Stable Diffusion实操示例

一、负向提示词解决问题:生成的图片存在瑕疵,比如多只眼睛、多只手指等情况。通过embeddings可以避免一些常用的不好结果。方法:从https://civitai.com/?utm_source=nettsz.com 中下载负向提示词的embeddings模型,EasyNegativeV2,easynegative,badhandv4 都是针对二次元的负向模型,NG_DeepNegative_V1_75T是针对真人系的负向模型,下载这些embeddings模型后,放到sd根目录/embeddings下,如下图所示: webui上使用的方式:二、高清修复(Hi-ResFix)解决问题:真实系模

Stable Diffusion web UI之X/Y/Z plot使用

一、安装环境配置PASSCFGScale配置的越高,SD生成的图会更贴用户提供的prompt来进行生成,AI的自由度会下降,生成人物的时候特别需要注意,对于手脚脸部,过高的值更容易造成过拟合还有画面崩坏。二、X/Y/Zplot使用X/Y/Zplot脚本可以集成多组图片,方便对比不同参数对模型产生的影响以及在模型的不同阶段产生的图片之间的差异。类似于下面这样的一张图:2.1如何使用仅有生成图片的标签(txt2img和img2img)支持X/Y/Zplot,从左下角的Script下拉栏中选中X/Y/Zplot。该功能最多支持三个量之间的对比。X/Y/Ztype:三个坐标轴上变量的属性,设置需要对比

Stable diffusion WebUI txt2img使用教学

本篇文章将深入探讨如何在StableDiffusionWebUI上进行各项参数的调整。将以txt2img为主要讨论对象,探讨诸如基本设定Samplingmethod以及CFGscale等参数的调整,以及这些参数之间的相互影响。对于还未安装StableDiffusionWebUI的小伙伴,可以参阅上一篇文章StableDiffusionWebUI本地安装教学以获得安装和运行的具体步骤。而本篇文章将直接讨论和解析WebUI的各项参数。文章目录StableDiffusionCheckpoint模型选择Prompt关键词NegativePrompt负面词Samplingmethod采样方法Sampli

Stable-Diffusion 通過骨架分析插件ControlNet 來製作超有意境的圖片

A.開始前的準備工作,你需要先安裝必備的環境安裝 Python3.10.6, “AddPythontoPATH”安裝 git.B.正式開始安裝的步驟:1.下載Stable-Diffusion-webui【鏈接地址】 Github開源項目,【中文語言包】 (注意:大陸用戶請掛梯子,否則打不開)2.安裝擴展:https://github.com/Mikubill/sd-webui-controlnet.git3.下載ControlNet模型【鏈接】選擇裡面的control_sd15_openpose.pth,下載後放入./stable-diffusion-webui/extensions/sd-w

Stable Diffusion webui 基础参数学习

哈喽,各位小伙伴们大家好,最近一直再研究人工智能类的生产力,不得不说随着时代科技的进步让人工智能也得到了突破性的发展。而小编前段时间玩画画也是玩的不可自拔,你能想想得到,一个完全不会画画的有一天也能创作出绘画作品。熟知小编教学的小伙伴都知道,一般都是图文并茂形式进行的,一般只需要按照操作步骤进行都能学会。一、本次学习目的使刚接触StableDiffusionwebui的小伙伴能快速熟悉基础功能的理解及使用二、简单介绍StableDiffusion是一种基于扩散过程的图像生成模型,可以生成高质量、高分辨率的图像。它通过模拟扩散过程,将噪声图像逐渐转化为目标图像。这种模型具有较强的稳定性和可控性,

闲谈【Stable-Diffusion WEBUI】的插件:美不美?交给AI打分

文章目录(零)前言(一)咖啡馆美学评价(CafeAesthetic)(零)前言本篇主要提到了WEBUI的CafeAesthetic插件,这是一个相对独立的插件,单独标签页,判断图片艺术感和分类。更多不断丰富的内容参考:🔗《继续Stable-DiffusionWEBUI方方面面研究(内容索引)》(一)咖啡馆美学评价(CafeAesthetic)图像作品到底好不好,有没有艺术细菌,AI也可以评价了。参考:https://github.com/p1atdev/stable-diffusion-webui-cafe-aesthetic可以从WEBUI中直接安装。这个和AI作图没什么关系,但是可以评判做