草庐IT

DIFFUSION

全部标签

stable diffusion中的u net

StableDiffusion包含几个核心的组件:一个文本编码器(在StableDiffusion中使用CLIP的ViT-L/14的文本编码器),用于将用户输入的Prompt文本转化成textembedding;一个ImageAutoEncoder-Decoder,用于将Image编码成隐含向量  ,或者从隐含向量 中还原出图片;一个UNET结构,使用UNET进行迭代降噪,在文本引导下进行多轮预测,将随机高斯噪声  转化成图片隐含向量 。 这三个部分是相互独立的,其中最重要的是UNET结构。UNET是从噪音中生成图像的主要组件,在预测过程中,通过反复调用UNET,将UNET预测输出的noise

使用 stable diffusion 将视频动漫化

利用controlnet的SoftEdge算法和OpenPose,再加ebsynth插件将一段真人的跳舞视频动漫化,具体步骤:1、使用ebsynth设置好输出目录(不能有中文,否则会报错,已经试过了),选择原视频,运行抽取序列帧并生成蒙版图,蒙版图生成之后要看一下是不是你想要的东西,如果不是可以调整一下参数重新生成2、设置关键帧间隔,生成关键帧(推荐设置5,数值越小后面生成视频越连贯,反之卡顿,但同时接下来计算量也变大)3、利用isnet_pro插件将上一步所有的关键帧去除背景,得到只有白底+人物的关键帧4、从上一步抽取出来的关键帧导入一张放到“WD1.4标签器”反推prompt,删除明显不符

stable-diffusion-webui安装教程windows10

stable-diffusion-webui安装教程windows10安装python3.10.6安装cuda配置环境修改界面语言本教程提及的文件都在:https://share.weiyun.com/S9QZe9cb,请自行下载获取。安装python3.10.6双击python-3.10.6-amd64.exe,一路确认。安装cuda右键单击屏幕左下角的windows图标(开始菜单),选择并点击WindowsPowershell,在弹出来的蓝框里输入nvidia-smi,在下图红框处查看CUDA版本:在https://developer.nvidia.com/cuda-toolkit-arc

stable-diffusion-webui安装教程windows10

stable-diffusion-webui安装教程windows10安装python3.10.6安装cuda配置环境修改界面语言本教程提及的文件都在:https://share.weiyun.com/S9QZe9cb,请自行下载获取。安装python3.10.6双击python-3.10.6-amd64.exe,一路确认。安装cuda右键单击屏幕左下角的windows图标(开始菜单),选择并点击WindowsPowershell,在弹出来的蓝框里输入nvidia-smi,在下图红框处查看CUDA版本:在https://developer.nvidia.com/cuda-toolkit-arc

stable diffusion webUI异常

Timetaken: 0.00sTorchactive/reserved:2077/2082MiB, SysVRAM:4220/6141MiB(68.72%)在添加面部修复等功能以及设置参数详细等无法正常绘图,把所有的功能取消了便能正常出图,像这种如何解决   

云服务器(ubuntu)安装stable diffusion-安装记录

推荐云服务器:UbuntuServer18.04LTS64位1、安装condamini版本注意,如果不是x86_64,需要去镜像看对应的版本(https://mirrors.bfsu.edu.cn/anaconda/miniconda/)wgethttps://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.shchmod+xMiniconda3-latest-Linux-x86_64.shbashMiniconda3-latest-Linux-x86_64.sh#安装时init选yessource~/.bashrccond

(二)AIGC—Stable Diffusion(2)

越往后,加的噪声越多,逐渐递增正常的话,类似RNN,前向传递,不利于模型训练。如果直接从x0到xt最好,DPPM这篇论文就实现了这一目标beta这一参数在扩散过程是已知的,前期设计好,从0.0001-0.002,线性衰减,,或者其他衰减,因此,beta1…beta_n肯定是已知的。前向加噪声:前向可以直接从x0求出来xT反向去噪声:反向不能直接从xT求出来x0xT已经知道,求XT-1…直到求x0根据xT求xT-1比较难求,可以根据贝叶斯,由前向过程中的已知条件求解以上zt不是累乘,公式表示有误需要求x0,但是在逆过程中x0明显未知,因此,可以使用xt替换x0有一个参数无法直接求解,无法直接求解

Stable Diffusion 本地部署教程,懒人一键安装包!!!

首页AIStableDiffusion本地部署教程,懒人一键安装包,有手就会安装!StableDiffusion是一款开源的AI文生图扩散模型!目前他和Midjourney都被称为最好用的AI绘画工具。关注AI绘画的小伙伴在网上看到的那些优质的AI绘画作品,很多都是大多都是由这两款工具来完成的。Midjourney目前已经取消了免费体验,所以今天给大家分享StableDiffusion的本地部署教程!1,电脑配置由于是将StableDiffusion部署在你的电脑本地,所以对你的电脑硬件配置有很高的要求。首选你的电脑必须是英伟达的N卡,其次官方推荐显存8G,6g起步,4g也能用!如果你的电脑是

论文笔记High-Resolution Image Synthesis with Latent Diffusion Models

论文提出了latentdiffusionmodels(LDMs)。基于该模型最著名的工作是文本生成图像模型stable-diffusion。普通的扩散模型在像素空间操作,运算复杂度较高。为了保证在低资源下训练扩散模型,并保留扩散模型的质量和灵活性,该论文使用预训练的自编码器得到隐含空间,并在隐含空间中训练扩散模型。另一方面,该论文使用cross-attention机制为扩散模型引入条件,条件可以是文本、boundingbox等。方法方法的整体结构如上图。先用自编码器训练通用的压缩模型(红色部分),通用的压缩模型可以用来训练不同的扩散模型。之后在自编码器的低维隐含空间上训练扩散模型(绿色部分),