草庐IT

stable-sort

全部标签

Stable Diffusion XL总结

StableDiffusionXL是一个二阶段的级联扩散模型,包括Base模型和Refiner模型。其中Base模型的主要工作和StableDiffusion一致,具备文生图,图生图,图像inpainting等能力。在Base模型之后,级联了Refiner模型,对Base模型生成的图像Latent特征进行精细化,其本质上是在做图生图的工作。Base模型由U-Net,VAE,CLIPTextEncoder(两个)三个模块组成,在FP16精度下Base模型大小6.94G(FP32:13.88G),其中U-Net大小5.14G,VAE模型大小167M以及两个CLIPTextEncoder一大一小分别

【云上探索实验室】使用 Amazon Bedrock 体验构建Stable Diffusion-文本生成图像生成式 AI 应用

生成式人工智能(AI)正以惊人的速度蓬勃发展,不断推动着科技创新的边界。在前不久的re:Invent2023大会上,Selipsky为我们重点介绍了全托管式生成式AI服务AmazonBedrock,并表示AmazonBedrock极大地降低了客户从基础模型到构建生成式AI应用的门槛,用户仅需通过简单的几个步骤创建和部署完全托管式的Agent,通过动态调用API来执行复杂的业务任务。这一全新的服务范式不仅可以加速生成式AI应用的推广和采用,也可以为各行业在人工智能革命中找到更为便捷的落地途径。本文将展示AmazonBedrock的基本使用方法,并构建AmazonBedrock-Image模式体验

Unity Sort Group(排序组)

**Unity中的SortGroup组组件允许让SpriteRenderer(精灵渲染器)重新决定渲染顺序.**作为组件存在组件内容:Unity使用SortGroup组件的Sortlayer和Orderinlayer的值来确定排序组在渲染队列内相对与场景内其他排序组和游戏对象的优先级。属性功能SortingLayer选择排序图层来确定游戏对象在渲染队列中的位置,并且可以手动添加额外的排序图层OrderinLayer设置此排序组在渲染队列中的渲染顺序,数值越高排序组越后渲染,数值越大挂载排序组的精灵渲染器越显示在上面注意:想要重新排序的精灵渲染器需要在同一个SortLayer中,不同的SortL

【扩散模型】12、Stable Diffusion | 使用 Diffusers 库来看看 Stable Diffusion 的结构

文章目录一、什么是StableDiffusion二、Diffusers库三、微调、引导、条件生成3.1微调3.2引导3.3条件生成四、StableDiffusion4.1以文本为条件生成4.2无分类器的引导4.3其它类型的条件生成:超分辨率、图像修补、深度图到图像的转换4.4使用DreamBooth微调五、使用Diffusers库来窥探StableDiffusion内部5.1StableDiffusionPipeline5.2文本到图像5.3图像到图像5.4In-painting5.5Depth2Image5.6ControlNet5.6.1ControlNet与CannyEdge5.6.2C

安装docker报错failure: repodata/repomd.xml from docker-ce-stable: [Errno 256] No more mirrors to try. ht

一、问题:运行sudoyum-config-manager--add-repohttps://download.docker.com/linux/centos/docker-ce.repo之后报错sudoyum-config-manager--add-repohttps://download.docker.com/linux/centos/docker-ce.repofailure:repodata/repomd.xmlfromdocker-ce-stable:[Errno256]Nomoremirrorstotry.https://download.docker.com/linux/cent

Stable Diffusion Automatic1111 Web UI和dreambooth扩展的安装教程

一下载安装Python3.10.x(3.10.6,3.10.9,3.10.11)andgitPython3.10.9>https://www.python.org/ftp/python/3.10.9/python-3.10.9-amd64.exegit>https://git-scm.com/downloads二下载安装Automatic1111WebUI下载地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui下载用于训练的模型:RealisticVisionV2ModelForRealisticTraining(3.85GB)三

Stable Diffusion本地Docker快速部署

docker拉取腾讯云镜像sudodockerpullgpulab.tencentcloudcr.com/ai/stable-diffusion:1.0.8启动容器并打印日志sudodockerrun-itd--gpus=all--network=host--device=/dev/dri--group-add=video--ipc=host--cap-add=SYS_PTRACE--security-optseccomp=unconfined--name=stable-diffusiongpulab.tencentcloudcr.com/ai/stable-diffusion:1.0.8|x

Stable Diffusion WebUI制作光影文字效果

在huggingface上下载control_v1p_sd15_brightness模型。将模型放在stable-diffusion-webui\extensions\sd-webui-controlnet\models目录下。SD参数配置正向提示词:city,Building,tallbuilding,NeonLight,gentlelightshinesthrough,animestyle,painting,highdefinition,lotsofdetails,balancedcolors,warmth,nightstarrysky,peoplewalkingdownthestreet

Stable Diffusion中的Embeddings

什么是Embeddings?    Embeddings是一种数学技术,它允许我们将复杂的数据(如文本或图像)转换为数值向量。这些向量是高维空间中的点,可以捕捉数据的关键特征和属性。在文本处理中,例如,embeddings可以捕捉单词或短语之间的语义关系,而在图像处理中,它们可以表示图像的视觉内容。Embeddings在StableDiffusion中的角色    StableDiffusion是一种基于深度学习的图像生成模型,它使用embeddings来理解和生成图像。该模型通过将文本描述转换为文本嵌入(文本embeddings),并利用这些嵌入来引导图像的生成过程。同样,模型也会将图像内容

【论文+视频控制】23.08.DragNUWA1.5:通过集成文本、图像和轨迹来进行视频生成中的细粒度控制 (24.01.08在stable video diffusion开源模型)

论文链接:DragNUWA:Fine-grainedControlinVideoGenerationbyIntegratingText,Image,andTrajectory代码:https://github.com/ProjectNUWA/DragNUWA一、简介中国科学技术大学+微软亚洲研究院在NUWA多模态模型、StableVideoDiffusion、UniMatch基础上提出的可控视频合成方法提出了同时(simultaneously)引入文本、图像和轨迹信息,从语义(semantic)、空间(spatial)和时间角度(temporalperspectives)对视频内容进行·细粒度