草庐IT

diffusion-vits-cqhttp

全部标签

使用 Stable Diffusion Img2Img 生成、放大、模糊和增强

在线工具推荐:Three.jsAI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 3D数字孪生场景编辑器StableDiffusion2022.1Img5Img于2年发布,是一款革命性的深度学习模型,正在重新定义和推动照片级真实感图像生成领域的创新。该模型提供了广泛的功能,其主要功能是从文本描述、修复和修复任务以及由文本提示引导的图像到图像翻译中生成详细的图像。稳定扩散1.5Img2Img 引擎该模型的功能不仅扩展到简单的图像生成,还扩展到图像放大、增强分辨率、压缩和生成更精细的细节。该过程建立在一个复杂的架构之上,该架构将自动编码器与在自动

本地训练,开箱可用,Bert-VITS2 V2.0.2版本本地基于现有数据集训练(原神刻晴)

按照固有思维方式,深度学习的训练环节应该在云端,毕竟本地硬件条件有限。但事实上,在语音识别和自然语言处理层面,即使相对较少的数据量也可以训练出高性能的模型,对于预算有限的同学们来说,也没必要花冤枉钱上“云端”了,本次我们来演示如何在本地训练Bert-VITS2V2.0.2模型。Bert-VITS2V2.0.2基于现有数据集目前Bert-VITS2V2.0.2大体上有两种训练方式,第一种是基于现有数据集,即原神各角色已经标注好的语音数据,这部分内容是公开的,但是不能商用,可以在这里下载:https://pan.ai-hobbyist.org/Genshin%20Datasets/%E4%B8%A

Stable Diffusion绘画入门

一,StableDiffusion模型原理目前开源的最火爆的AI绘画系统是StableDiffusion模型(稳定扩散模型)。可以完成text2img,img2img,depth2img【深度图转图像】,seg2img【语义分割图转图像】等基于提示信息【prompt】的图画创作功能。其核心原理简要总结如下:1,通过Attention机制引入text/semantic_map/input_image...等控制信息。-->构图2,在Attention控制下通过UNet模型在隐空间通过反向扩散机制从初始的噪声中一步一步(通常20到50步)清洗噪声生成隐空间图片信息(LatentDiffusionM

Stable Video Diffusion来了,代码权重已上线

AI画图的著名公司StabilityAI,终于入局AI生成视频了。本周二,基于StableDiffusion的视频生成模型StableVideoDiffusion来了,AI社区马上开始了热议。很多人都表示「我们终于等到了」。项目地址:https://github.com/Stability-AI/generative-models现在,你可以基于原有的静止图像来生成一段几秒钟的视频。基于StabilityAI原有的StableDiffusion文生图模型,StableVideoDiffusion成为了开源或已商业行列中为数不多的视频生成模型之一。但目前还不是所有人都可以使用,StableVid

修改 Stable Diffusion 使 api 接口增加模型参数

 参考:https://zhuanlan.zhihu.com/p/6445457841、修改modules/api/models.py中的StableDiffusionTxt2ImgProcessingAPI增加模型名称StableDiffusionTxt2ImgProcessingAPI=PydanticModelGenerator("StableDiffusionProcessingTxt2Img",StableDiffusionProcessingTxt2Img,[{"key":"sampler_index","type":str,"default":"Euler"},{"key":"s

Diffusion Models视频生成-博客汇总

0、【论文汇总】DiffusionModels视频生成/视频编辑/可控视频生成/跨模态视频生成本文总结了DiffusionModels视频生成领域相关的工作,目前共收录142篇,持续更新中。1、VideoDiffusionModels:基于扩散模型的视频生成扩散模型已经被广泛运用到图像生成、image-to-image转换、时间序列生成、3D点云生成、文本生成、音频生成等领域,谷歌研究院最新的研究成果成功将diffusionmodels运用到视频生成领域。

Stable Diffusion WebUI本地部署中遇到的一些错误

进来AI绘画大火,我便尝试在本地部署一下,电脑是M1的MacBook,不过windows应该也差不多。参考官网的方法一步步安装,虽然最后成功了,但中途还是有不少问题。首先安装homebrew,由于我早就已经安装好了,自然也没遇到什么问题。初次安装的朋友若按照homebrew官网的方法安装,很大概率会遇到无法访问的问题,因此这里建议直接使用/bin/bash-c"$(curl-fsSLhttps://gitee.com/ineo6/homebrew-install/raw/master/install.sh)"脚本,该脚本出自知乎的一位大神,他在文中详细介绍了更换源等一些列问题。安装好homeb

在 Windows(NVIDIA 和 AMD)上使用 Stable Diffusion 的快速简便方法,使用 AUTOMATIC1111 稳定的扩散网络 UI 在您自己的计算机上制作免费的 AI 艺术

您可能知道,互联网上有无数网站可用于生成AI艺术。Lexica、dreamlike.art、PlaygroundAI、InstantArt或一些Huggingface空间是我过去使用的少数几个。问题是它们中的大多数速度很慢并且只提供基本服务。它们的型号和功能数量有限。通过使用您的计算机,您可以以一种简单的方式进行最大程度的控制。AUTOMATIC1111的StableDiffusionwebUI是一个有用的浏览器界面,如果他们想在本地运行稳定扩散,几乎每个人都会使用它。我将逐步向您展示如何安装它。另一种选择是使用GoogleColab,它设置起来有点困难。我计划在接下来的故事中探索这个选项。如

【文生图】Stable Diffusion XL 1.0模型Full Fine-tuning指南(U-Net全参微调)

文章目录前言重要教程链接以海报生成微调为例总体流程数据获取POSTER-TEXTAutoPosterCGL-DatasetPKUPosterLayoutPosterT80KMovie&TVSeries&AnimePosters数据清洗与标注模型训练模型评估生成图片样例宠物包商品海报护肤精华商品海报一些TipsMata:EMU(ExpressiveMediaUniverse)ideogramDALL-E3关于模型优化ExamplesofCommonlyUsedNegativePrompts:前言StableDiffusion是计算机视觉领域的一个生成式大模型,能够进行文生图(txt2img)和图

Stable Diffusion 最新Ebsynth Utility脚本生成AI动画视频

早期的EbSynth制作的AI视频闪烁能闪瞎人的双眼,可以通过【temporalkit+ebsynth+controlnet】让视频变得丝滑不闪烁,现在又多了一个新的方法,在最新版本的EbsynthUtility中可以通过脚本进行操作设置,更加简单方便。插件安装在你已经安装好Ebsynth之后,如果还没有安装好可以参考下面的步骤进行安装和更新。下载安装EbSynth官网,这里需要输入email地址。下载压缩包解压缩到任意位置,这里我放到了ebsynth_utility下。透明背景工具下载地址:https://pypi.org/project/transparent-background/。在S