草庐IT

Audio-Diffusion

全部标签

Stable Diffusion WebUI 安装前准备

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。大家好,我是水滴~~在安装stable-diffusion-webui前需要做一些准备工作,本篇文章主要介绍需要的电脑配置、魔法、安装Python、安装Git等。文章目录电脑配置使用魔法安装Python下载和安装镜像加速安装Git电脑配置StableDiffusion对显卡有一定的要求,其支持的最小独立显存为4G,8G以上为优,越大越好。对于显卡的厂商,N卡(NVIDIA,英伟达)最佳,A卡(AMD,超威半导体)也能用,发挥的性能会大打折扣。

Digital Audio (HDMI)未插入 用Hdmi连接电脑 显示高清数字音频未插入 win10电脑没声音,喇叭上一个叉❌

先说结论,出现这些问题的原因:未插入音频设备或者硬件问题(10%)设置错误,未使用显示器音频(30%)音频驱动不兼容或者没有驱动(50%)其他驱动有问题(10%)分步骤排查首先使用系统工具扫描一下,根据建议尝试解决一次未插入音频设备或者硬件问题如果是显示器输出音频,先确认下耳机或者外置音响是否损坏,可以插入到其他硬件设备上设置错误,未使用显示器音频存在多个音频输入设备,未切换音频输出设备导致音频驱动不兼容或者没有驱动本质上是重新安装或者卸载驱动参考资料:电脑没声音,喇叭上一个叉❌,显示无法找到输出设备。求大佬帮助。其他驱动有问题上面所有办法都尝试了,都没有解决声音疑难问题解答一直重复一个解决方

AI图像模型的深度分析:DALL·E 3、Google Imagen2、Stable Diffusion 和 Midjourney

原文:ComparativeAnalysisofAIImageGenerationPlatforms:DALL·E3,GoogleImagen2,StableDiffusion,andMidjourney-Blog简介本文提供了对四个AI图像生成模型——DALL·E3、GoogleImagen2、StableDiffusion以及Midjourney的详细比较。通过十个不同领域的图像生成能力进行比较,文中展示了各个平台的优点和缺点。结合对每一类别的深度分析,本文向读者提供了最适合其需求的Ai模型的关键信息。该评估是基于OpenGPT.com上的OpenDraw服务完成的,使用了OpenDraw

loading stable diffusion model: FileNotFoundError解决方案

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。大家好,我是水滴~~本文主要介绍在安装stable-diffusion-webui时出现的loadingstablediffusionmodel:FileNotFoundError问题的解决方案,希望能对你有所帮助。文章目录问题描述解决方案问题描述在安装stable-diffusion-webui过程中出现loadingstablediffusionmodel:FileNotFoundError错误,详细错误如下图:解决方案在stable-diffusion-webui安装过程中,会下载SD1.5的基础模型,如果不能下载成功,会报该错

OpenAI视频生成模型Sora的全面解析:从ViViT、Diffusion Transformer到NaViT、VideoPoet

前言真没想到,距离视频生成上一轮的集中爆发(详见《Sora之前的视频生成发展史:从Gen2、EmuVideo到PixelDance、SVD、Pika1.0》)才过去三个月,没想OpenAI一出手,该领域又直接变天了自打2.16日OpenAI发布sora以来(其开发团队包括DALLE3的4作TimBrooks、DiT一作BillPeebles、三代DALLE的核心作者之一AdityaRamesh等13人),不但把同时段Google发布的Gemmi1.5干没了声音,而且网上各个渠道,大量新闻媒体、自媒体(含公号、微博、博客、视频)做了大量的解读,也引发了圈内外的大量关注很多人因此认为,视频生成领域

stable diffusion在server上的部署测试

SDinfinitecanvasAutomatic1111vsInvokeAIAutomatic1111vsInvokeAI-prosandconsstablediffusion-infinity该repo的问题是已经2年没更新,它的依赖有问题,运行也有问题TypeError:EventListener._setup..event_trigger()gotanunexpectedkeywordargument'_js'这个我解决不了解决不了就删除这几行,然后还有transformers版本问题(不楞subfolder)stabilityai/sd-vae-ft-msedoesnotappear

(2023.4.23最新有效)Stable Diffusion官网最新安装教程以及全网最详细遇坑指南

(2023.4.23最新有效)StableDiffusion官网最新安装教程以及全网最详细遇坑指南以下是WebUI官方推荐的StableDiffusion的安装流程,需要注意以下几点:你需要使用N卡,并且至少需要4GB显存才能在本地运行。建议使用8GB显存或以上。在安装过程中,需要开启全局魔法上网。本地化部署步骤相对比较繁琐,如果遇到各种报错自己无法解决,可以bilibili秋叶的一键包(非官方)或者去在线版Midjourney(合理上网)。StableDiffusion开源之后爆发式更新了很多工具,这些工具大部分也是需要自己部署的。所以自己克服各种报错的话后面会玩得会比较开心。其拥有最强控制

【AI绘画】Stable Diffusion扩散模型 + Consistency一致性模型 小白必看!!!!!

手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包(文末可获取)1GAN到StableDiffusion的改朝换代2从DDPM到StableDiffusion发展史2.1DDPM扩散过程(正向)去噪过程(反向)总结优化目标理论推导代码解析2.2StableDiffusion3Consistency终结Diffusion通过估计数据分布梯度进行生成建模一文解释DiffusionModel(一)DDPM理论推导1GAN到StableDiffusion的改朝换代随着人工智能在图像生成,文本生成以及多模态生成等生成领域的技术不断累积

论文学习——基于音频、词汇和不流畅特征的门控多模态融合,用于从自发语音中识别阿尔茨海默病痴呆Multi-modal fusion with gating using audio, lexical an

文章目录引言正文AbstractIntroductionProposedApproach提出方法2.1MultimodalFeatures多模态特征2.2SequenceModeling序列特征2.3MultimodalFusionwithGating基于门控的多模态融合2.4Multi-modalModalwithDisfluencyMarkersExperiments实验3.1Data3.2ImplementationandMetrics3.3BaselineModel4ResultConclusion总结总结引言这篇文章是公开代码的少有的几篇论文之一,需要好好学习一下,一方面是为了了解代

20240203在WIN10下配置stable-diffusion-webui.git

20240203在WIN10下配置stable-diffusion-webui.git2024/2/311:55【结论:在WIN10下,生成512x512分辨率的图像,大概需要9秒钟!】【结论:在Ubuntu20.04.6下,生成512x512分辨率的图像,大概需要11秒钟!】前提条件,可以通过技术手段上外网!^_首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥2、请正确安装好NVIDIA最新的545版本的驱动程序和CUDA、cuDNN。2、安装Torch3、配置whisper【由于在WIN10下使用CONDA的命令行,退出的时