草庐IT

faster-whisper-webui

全部标签

开源语音识别faster-whisper部署教程

1.资源下载源码地址模型下载地址:large-v3模型:https://huggingface.co/Systran/faster-whisper-large-v3/tree/mainlarge-v2模型:https://huggingface.co/guillaumekln/faster-whisper-large-v2/tree/mainlarge-v2模型:https://huggingface.co/guillaumekln/faster-whisper-large-v1/tree/mainmedium模型:https://huggingface.co/guillaumekln/fas

stable-diffusion-webui(AI绘画)项目实现,即遇到的问题

 实现步骤:为了使环境中的库版本不会乱,导致自己电脑原来一些项目无法运行最好使用虚拟环境下载miniconda 在搜索中搜所miniconda找到建立虚拟环境D:gitclonehttps://ghproxy.com/https://github.com/AUTOMATIC1111/stable-diffusion-webui.git下载初始模型如果不下载好像在使用时会下载时间成,我们可以现在网页中下载好将模型名字换成model放在D:\stable-diffusion-webui\models\Stable-diffusion目录下 安装所需要的python库pipinstall-rrequ

Stable Diffusion XL webui dreambooth插件 Linux安装,训练LoRA(保姆级教程)

文章目录StableDiffusionXLwebuidreambooth插件Linux安装(保姆级教程)前言安装下载dreambooth仓库下载SDXL预训练模型其他文件下载前注意下载前准备下载StableDiffusionXLwebuidreambooth插件Linux安装(保姆级教程)前言在安装这个插件之前,我已经安装了SDXLwebui,tagger插件,具体安装操作可以参考之前的文章:SDXLwebui、tagger插件。之前已经安装了tagger插件,用来反推训练图像的提示词,接下来,我们可以利用dreambooth插件来训练我们的LoRA模型了。安装下载dreambooth仓库只需

Amazon Code Whisperer 的正式使用,全新 AI 代码工具等你发现!(内附详细安装步骤图解)

文章作者:稚始稚终关于CodeWhispererCodeWhisperer,亚马逊推出的实时AI编程助手,是一项基于机器学习的服务,它可以分析开发者在集成开发环境(IDE)中的注释和代码,并根据其内容生成多种代码建议。开发者可以用自然语言(目前仅支持英语)描述他们想要实现的功能,例如“上传一个带有服务器端加密的文件”,然后CodeWhisperer会自动为他们生成相应的代码片段。亚马逊云科技开发者社区为开发者们提供全球的开发技术资源。这里有技术文档、开发案例、技术专栏、培训视频、活动与竞赛等。帮助中国开发者对接世界最前沿技术,观点,和项目,并将中国优秀开发者或技术推荐给全球云社区。如果你还没有

【webUI】gradio基础使用2——Gallery组件显示多张图片

参考:https://www.gradio.app/docs/gallery|参考代码(老版本,有错误)gradio基础使用1:https://blog.csdn.net/imwaters/article/details/131400571说明基于python的浏览器上多图片显示,是很多复杂程序基本环节,本文写出最简单形式方便大家修改。应用:例如上传一张图片,经过处理,输出查询结果。注意官网文档不完善,如果不使用gradio.Gallery().style()是无法控制显示图片的布局的本文gradio_version3.34.0完整代码#-*-coding:utf-8-*-#@Time:202

Stable Diffusion 系列教程 - 2 WebUI 参数详解

StableDiffusion的整个算法组合为:UNet+VAE+文本编码器UNet:就是我们大模型里的核心。文本编码器:将我们的prompt进行encoder为算法能理解的内容(可以理解为SD外包出去的项目CLIP)。VAE:对UNet生成的图像作后处理。上图中红框代表的是大模型,可以通过下拉的方式来替换自己所需要的大模型。该参数控制着出图内容的基调,如真实场景、二次元或建筑模型。我们可以将其理解为拥有无数图像的数据库,根据prompt拿出一堆相关图像拼到一起生成出最终的图像。也就是说想要生成什么样的内容,就得需要一个什么样的数据库。通常,我们所使用的大模型都是在最原始的大模型SD1.5或者

无脑018——win11部署whisper,语音转文字

1.conda创建环境condacreate-nwhisperpython==3.9condaactivatewhisper安装pytorchpipinstalltorch==1.8.1+cu101torchvision==0.9.1+cu101torchaudio==0.8.1-fhttps://download.pytorch.org/whl/torch_stable.html安装whisperpipinstall-Uopenai-whisper2.准备模型和测试音频因为我的电脑是GTX1060显存只有6G最大运行的模型是medium所以去官网下载medium.pt模型连接在这里:http

whisper技术部署及简单使用

文章目录安装ffmpeg(解压模式)安装python(源码编译模式)安装pytorch安装whisperwhisper命令行使用python调用whisperpip包离线导出安装whisper是openai开源的语音转文字的技术,可以作为国内收费语音转文字相关软件的替代安装ffmpeg(解压模式)查看系统架构dpkg--print-architecture下载对应版本的ffmpeghttps://www.johnvansickle.com/ffmpeg/old-releases/#解压xz-dffmpeg-5.0.1-amd64-static.tar.xztar-xvfffmpeg-5.0.1

Win 10部署stable-diffusion-webui时github报错的解决方法

这篇博客就是简单记录一下。有很多文章已经详细介绍了怎么在Windows上部署stable-diffusion-webui了,例如:本地部署StableDiffusion教程,详细教学,已安装成功-知乎(zhihu.com)五千字长文:StableDiffusion保姆级教程,附带免费绘画小程序-哔哩哔哩(bilibili.com)一份保姆级的StableDiffusion部署教程,开启你的炼丹之路(baidu.com)其实最简单的安装方法就是按照github上Readme里描述的:GitHub-AUTOMATIC1111/stable-diffusion-webui:StableDiffusi

Linux下安装aria2 + webui-aria2,搭建一个下载服务器

安装aria2Debian下通过如下命令可以一键安装sudoapt-getinstallaria2安装webui-aria2通过git一键克隆到本地即可gitclonehttps://github.com/ziahamza/webui-aria2.git运行使用启动aria2的rpc服务(建议使用screen后台启动)aria2c--enable-rpc--rpc-listen-all--disable-ipv6--rpc-secretyourpassword为了方便以后使用,可以将以上命令放在脚本中使用开启web服务如果你的电脑安装了nginx,你可以直接将webui-aria2目录下的所有