whisper介绍whisper是OpenAI最近发布的语音识别模型。OpenAI通过从网络上收集了68万小时的多语言(98种语言)和多任务(multitask)监督数据对Whisper进行了训练,whisper可以执行多语言语音识别、语音翻译和语言识别。whisper安装(Windows)1.CMD命令窗口建立名为whisper的虚拟环境:condacreate-nwhisperpython==3.8condaactivatewhisper注意:whisper要求python版本为3.8以上,否则会报错2.虚拟环境中,安装whisperpipinstall-Uopenai-whisper2.
文章目录(零)前言(二)ControlNet(v1.1)(2.1)模型(2.2)新版界面(2.3)预处理器(三)偷懒(零)前言本篇主要提到ControlNet新版本的使用,和旧版本的变化,并偷懒参考了别人很不错的文章。更多不断丰富的内容参考:🔗《继续Stable-DiffusionWEBUI方方面面研究(内容索引)》(二)ControlNet(v1.1)之前在上述索引文章里面提到过很重要的插件ControlNet和它的简单展示。并参考了https://openai.wiki/里的详细介绍文章。WEBUI的插件里,ControlNet是少数几个不需要翻译的插件,因为翻译了也没意思:控制网络?目前
前言系统windows10,显卡NVIDIA RTX2060s,分享一下stable diffusion webui 本地部署过程以及遇到的问题。其中一些环境已搭建或者软件已安装过的,可以直接跳过。步骤1.安装gitgit下载地址2.克隆StableDiffusionWebUI 找一个磁盘空间充裕的目录,如d:,右键点击gitbash here,执行命令:gitclonehttps://ghproxy.com/github.com/AUTOMATIC1111/stable-diffusion-webui.git3.安装AnacondaAnnconda下载地址Annconda是python的环境
文章目录installHomebrewinstallpython3.10clonestablediffusionweb设置pip国内源install如果torch安装有问题可以这样安装InstallGFPGAN卡主问题Taming-transformers卡住问题其他疑难问题WIndows和Mac基本上遇到的问题很像,主要是解决「网络」问题。installHomebrew#官方教程/bin/bash-c"$(curl-fsSLhttps://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"#金牛肖马/bin/zsh-c"$
提示:零经验小白也可以搭建stable-diffusion-webui教程文章目录前言基本准备一、stable-diffusion-webui安装条件二、创建项目1.创建文件夹2.添加模型---没有模型也没有办法使用总结前言基本准备软件准备:编辑器:PyCharm或者VisualStudioCode提示:如果你的编辑器是PyCharm最好看一下版本因为老版本的貌似不支持python3.10,我的2019版的PyCharm不支持python3.10所以使用免费的VisualStudioCode编辑器环境管理软件:Anaconda下载git版本控制软件提示:基本工具某度都有安装教程提示:以下是本篇
OpenAI开源语音识别模型Whisper初体验前言一、Whisper9种运行模型以及所需配置二、使用conda和ffmpeg的实现步骤1.准备环境2.执行命令3.执行结果三、使用python的实现步骤1.准备环境2.写代码3.执行结果前言Whisper是一个自动语音识别(ASR,AutomaticSpeechRecognition)系统,OpenAI通过从网络上收集了68万小时的多语言(98种语言)和多任务(multitask)监督数据对
文章目录(零)前言(0.1)我的相关文章索引(0.2)本篇内容阅读提示(一)绘图(1.1)模型(1.1.1)基础模型(Stable-diffusion模型)(1.1.2)人物模型(LoRA模型)(1.2)绘图方式(1.2.1)文生图(TexttoImage)(1.2.1.1)提示词/模板风格(Prompt/Styles)(1.2.1.2)采样(Sampling)(1.2.1.3)修复(RestoreorFix)(1.2.1.4)其它参数(1.2.1.5)插件:可选附加网络(LoRA插件)(Additionalnetworks)(1.2.1.6)插件:ControlNet(1.2.1.7)脚本(
StableDiffusionWebui环境搭建,首先新建一个项目: 然后,选择镜像。注意点公开的,已近做好的这个镜像,superx创建,集成了miniconda3的镜像。然后选择添加数据源,一样,还是点公开,搜索sd_model_spuerx就可以找到了,还是由superx创建。 都选择好之后,选择创建项目。暂不上传代码。然后点击侧边栏代码按钮,然后可以看到运行代码,点他 之后选择主机,注意一定要选显存大一些的,按图来就行。这里还要注意,把19527端口开放了。 等待项目启动后,我们进入开发环境。这里注意,要记录一下公网映射的端口,经常会变,以后服务启动了,要从这个端口去访问。 接下来进入正
Whisper.cpp编译使用whisper.cpp是牛人ggerganov对openai的whisper语音识别模型用C++重新实现的项目,开源在github上,具有轻量、性能高,实用性强等特点。这篇文章主要记录在windows平台,如何使用该模型在本地端进行语音识别。下载whisper.cpp的开源地址在ggerganov/whisper.cpp:PortofOpenAI’sWhispermodelinC/C++(github.com),首先将项目下载在本地。gitclonehttps://github.com/ggerganov/whisper.cppwhisper.cpp项目里提供了几
文章目录(零)前言(一)提示词翻译(PromptTranslator)(1.1)尚需改进(零)前言本篇主要提到了WEBUI的提示词翻译插件,之前我说不喜欢联网的插件,而它是离线翻译。更多不断丰富的内容参考:🔗《继续Stable-DiffusionWEBUI方方面面研究(内容索引)》(一)提示词翻译(PromptTranslator)参考:https://github.com/ParisNeo/prompt_translator💡不用联网/离线翻译😄它采用的是谷歌语言模型,可以将多国语言(50多种)翻译成英文。之所以单独介绍,是因为它不需要联网去接入什么百度,申请API。PS:但第一次使用需要自