faster-whisper-webui

自动语音识别模型whisper安装和初探

whisper介绍whisper是OpenAI最近发布的语音识别模型。OpenAI通过从网络上收集了68万小时的多语言（98种语言）和多任务（multitask）监督数据对Whisper进行了训练，whisper可以执行多语言语音识别、语音翻译和语言识别。whisper安装（Windows）1.CMD命令窗口建立名为whisper的虚拟环境：condacreate-nwhisperpython==3.8condaactivatewhisper注意：whisper要求python版本为3.8以上，否则会报错2.虚拟环境中，安装whisperpipinstall-Uopenai-whisper2.

初探语音 span class token whisper 语音识别

探索【Stable-Diffusion WEBUI】的插件：ControlNet 1.1

文章目录（零）前言（二）ControlNet（v1.1）（2.1）模型（2.2）新版界面（2.3）预处理器（三）偷懒（零）前言本篇主要提到ControlNet新版本的使用，和旧版本的变化，并偷懒参考了别人很不错的文章。更多不断丰富的内容参考：🔗《继续Stable-DiffusionWEBUI方方面面研究(内容索引)》（二）ControlNet（v1.1）之前在上述索引文章里面提到过很重要的插件ControlNet和它的简单展示。并参考了https://openai.wiki/里的详细介绍文章。WEBUI的插件里，ControlNet是少数几个不需要翻译的插件，因为翻译了也没意思：控制网络？目前

Stable-Diffusion ControlNet xff xff0c xff0 stable diffusion 人工智能 AI绘图 WEBUI

Stable Diffusion WebUI 本地部署

前言系统windows10，显卡NVIDIA RTX2060s，分享一下stable diffusion webui 本地部署过程以及遇到的问题。其中一些环境已搭建或者软件已安装过的，可以直接跳过。步骤1.安装gitgit下载地址2.克隆StableDiffusionWebUI 找一个磁盘空间充裕的目录，如d:，右键点击gitbash here，执行命令：gitclonehttps://ghproxy.com/github.com/AUTOMATIC1111/stable-diffusion-webui.git3.安装AnacondaAnnconda下载地址Annconda是python的环境

部署 Diffusion xff0c xff xff0 stable diffusion

Stable Diffusion WebUI 踩坑记录

文章目录installHomebrewinstallpython3.10clonestablediffusionweb设置pip国内源install如果torch安装有问题可以这样安装InstallGFPGAN卡主问题Taming-transformers卡住问题其他疑难问题WIndows和Mac基本上遇到的问题很像，主要是解决「网络」问题。installHomebrew#官方教程/bin/bash-c"$(curl-fsSLhttps://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"#金牛肖马/bin/zsh-c"$

Diffusion 记录 install code https stable diffusion python git

手把手教安装stable-diffusion-webui教程

提示：零经验小白也可以搭建stable-diffusion-webui教程文章目录前言基本准备一、stable-diffusion-webui安装条件二、创建项目1.创建文件夹2.添加模型---没有模型也没有办法使用总结前言基本准备软件准备:编辑器:PyCharm或者VisualStudioCode提示：如果你的编辑器是PyCharm最好看一下版本因为老版本的貌似不支持python3.10，我的2019版的PyCharm不支持python3.10所以使用免费的VisualStudioCode编辑器环境管理软件:Anaconda下载git版本控制软件提示：基本工具某度都有安装教程提示：以下是本篇

手把 stable-diffusion-webui span class token stable diffusion python git 人工智能 AI作画

OpenAI 开源语音识别模型 Whisper 初体验

OpenAI开源语音识别模型Whisper初体验前言一、Whisper9种运行模型以及所需配置二、使用conda和ffmpeg的实现步骤1.准备环境2.执行命令3.执行结果![在这里插入图片描述](https://img-blog.csdnimg.cn/ac08d022f63f4ebca1aa1810871217b3.png)三、使用python的实现步骤1.准备环境2.写代码3.执行结果前言Whisper是一个自动语音识别（ASR，AutomaticSpeechRecognition）系统，OpenAI通过从网络上收集了68万小时的多语言（98种语言）和多任务（multitask）监督数据对

开源语音 span class token 语音识别人工智能

关于【Stable-Diffusion WEBUI】方方面面研究（内容索引）

文章目录（零）前言（0.1）我的相关文章索引（0.2）本篇内容阅读提示（一）绘图（1.1）模型（1.1.1）基础模型（Stable-diffusion模型）（1.1.2）人物模型（LoRA模型）（1.2）绘图方式（1.2.1）文生图（TexttoImage）（1.2.1.1）提示词/模板风格（Prompt/Styles）（1.2.1.2）采样（Sampling）（1.2.1.3）修复（RestoreorFix）（1.2.1.4）其它参数（1.2.1.5）插件：可选附加网络(LoRA插件)（Additionalnetworks）（1.2.1.6）插件：ControlNet（1.2.1.7）脚本（

Stable-Diffusion 方方面面 span class token stable diffusion 稳定扩散 WEB UI AI画图

基于趋动云的 Stable Diffusion Webui 环境搭建

StableDiffusionWebui环境搭建，首先新建一个项目：然后，选择镜像。注意点公开的，已近做好的这个镜像，superx创建，集成了miniconda3的镜像。然后选择添加数据源，一样，还是点公开，搜索sd_model_spuerx就可以找到了，还是由superx创建。都选择好之后，选择创建项目。暂不上传代码。然后点击侧边栏代码按钮，然后可以看到运行代码，点他之后选择主机，注意一定要选显存大一些的，按图来就行。这里还要注意，把19527端口开放了。等待项目启动后，我们进入开发环境。这里注意，要记录一下公网映射的端口，经常会变，以后服务启动了，要从这个端口去访问。接下来进入正

Diffusion Stable xff0c xff xff0 AIGC Stablediffusion webui GPU linux

Whisper.cpp 编译使用

Whisper.cpp编译使用whisper.cpp是牛人ggerganov对openai的whisper语音识别模型用C++重新实现的项目，开源在github上，具有轻量、性能高，实用性强等特点。这篇文章主要记录在windows平台，如何使用该模型在本地端进行语音识别。下载whisper.cpp的开源地址在ggerganov/whisper.cpp:PortofOpenAI’sWhispermodelinC/C++(github.com)，首先将项目下载在本地。gitclonehttps://github.com/ggerganov/whisper.cppwhisper.cpp项目里提供了几

Whisper cpp code whisper_model_load 语音识别人工智能 ffmpeg

发现【Stable-Diffusion WEBUI】的神奇插件：离线自动翻译中文提示词

文章目录（零）前言（一）提示词翻译（PromptTranslator）（1.1）尚需改进（零）前言本篇主要提到了WEBUI的提示词翻译插件，之前我说不喜欢联网的插件，而它是离线翻译。更多不断丰富的内容参考：🔗《继续Stable-DiffusionWEBUI方方面面研究(内容索引)》（一）提示词翻译（PromptTranslator）参考：https://github.com/ParisNeo/prompt_translator💡不用联网/离线翻译😄它采用的是谷歌语言模型，可以将多国语言（50多种）翻译成英文。之所以单独介绍，是因为它不需要联网去接入什么百度，申请API。PS：但第一次使用需要自

Stable-Diffusion Diffusion xff xff0c xff0 stable diffusion 人工智能插件提示词翻译谷歌语言模型

60 61 626364 65 66