草庐IT

faster-whisper-webui

全部标签

OpenAI 开源语音识别 Whisper

        Whisper是一个通用语音识别模型。它是在各种音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。               人工智能公司OpenAI 拥有GTP-3语言模型,并为GitHubCopilot提供技术支持的,宣布开源了Whisper自动语音识别系统,OpenAI强调Whisper的语音识别能力已达到人类水准。         在各种语音处理任务中训练Transformer序列到序列模型,包括多语言语音识别、语音翻译、口语识别和语音活动检测。所有这些任务都被联合表示为由解码器预测的令牌序列,允许单一模型取代传统语音处理管道

【奶奶看了也不会】AI绘画 Mac安装stable-diffusion-webui绘制AI妹子保姆级教程

1.作品图2.准备工作目前网上能搜到的stable-diffusion-webui的安装教程都是Window和MacM1芯片的,而对于因特尔芯片的文章少之又少,这就导致我们还在用老Intel芯片的Mac本,看着别人生成美女图片只能眼馋。所以小卷这周末折腾了一天,总算是让老Mac本发挥作用了。先来说说准备工作:Mac笔记本操作系统版本>=13.2.1(亲测10.0版本各种问题无法运行,无奈花了一小时升级系统)Python3.10.6版本(已安装其他版本也不要紧,后面我们用Conda做版本控制)stable-diffusion-webui代码下载,下载地址:stable-diffusion-web

【奶奶看了也不会】AI绘画 Mac安装stable-diffusion-webui绘制AI妹子保姆级教程

1.作品图2.准备工作目前网上能搜到的stable-diffusion-webui的安装教程都是Window和MacM1芯片的,而对于因特尔芯片的文章少之又少,这就导致我们还在用老Intel芯片的Mac本,看着别人生成美女图片只能眼馋。所以小卷这周末折腾了一天,总算是让老Mac本发挥作用了。先来说说准备工作:Mac笔记本操作系统版本>=13.2.1(亲测10.0版本各种问题无法运行,无奈花了一小时升级系统)Python3.10.6版本(已安装其他版本也不要紧,后面我们用Conda做版本控制)stable-diffusion-webui代码下载,下载地址:stable-diffusion-web

Stable-Diffusion-WebUI 搭建使用教程

Stable-Diffusion-Webui是一个基于Gradio库的StableDiffusion的浏览器界面,可以说是AI绘画集合体,支持目前主流的开源AI绘画模型,例如NovelAi/StableDiffusion,有了它,我们就可以很方便地配置和生成AI绘画作品,并且进行各种精细地配置。一、搭建指南1、安装Python3.10.6和git2、下载stable-diffusion-webui源码gitclonehttps://github.com/AUTOMATIC1111/stable-diffusion-webui.git3、将模型文件放在项目根目录下的models/Stable-d

Stable-Diffusion-WebUI 搭建使用教程

Stable-Diffusion-Webui是一个基于Gradio库的StableDiffusion的浏览器界面,可以说是AI绘画集合体,支持目前主流的开源AI绘画模型,例如NovelAi/StableDiffusion,有了它,我们就可以很方便地配置和生成AI绘画作品,并且进行各种精细地配置。一、搭建指南1、安装Python3.10.6和git2、下载stable-diffusion-webui源码gitclonehttps://github.com/AUTOMATIC1111/stable-diffusion-webui.git3、将模型文件放在项目根目录下的models/Stable-d

Faster-RCNN模型跑通总结(使用pytorch1.10+cuda10.2版本)

Faster-RCNN模型搭建跑通总结0、前言1、准备操作系统2、安装驱动及cuda2.1、安装驱动2.2、安装cuda3、安装anaconda和pytorch3.1安装anaconda3.1.1为什么推荐安装anaconda而不是pip安装?3.1.2安装anaconda3.1.3配置国内镜像源3.2安装pytorch3.2.1确认要安装的pytorch版本3.2.2安装pytorch3.2.2.1在conda中创建虚拟环境3.2.2.2激活该虚拟环境3.2.2.3在该环境中安装pytorch3.2.2.4确认安装的pytorch版本4、训练faster-rcnn模型4.1下载模型到本地4.

stable-diffusion-webui安装教程windows10

stable-diffusion-webui安装教程windows10安装python3.10.6安装cuda配置环境修改界面语言本教程提及的文件都在:https://share.weiyun.com/S9QZe9cb,请自行下载获取。安装python3.10.6双击python-3.10.6-amd64.exe,一路确认。安装cuda右键单击屏幕左下角的windows图标(开始菜单),选择并点击WindowsPowershell,在弹出来的蓝框里输入nvidia-smi,在下图红框处查看CUDA版本:在https://developer.nvidia.com/cuda-toolkit-arc

stable-diffusion-webui安装教程windows10

stable-diffusion-webui安装教程windows10安装python3.10.6安装cuda配置环境修改界面语言本教程提及的文件都在:https://share.weiyun.com/S9QZe9cb,请自行下载获取。安装python3.10.6双击python-3.10.6-amd64.exe,一路确认。安装cuda右键单击屏幕左下角的windows图标(开始菜单),选择并点击WindowsPowershell,在弹出来的蓝框里输入nvidia-smi,在下图红框处查看CUDA版本:在https://developer.nvidia.com/cuda-toolkit-arc

stable diffusion webUI异常

Timetaken: 0.00sTorchactive/reserved:2077/2082MiB, SysVRAM:4220/6141MiB(68.72%)在添加面部修复等功能以及设置参数详细等无法正常绘图,把所有的功能取消了便能正常出图,像这种如何解决   

语音识别 - ASR whisper

目录1.简单介绍2. 代码调用1.简单介绍IntroducingWhisperhttps://openai.com/blog/whisper/OpenAI的开源自动语音识别神经网络whisper2. 代码调用安装#whisperpipinstallgit+https://github.com/openai/whisper.git#onUbuntuorDebiansudoaptupdate&&sudoaptinstallffmpeg#更多参考https://github.com/openai/whisperPython调用importwhispermodel=whisper.load_model