草庐IT

faster-whisper-webui

全部标签

目标检测算法(R-CNN,fast R-CNN,faster R-CNN,yolo,SSD,yoloV2,yoloV3,yoloV4,yoloV5,yoloV6,yoloV7)

目标检测算法(R-CNN,fastR-CNN,fasterR-CNN,yolo,SSD,yoloV2,yoloV3,yoloV4,yoloV5,yoloV6,yoloV7)1.引言深度学习目前已经应用到了各个领域,应用场景大体分为三类:物体识别,目标检测,自然语言处理。目标检测可以理解为是物体识别和物体定位的综合,不仅仅要识别出物体属于哪个分类,更重要的是得到物体在图片中的具体位置。为了完成这两个任务,目标检测模型分为两类。一类是two-stage,将物体识别和物体定位分为两个步骤,分别完成,这一类的典型代表是R-CNN,fastR-CNN,faster-RCNN家族。他们识别错误率低,漏识别

Stable Diffusion系列(一):古早显卡上最新版 WebUI 安装及简单操作

文章目录StableDiffusion安装AnimateDiff插件适配sdxl模型适配StableDiffusion使用插件安装界面设置基础文生图加入lora的文生图StableDiffusion安装我的情况比较特殊,显卡版本太老,最高也就支持cuda10.2,因此只能安装pytorch1.12.1,并且无法安装xformers。在安装好虚拟环境和对应pytorch版本后,按照github教程安装stablediffusionwebui即可,在webui.sh中将use_venv=1(默认)修改为use_venv=0,以在当前激活的虚拟环境中运行webui,然后执行bashwebus.sh安

Stable Diffusion WebUI rtx 2060 6G 高清修复 爆显存torch.cuda.OutOfMemoryError: CUDA out of memory.

故障日志***Arguments:('task(9bknuv75x8gvtjn)','1girl,3d,architecture,blurry,blurrybackground,breasts,brownhair,building,cherryblossoms,city,cityscape,cosplayphoto,cowboyshot,day,depthoffield,eastasianarchitecture,flower,lips,longhair,lookingatviewer,mediumbreasts,midriff,motionblur,navel,outdoors,photo\

Stable Diffusion WebUI插件posex安装以及无法使用完美解决办法汇总

posex是一个很好用的3Dopenpose编辑器。我们只需要去官网找到源码就可以查看其用法。对于安装大家应该都知道怎么去安装。1.如何安装(1)一体包安装方式类似于秋叶一体包直接在webui界面搜索posex就可以直接install。最新版本好像已经取消了。(2)手动安装方式直接进入extensions目录,输入如下命令进行安装。pipinstalhttps://github.com/hnmr293/posex.git2.如何使用安装结束之后,我们可以看到extensions文件夹下面已经有了posex文件夹然后重启项目,我们就可以看到webui界面已经有了,初始界面是这个样子。如何使用呢?

stable-diffusion-webui环境部署

stable-diffusion-webui环境部署1.环境创建2.安装依赖库3.下载底模4.获取lora参数文件5.运行代码6.报错信息报错1报错21.环境创建创建虚拟环境condacreate-nenv_stablepython==3.10.0进入虚拟环境condaactivateenv_stableclone源码gitclonehttps://github.com/AUTOMATIC1111/stable-diffusion-webui.git进入项目根目录cdstable-diffusion-webui安装相关库pipinstall-rrequirements.txt-ihttps:/

stable-diffussion-webui+sd-webui-text2video+SadTalker数字人生产力工具安装配置教程(Linux Ubuntu,避坑帖)

0 背景    虽然网络上已经有很多类似的文章,但是讲linux 上通过 stable-diffussion-webui整合各类生产力插件的还比较少,而且亲测有效的更是凤毛菱角。为了帮助大家避坑,笔者特意利用休息的时间写了这篇文章。力求让小白玩家也能够上手。    在linux整合stable-difussion有什么用:    1、帮助创作者提高生产力。因为主流的A100、H100等显卡都是跑在服务器上面的专业卡,而服务器99%是用Linxu系统。当然您硬是要给服务器装Windows也是可以的,但实际上可能会造成性能浪费。在Linux服务器上配置一台A100显卡的GPU服务器即使是用40G版

【深度学习 AIGC】stable diffusion webUI 使用过程,参数设置,教程,使用方法

文章目录docker快速启动vae.ckpt或者.safetensorsCFG指数/CFGScale面部修复/RestorefacesRefinerTiledVAEClipSkipprompt提示词怎么写roopUpscalervisibility(ifscale=1)docker快速启动如果你想使用docker快速启动这个项目,你可以按下面这么操作(显卡支持CUDA11.8)。如果你不懂docker,请参考别的教程。dockerrun-it--network=host--gpus'"device=0"'kevinchina/deeplearning:sdwebuiv1bash#进入容器sux

Stable Diffusion WebUI文生图操作界面基本参数说明!

朋友们,大家好,我是王赞,正在学习研究StableDiffusion,致力于用最为朴素直白的语言为你介绍AI绘画的相关知识。很多朋友在部署好StableDiffusion后,本来想着可以愉快的玩耍了,但是点开一看,密密麻麻的选项立马又劝退了一大批人。别着急,今天这篇教程将会为你解决这些问题,看完这篇文章后,相信你对界面每一处的功能都了如指掌,AI绘图从此刻开始。​如果你觉得文章对你有帮助,请记得点赞支持;OK,话不多说,下面开始正文。StableDiffusionWebUI操作界面​如上图,这是一个简单的WebUI操作界面,可能和你的略有差异,但是不用大惊小怪,我可能额外下载了一些插件,仅此而

Stable Diffusion WebUI扩展adetailer安装及功能介绍

ADetailer是StableDiffusionWebUI的一个扩展,类似于检测细节器。目录安装地址如何安装1.Windows系统(1)手动安装(2)一体机

语音识别whisper的介绍、安装、错误记录

介绍Whisper是OpenAI于2022年9月份开源的通用的语音识别模型。它是在各种音频的大型数据集上训练的模型,也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。论文链接:https://arxiv.org/abs/2212.04356github链接:https://github.com/openai/whisper安装Whisper主要是基于Pytorch实现,所以需要在安装有pytorch的环境中使用。1、安装Whisperpipinstall-Uopenai-whisper或者pipinstallgit+https://github.com/openai/whispe