草庐IT

faster-whisper-webui

全部标签

AI作画工具 stable-diffusion-webui 一键安装工具(A1111-Web-UI-Installer)

安装下载最新版本确保你的NVIDIA显卡驱动程序是最新的(起码不能太老)启动安装程序在欢迎屏幕上单击下一步在屏幕上,选择要安装的内容如果你已经安装了Python3.10和Git,那么可以取消选中如果你不知道这些是什么,就按默认的来。(注意python这玩意,特定版本很重要)点击next等待下载/安装,耐心等待,安装在后台进行这一步的时候注意一下安装路径:整个工具加上模型,体积还是比较大的,最好装在SSD上,硬盘闲置空间大于40GB,以及避免安装路径中出现中文installSDCheckpoint:你要是不知道这个东西是什么,就保持勾选。Iunderstand:用户协议这种东西,懂的都懂,勾上就

Stable Diffusion WebUI制作光影文字效果

在huggingface上下载control_v1p_sd15_brightness模型。将模型放在stable-diffusion-webui\extensions\sd-webui-controlnet\models目录下。SD参数配置正向提示词:city,Building,tallbuilding,NeonLight,gentlelightshinesthrough,animestyle,painting,highdefinition,lotsofdetails,balancedcolors,warmth,nightstarrysky,peoplewalkingdownthestreet

在人工智能时代,Django + 简单的 HTML + Whisper + mixtral-8x7b-instruct + SQLite 实现了一个 TODO应用

这里写自定义目录标题构建AI-poweredTODO应用新的思考构建AI-poweredTODO应用人工智能TODO应用程序演示https://ivan-tolkunov–surukoto-run.modal.run/(警告:该应用程序可能需要长达30秒才能启动)。所有数据在不活动5分钟后重置。试着告诉它:“添加彩虹的每一种颜色”,然后“标记所有提到绿色和紫色之间的待办事项”和“清理完成的待办事项。”新的思考每个人都在构建TODO应用程序,以便开始使用编程语言或技术。我问自己一个问题:在人工智能时代,TODO应用程序会是什么样子?所以我想出了一个主意,构建一个TODO应用程序,你可以简单地与之

WebUI自动化学习(Selenium+Python+Pytest框架)004

接下来,WebUI基础知识最后一篇。1.下拉框操作关于下拉框的处理有两种方式(1)按普通元素定位    安装普通元素的定位方式来定位下拉框,使用元素的操作方法element.click()方法来操作下拉框内容的选择(2)使用Select()类    Select()封装了3种可以查找下拉框选项的方法,实现对下拉框选项的选择,不用在进行点击动作,找到就直接选中了        使用流程:        定位到下拉框元素    driver.find_element_by_xxx('XXX')        实例化下拉框选项类        select=Select(element)      

Whisper——部署fast-whisper中文语音识别模型

whisper:https://github.com/openai/whisper/tree/main参考文章:WhisperOpenAI开源语音识别模型环境配置pipinstallfaster-whispertransformers准备tiny模型需要其他版本的可以自己下载:https://huggingface.co/openai原始中文语音模型:https://huggingface.co/openai/whisper-tiny微调后的中文语音模型:gitclonehttps://huggingface.co/xmzhu/whisper-tiny-zh补下一个:tokenizer.jso

Datawhale学习笔记:faster git丨202401 task01

Datawhale学习笔记:fastergit丨202401task011Git简介1.1版本控制系统版本控制系统是一种用于跟踪和管理文件或代码更改的系统。它允许用户记录文件的每个版本,以便于查看、比较和恢复以前的版本。版本控制系统广泛应用于软件开发、文档管理和任何需要跟踪文件变化的领域。版本控制系统主要有集中式和分布式两种类型:集中式版本控制系统:这种系统有一个中央服务器,所有的版本信息都存储在服务器上。客户端通过与服务器的交互来获取和提交更改。例如,CVS和Subversion就是这种类型的版本控制系统。分布式版本控制系统:与集中式版本控制系统不同,分布式版本控制系统没有中央服务器。每个用

20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结(whisper)

20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结2024/1/2219:52结论:这个软件如果是习作,可以打101分,功能都实现了。如果作为商业软件/共享软件,在易用性等方面,可能就只能有70分了。【百分制】可选的改进部分:0、支持INTEL/AMD/ATI的显卡。并且给NVIDIA的显卡自动安装最新的驱动程序和CUDA版本!【对初学者友好!】1、待转换的音频/视频目录:【中文路径/长目录】对特殊字符的支持2、(识别)翻译成:语言可以按照拼音顺序排序。当然汉语/简体中文/普通话是可以放到最前面的!3、计算精度,只列出来所支持的精度,并给出估计的识别时间!4、打开输

stable-diffusion-webui 安装与运行

大家好,我是水滴~~本文主要介绍在各种显卡环境中,如何安装和运行stable-diffusion-webui,包括:在NVIDIA显卡环境上安装、在AMD显卡环境上安装、在集显或小于4G显卡环境上安装。文章目录在NVIDIA显卡环境上安装下载配置安装与运行在AMD显卡环境上安装在集显或小于4G显卡环境上安装StableDiffusion对显卡有一定的要求,其支持的最小独立显存为4G,8G以上为优,越大越好。对于显卡的厂商,N卡(NVIDIA,英伟达)最佳;A卡(AMD,超威半导体)也能用,但发挥的性能会大打折扣。对于不同情况的显卡,这里也给出了不同的安装教程。所以在安装前先看下自己电脑的配置,

工业级开源facechain人物写真sd-webui插件使用方式

一、简介facechain人物写真应用自8月11日开源了第一版证件照生成后。目前在github(https://github.com/modelscope/facechain)上已有近6K的star,论文链接:FaceChain: A Playground for Identity-Preserving Portrait Generation:https://arxiv.org/abs/2308.14256。facechain社区非常活跃,fork、commit数都很大,相应截图如下:facechain人物写真主要功能如下图所示,同时支持单人、多人写真功能,也可支持上传自炼的人物写真lora风

CV之DL之R-CNN:计算机视觉领域算法总结—R-CNN系列(R-CNN、Fast R-CNN、Faster R-CNN、R-FCN、Mask R-CNN、Cascade R-CNN、Libra R

CV之DL之R-CNN:计算机视觉领域算法总结—R-CNN系列(R-CNN、FastR-CNN、FasterR-CNN、R-FCN、MaskR-CNN、CascadeR-CNN、LibraR-CNN各种对比)的简介、安装、案例应用之详细攻略目录相关文章我们从基于区域的目标检测器(FasterR-CNN,R-FCN,FPN)中学到了什么?Sliding-windowdetectors