草庐IT

diffusion_model

全部标签

【CVPR 2023 论文解读】TriDet: Temporal Action Detection with Relative Boundary Modeling

发表时间:CVPR2023作者团队:北航,美团,JDExplore代码链接:GitHub-dingfengshi/TriDet:[CVPR2023]Codeforthepaper,TriDet:TemporalActionDetectionwithRelativeBoundaryModeling[CVPR2023]Codeforthepaper,TriDet:TemporalActionDetectionwithRelativeBoundaryModeling-GitHub-dingfengshi/TriDet:[CVPR2023]Codeforthepaper,TriDet:Temporal

Stable Diffusion使用controlnet报错 mat1 and mat2 shapes cannot be multiplied问题

StableDiffusion使用controlnet报错mat1andmat2shapescannotbemultipliedRuntimeError:mat1andmat2shapescannotbemultiplied(77x1280and768x320)提示:Python运行时抛出了一个异常。请检查疑难解答页面。File"D:\sd-webui-aki-v4.4\extensions-builtin\Lora\networks.py",line429,innetwork_Linear_forwardreturnoriginals.Linear_forward(self,input)Fi

Stable Diffusion生成艺术二维码

StableDiffusion生成艺术二维码文章会有浏览问题,点击此处查看原文首先需要一个StableDiffusion服务环境,《StableDiffusion服务环境搭建(远程服务版)》如果你已经有了那就忽略一、准备一个比较好的二维码底图首先解析二维码链接,这里用草料二维码来实现链接https://cli.im/这里点击解码,来生成二维码链接,接着上传二维码图片,复制二维码改为一个好看的二维码底图,二维码底图也决定了二维码的美观插件地址:https://github.com/antfu/sd-webui-qrcode-toolkit.git安装教程:将上面的插件地址放入扩展仓库地址安装就好

AI绘画Stable Diffusion原理之扩散模型DDPM

前言传送门:stablediffusion:Git|论文stable-diffusion-webui:GitGoogleColabNotebook部署stable-diffusion-webui:GitkaggleNotebook部署stable-diffusion-webui:GitAI绘画,输入一段文本就能生成相关的图像,stablediffusion便是其中一个重要分支。自己对其中的原理比较感兴趣,因此开启这个系列的文章来对stablediffusion的原理进行学习(主要是针对“文生图”[texttoimage])。上述的stable-diffusion-webui是AUTOMATIC

Stable Diffusion集群版--计算巢私有化部署方案

背景说明阿里云计算巢提供了StableDiffusion快速部署及下载自定义模型功能,使用者不需要自己下载代码,不需要自己安装复杂的依赖,不需要了解Git、Python、Docker等技术,只需要在控制台图形界面点击几下鼠标就可以快速启动StableDiffusion服务进行绘画,非技术同学也能轻松搞定。前文计算巢推出了单机版快速部署解决方案,参考如何在阿里云快速启动StableDiffusion轻松玩转AI绘画_AIGC_实战派_阿里云帮助中心针对于多人共同使用出图的场景下,stablediffusionwebui会排队出图的问题,计算巢推出了集群版stablediffusion快速部署的功

AI 绘画Stable Diffusion 研究(十五)SD Embedding详解

大家好,我是风雨无阻。本期内容:Embedding是什么?Embedding有什么作用?Embedding如何下载安装?如何使用Embedding?大家还记得AI绘画StableDiffusion研究(七)一文读懂StableDiffusion工作原理这篇文章中,曾提到过词嵌入(Embedding)吗?我们来简单回顾一下:Embedding将输入的tokens转换为一个连续的向量,然后stablediffusion再将Embedding向量通过texttransformer转换后,作为模型输入,进行训练。那在上一篇中只是简单提到了Embedding,对于我们实际使用stablediffusio

AI 绘画Stable Diffusion 研究(十二)SD数字人制作工具SadTlaker插件安装教程

免责声明:本案例所用安装包免费提供,无任何盈利目的。大家好,我是风雨无阻。想必大家经常看到,无论是在产品营销还是品牌推广时,很多人经常以数字人的方式来为自己创造财富。而市面上的数字人收费都比较昂贵,少则几千,多则上万。那么如何才能拥有一个免费的数字人生成工具呢?其实很简单,只需要在stablediffusion上安装sadtalker插件就能轻松生成自己的数字人。而且只需简单3步即可!大家跟着我的步骤,赶紧实操起来,看看效果吧。注意:本教程适用于秋葉StableDiffusion整合包的SadTlaker安装。第一步,SadTlaker主文件的安装(1)、浏览器中打开SadTalker项目地址

Qt关于Model/View大数据量刷新的处理经验

目录引言可能的问题点及优化方法初始化耗时过长更新item耗时过长显示耗时过长模型过多引言前段时间有同学咨询关于大数据量的Model刷新时卡顿的优化方案,通过评论留言的方式回答了一部分,但感觉不够全面。因为这个是之前项目重点解决的问题,处理的过程中收获颇多,这里就基于之前的项目经验进行完整的总结,希望对大家在处理类似问题的过程中能有所启发。可能的问题点及优化方法在解决问题之前,首先需要先确定问题的原因,因为卡顿这类问题,只是一种表现,可能是多个耗时操作共同导致的现象,需要逐个问题耐心解决,对于陈旧项目特别如此,这里建议使用VS的代码调试工具,定位到耗时的具体代码段,才能高效解决问题。以下从常见的

LLMs:《A Survey on Evaluation of Large Language Models大型语言模型评估综述》理解智能本质(具备推理能力)、AI评估的重要性(识别当前算法的局限性+设

LLMs:《ASurveyonEvaluationofLargeLanguageModels大型语言模型评估综述》翻译与解读导读:该文章首先介绍了人工智能(AI)对机器智能的专注,并探讨了评估AI模型的方法。随后,重点介绍了大语言模型(LLMs)的背景和特点,以及它们在自然语言处理、推理、生成等各类任务中的表现。文章还详细探讨了现有的评估基准和评估方式,包括自动评估和人工评估。在总结部分,突出了LLMs在不同任务中的成功与失败案例,并提出了未来评估LLMs的挑战与机遇,包括设计AGI基准、完整行为评估、鲁棒性评估、动态演进评估、可信度评估等。该文章为评估和提升AI模型提供了全面概述和指导。LL

【Segment Anything Model】三:SAM模型微调自定义数据集,更改混合提示方式:点,框,点框混合

文章目录1.微调SAM预备知识2.环境3.用自己的数据集微调SAM,适配自己的下游任务1.点框结合提示,框架代码2.sam要求的提示输入维度3.自定义数据集预处理数据打包成模型需要的形式**主要是我昨天答应了一个评论说今天更新,眼看快12点了,我得发了。后续再说吧。其实该说的也说完了。有错误明天在更正哦,好困好困🫡点击订阅专栏查看专栏列表和对应知识点,本文为segSAM系列文章,在持续更新。