草庐IT

diffusion_model

全部标签

如何训练一个简单的stable diffusion模型(附详细注释)

注:代码来自https://github.com/darcula1993/diffusion-models-class-CN/blob/main/unit1/01_introduction_to_diffusers_CN.ipynb 本文是本人学习后的的尝试以及注解一、准备工作"""这行命令使用pip工具来安装或升级多个Python包。具体来说,它执行以下操作:-qq:这是pip的安静模式选项,它会减少输出信息,只显示关键信息,使安装过程更为简洁。-U:这是pip的升级选项,它指示pip升级已经安装的包到最新版本(如果存在新版本)。接下来,列出了要安装或升级的包:diffusers:一个Pyt

Stable Diffusion系列(三):网络分类与选择

文章目录网络分类模型基座模型衍生模型二次元模型2.5D模型写实风格模型名称解读VAELora嵌入文件放置界面使用网络分类当使用SDwebui绘图时,为了提升绘图质量,可以多种网络混合使用,可选的网络包括了模型、VAE、超网络、Lora和嵌入。其中,模型就是我们所熟知的最核心的生成图片的稳定扩散模型,不需要额外的文件就可以直接运行,大小也最大,通常在2GB以上。而其他网络本质上是依附于模型的插件,不能独立运行。在这其中,VAE是模型中用于从潜空间生成图片的网络模块,大小通常为几百MB,注意模型本身自带VAE,但是你可以用选择的其他VAE替换掉这部分;超网络是添加到交叉注意力层的附加网络模块,会改

lag-llama源码解读(Lag-Llama: Towards Foundation Models for Time Series Forecasting)

Lag-Llama:TowardsFoundationModelsforTimeSeriesForecasting文章内容:时间序列预测任务,单变量预测单变量,基于Llama大模型,在zero-shot场景下模型表现优异。创新点,引入滞后特征作为协变量来进行预测。获得不同频率的lag,来自glunoTS库里面的源码def_make_lags(middle:int,delta:int)->np.ndarray:"""Createasetoflagsaroundamiddlepointincluding+/-delta."""returnnp.arange(middle-delta,middle+

Stable Diffusion绘画系列【8】:美食海报设计

《博主简介》小伙伴们好,我是阿旭。专注于人工智能AI、python、计算机视觉相关分享研究。✌更多学习资源,可关注公-仲-hao:【阿旭算法与机器学习】,共同学习交流~👍感谢小伙伴们点赞、关注!《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体检测系统开发】5.【图片风格快速迁移软件开发】6.【人脸表表情识别系统】7.【YOLOv8多目标识别与自动标注软件开发】8.【基于YOLOv8深度学习的行人跌倒检测系统】9.【基于YOLOv8深度学习的P

论文阅读《Efficient and Explicit Modelling of Image Hierarchies for Image Restoration》

论文地址:https://openaccess.thecvf.com/content/CVPR2023/papers/Li_Efficient_and_Explicit_Modelling_of_Image_Hierarchies_for_Image_Restoration_CVPR_2023_paper.pdf源码地址:https://github.com/ofsoundof/GRL-Image-Restoration概述  图像复原任务旨在从低分辨率的图像(模糊,子采样,噪声污染,JPEG压缩)中恢复高质量的图像。图像复原是一个不适定的放问题,因为图像在退化过程中丢失了重要的信息。因此,图

《An End-to-end Model for Entity-level Relation Extraction using Multi-instance Learning》阅读笔记

代码 原文地址 预备知识:1.什么是MIL?多示例学习(MIL)是一种机器学习的方法,它的特点是每个训练数据不是一个单独的实例,而是一个包含多个实例的集合(称为包)。每个包有一个标签,但是包中的实例没有标签。MIL的目的是根据包的标签来学习实例的特征和分类规则,或者根据实例的特征来预测包的标签。MIL的应用场景包括药物活性预测、图像分类、文本分类、关系抽取等。MIL的挑战在于如何处理实例之间的相关性、标签的不确定性和数据的不平衡性。MIL的常用算法有基于贝叶斯、KNN、决策树、规则归纳、神经网络等的方法,以及基于注意力机制、自编码器、变分推断等的方法。 2.什么是基于跨度(span)的命名实体

《An End-to-end Model for Entity-level Relation Extraction using Multi-instance Learning》阅读笔记

代码 原文地址 预备知识:1.什么是MIL?多示例学习(MIL)是一种机器学习的方法,它的特点是每个训练数据不是一个单独的实例,而是一个包含多个实例的集合(称为包)。每个包有一个标签,但是包中的实例没有标签。MIL的目的是根据包的标签来学习实例的特征和分类规则,或者根据实例的特征来预测包的标签。MIL的应用场景包括药物活性预测、图像分类、文本分类、关系抽取等。MIL的挑战在于如何处理实例之间的相关性、标签的不确定性和数据的不平衡性。MIL的常用算法有基于贝叶斯、KNN、决策树、规则归纳、神经网络等的方法,以及基于注意力机制、自编码器、变分推断等的方法。 2.什么是基于跨度(span)的命名实体

论文阅读--High-Resolution Image Synthesis with Latent Diffusion Models

High-ResolutionImageSynthesiswithLatentDiffusionModels论文阅读Abstract&IntroductionDiffusionmodel相比GAN可以取得更好的图片生成效果,然而该模型是一种自回归模型,需要反复迭代计算,因此训练和推理代价都很高。论文提出一种在潜在表示空间(latentspace)上进行diffusion过程的方法,从而能够大大减少计算复杂度,同时也能达到十分不错的图片生成效果。图像符号:在RGB空间:编码器encoder:,将x压缩成低维表示解码器decoder:D,将低维表示z还原成原始图像空间。用于生成控制的条件去噪自编码

stable diffusion 人物高级提示词(一)头部篇

一、女生发型prompt描述推荐用法Longhair长发一定不要和highponytail一同使用Shorthair短发-Curlyhair卷发-Straighthair直发-Ponytail马尾highponytail高马尾,一定不要和longhair一起使用,会冲突Pigtails2条辫子-Braid辫子只写braid也会生成2条辫子,想生成一个的话用(1braids:1.3)Bob波波头樱桃小丸子头、蘑菇头Bun发髻、丸子头-Updohair盘发不能只写updo(会出怪怪的图)Pixiecut精灵短发、赫本头-AmyWinehouse’shairAmyWinehouse头hairlike