草庐IT

stable-diffusion-AI

全部标签

Stable Diffusion InstantID 炸裂!只需要一张图就可以换脸 | 详细教程

最近AI换脸又火起来了,小红书InstantX团队发布了一款最新的换脸技术InstantID和之前的主流的训练lora换脸不同,InstantID只需要上传一张图就可以实现换脸以及姿势替换!一InstantID介绍InstantID主要分为了三部分IDEmbedding:通过预训练的面部识别模型,将语义人脸特征提取为FaceEmbedding。这种嵌入包含了丰富的语义信息,如面部特征、表情、年龄等,为后续的图像生成提供了坚实的基础。ImageAdapter:引入轻量级的适配模块,将提取的身份信息与文本提示结合。通过解耦的交叉注意力机制,图像和文本能够独立地影响生成过程,同时保持身份信息的同时允

AI引爆算力需求,思腾推出支持大规模深度学习训练的高性能AI服务器

随着这些应用AIGC应用的发布,人工智能变成了街头巷尾人们热议的话题,英伟达CEO黄仁勋在2023年GTC开发者大会上发表了主题演讲时表示:“我们正处于AI的iPhone时刻。”可见AIGC技术对社会的变革性影响,同时也引爆了AI行业对训练和推理的大模型需求。思腾合力是一家人工智能基础架构解决方案供应商,公司成立于2009年,在成立之初就一直致力于AI行业,是英伟达的精英级合作伙伴,拥有自主品牌AI服务器及通用服务器,适用于深度学习训练及推理等场景,尤其是思腾合力自有产品IW4221-8GRs,一款专为AI大模型计算打造的新型GPU集群,接下来给大家介绍一下这款服务器的那些让人不可抗拒的优点:

红衣大叔讲AI:Sora技术原理大揭秘

红衣大叔讲AI:Sora技术原理大揭秘前沿:Sora是一个OpenAI技术大集成模型,融合了ChatGPT、DALLE3,以及把视频融合到Transformer中,生成一个一的视频帧,利用矢量来表示,最后把这个矢量送到Transformer中训练视觉大模型。Sora生成图像能力:Sora是一个文生视频模型,但同样具备生成图像能力,这个创新属于业内第一家。Sora可以生成不同大小,分辨率高达2048x2048的图像例如,充满活力的珊瑚礁,有色彩缤纷的鱼类和海洋生物。苹果树下有一只可爱的小老虎,哑光绘画数字风格,细节华丽Sora技术原理以及“视频帧片”Sora技术原理:衣服破了一个洞怎么办?通常的

【AI大模型应用开发】0.2 智谱AI API接入详细步骤和简单应用

大家好,我是【同学小张】。持续学习,持续干货输出,关注我,跟我一起学AI大模型技能。最近我的OpenAI的APIkey由于调用次数太多被封了…不知道下个月能不能解封。而为了尽可能地不花钱,先来看下国内的大模型API怎么用。本文是智谱AIAPI的使用。0.环境(1)注册并登录智谱AI开发者平台:https://www.zhipuai.cn/原来注册的时候赠送了18块钱的使用额度,不知道现在注册还有没有。(2)获取APIkey(3)安装智谱AIAPI的Python包pipinstall--upgradezhipuai1.调用接口(1)将你的APIKey添加到环境变量中ZHIPU_AI_API_KE

Stable Diffusion的 webui 如何在Windows上使用 AMD GPU显卡?

根据StableDiffusion官方说明webui是不支持AMDGPU显卡的,所以在国内如果想省点事情要玩StableDiffusion(SD)推荐用黄教主的英伟达显卡NVIDIAGPU,可以省心不少。AMD显卡得用webui-directml,这是另外的包,按官方的说明实际操作并不难,下面先说在Windows上的步骤:安装Python3.10.6版(勾选addpython.exetoPATH,具体可以查看下面的参考文献1.),以及git2.39.2版;在DOS窗内执行gitclonehttps://github.com/lshqqytiger/stable-diffusion-webui-

Stable Diffusion插件:EasyPhoto之Lora训练、AI写真、AI视频、AI换装

大家好,我是程序员晓晓今天给大家分享一个特别强大的StableDiffusion插件:EasyPhoto,这个插件一直在迭代,从最开始的AI写真,然后是AI视频,到最近的AI换装,能力一直在持续增强。这个插件的基础能力是Lora训练,只需要5-20张特定人物或者风景的照片,不需要对图片进行任何格式化和打标的处理,也不需要理解各种复杂的参数,就可以生成一个独特的Lora模型;然后基于这个模型,我们就可以生成特定形象的照片、视频,可以文生图(视频),也可以图生图(视频)。下面是我的效果展示,人物形象来自寡姐,最左边这张是原图,右边两张是生成的图片。效果还不错,最有特色的就是寡姐的这个小鼻子,模仿的

【AIGC】Stable Diffusion的模型微调

为什么要做模型微调模型微调可以在现有模型的基础上,让AI懂得如何更精确生成/生成特定的风格、概念、角色、姿势、对象。StableDiffusion模型的微调方法通常依赖于您要微调的具体任务和数据。下面是一个通用的微调过程的概述:准备数据集:准备用于微调的数据集。这包括输入图像和相应的标签(如果适用)。确保数据集与您的微调任务相匹配,并且具有足够的样本量和多样性。选择模型:选择要微调的StableDiffusion模型。根据您的任务需求,选择合适的预训练模型。您可以根据任务的复杂性和数据集的大小选择不同的模型规模。冻结部分层(可选):根据您的需求,决定是否冻结预训练模型的一部分层。通常,您可以选

AIGC实战——扩散模型(Diffusion Model)

AIGC实战——扩散模型0.前言1.去噪扩散概率模型1.1Flowers数据集1.2正向扩散过程1.3重参数化技巧1.4扩散规划1.5逆向扩散过程2.U-Net去噪模型2.1U-Net架构2.2正弦嵌入2.3ResidualBlock2.4DownBlocks和UpBlocks3.训练扩散模型4.去噪扩散概率模型的采样5.扩散模型分析5.1生成图像5.2调整逆扩散步数5.3在图像之间进行插值小结系列链接0.前言与生成对抗网络(GenerativeAdversarialNetwork,GAN)一样,扩散模型是过去十年中最有影响力的生成模型技术之一。在许多基准测试中,当前的扩散模型已经超过了以往最

AI硬件的最新发展

目录前言     1、专用AI芯片:专为智能而生1.1、高并行度:1.2、低功耗:1.3、快速推理:1.4、存储与计算一体化:2、新材料、新结构:迈向量子计算2.1、边缘AI:智能化的最前沿未来展望前言             随着人工智能(AI)技术的不断演进,AI硬件的发展已成为推动这一领域前行的关键因素。无论是在数据中心的高性能计算、在边缘设备的实时处理,还是在消费电子产品的日常应用中,AI硬件的革新都在塑造着我们与技术互动的方式。1、专用AI芯片:专为智能而生        传统的CPU和GPU虽然在处理通用计算任务方面表现出色,但面对AI特定的需求,它们的效率往往不尽如人意。为了解决

认知科学与AI:共同塑造人类未来

1.背景介绍认知科学是研究人类思维、记忆、学习、语言和其他认知过程的科学。认知科学试图理解人类如何处理信息,以及如何进行决策和行动。认知科学的研究范围涵盖了心理学、神经科学、语言学、计算机科学和其他多个学科领域。AI(人工智能)则是试图模仿人类智能的计算机科学。AI的目标是开发一种可以理解自然语言、学习自主决策和进行复杂行动的计算机系统。AI的研究范围包括机器学习、深度学习、自然语言处理、计算机视觉、机器人等多个领域。认知科学和AI之间的关系是紧密的。认知科学为AI提供了理论基础和灵感,而AI又为认知科学提供了实验平台和工具。在过去的几十年里,认知科学和AI的交叉研究已经取得了重要的成果,例如