草庐IT

diffusion_model

全部标签

论文阅读:Large Language Models Are Zero-Shot Time Series Forecasters(2023NIPS)(LLMTime)

摘要文章涉及了两个时间序列的任务:forecasting,imputation.对于预测任务:通过将时间序列编码为一系列数字,可以将时间序列预测任务转化为文本里面的next-token预测任务。在大规模预训练语言模型的基础上,文章提出了一些方法用于有效编码时间序列数据,并将离散分布的编码转换成灵活的连续分布(分布转换部分涉及到诸多统计学知识)。在数值补全任务中,文章展示了语言模型(LLMs)如何通过非数值文本自然处理缺失数据,无需插补,如何适应文本侧面信息,并回答问题以帮助解释预测。方法文章提出了LLMTime模型https://unit8co.github.io/darts/generate

Stable Diffusion本地Docker快速部署

docker拉取腾讯云镜像sudodockerpullgpulab.tencentcloudcr.com/ai/stable-diffusion:1.0.8启动容器并打印日志sudodockerrun-itd--gpus=all--network=host--device=/dev/dri--group-add=video--ipc=host--cap-add=SYS_PTRACE--security-optseccomp=unconfined--name=stable-diffusiongpulab.tencentcloudcr.com/ai/stable-diffusion:1.0.8|x

微软 Power Apps model drven app 模型驱动应用使用Plugin插件实现业务流程跳转阶段功能

微软PowerAppsmodeldrvenapp模型驱动应用使用Plugin插件实现业务流程跳转阶段功能模型驱动应用使用插件实现跳转业务流程阶段跳转功能在实际操作中总会遇到使用业务流程的需求,那么如何使用plugin实现跳转阶段的功能呢需求背景是主表上有业务流程,子表上有一个选项集字段,选项集字段包含所有的业务流程阶段,在更新子表的选项集时主表的业务流程阶段也需要同步跳转。由于创建和更新查询不同,所以可以写两个plugin也可以写在一个中使用message去控制//创建时执行if(Context.MessageName=="Create"){//查询刚刚触发创建的业务流程(业务流程实体)str

21、LiDAR-LLM: Exploring the Potential of Large Language Models for 3D LiDAR Understanding

简介官网 将原始LiDAR数据作为输入,利用LLMs卓越的推理能力,来获得对室外3D场景的全面了解,将3D户外场景认知重构为语言建模问题,如3Dcaptioning,3Dgrounding,3Dquestionanswering。实现流程 给定LiDAR输入L∈Rn×3L\in\R^{n\times3}L∈Rn×3,n是点的数量,使用VoxelNet获取LiDARFeature,考虑到计算成本,沿着z轴展平特征以生成鸟瞰图(BEV)FeatureFv∈Rc×h×wF_v\in\R^{c\timesh\timesw}Fv​∈Rc×h×w,对于最大m个字符的文本输入T,使用LLaMA进行文本特征提

Stable Diffusion WebUI制作光影文字效果

在huggingface上下载control_v1p_sd15_brightness模型。将模型放在stable-diffusion-webui\extensions\sd-webui-controlnet\models目录下。SD参数配置正向提示词:city,Building,tallbuilding,NeonLight,gentlelightshinesthrough,animestyle,painting,highdefinition,lotsofdetails,balancedcolors,warmth,nightstarrysky,peoplewalkingdownthestreet

Stable Diffusion中的Embeddings

什么是Embeddings?    Embeddings是一种数学技术,它允许我们将复杂的数据(如文本或图像)转换为数值向量。这些向量是高维空间中的点,可以捕捉数据的关键特征和属性。在文本处理中,例如,embeddings可以捕捉单词或短语之间的语义关系,而在图像处理中,它们可以表示图像的视觉内容。Embeddings在StableDiffusion中的角色    StableDiffusion是一种基于深度学习的图像生成模型,它使用embeddings来理解和生成图像。该模型通过将文本描述转换为文本嵌入(文本embeddings),并利用这些嵌入来引导图像的生成过程。同样,模型也会将图像内容

【论文+视频控制】23.08.DragNUWA1.5:通过集成文本、图像和轨迹来进行视频生成中的细粒度控制 (24.01.08在stable video diffusion开源模型)

论文链接:DragNUWA:Fine-grainedControlinVideoGenerationbyIntegratingText,Image,andTrajectory代码:https://github.com/ProjectNUWA/DragNUWA一、简介中国科学技术大学+微软亚洲研究院在NUWA多模态模型、StableVideoDiffusion、UniMatch基础上提出的可控视频合成方法提出了同时(simultaneously)引入文本、图像和轨迹信息,从语义(semantic)、空间(spatial)和时间角度(temporalperspectives)对视频内容进行·细粒度

AI文本生图模型Stable Diffusion部分模型叠加效果

兄弟们,最近有个烦恼,就是找图有点费事,干脆自己部署个文本生图模型StableDiffusion,虽然机器性能慢,但是效果还可以,先和大家截图分享下,后面将映射ai.shenjian.online供大家免费使用1.效果预览2.主模型及插件安装下载模型icerealistic_v21.safetensors放到./models/Stable-diffusion/下下载模型国风3放到./models/Stable-diffusion/下下载一些提示词,Cutoff/精准控制物体颜色,AfterDetailer/人脸修复插件,点击InstallfromURLhttps://github.com/Bi

【Stable Diffusion】通过ControlNet修复手臂

ControlNet用处ControlNet是一个用于机器人控制的高度模块化的、灵活的开源框架,它支持各种传感器、执行器和通信协议。ControlNet可以用于各种应用领域,包括但不限于:工业自动化:ControlNet可以用于工业自动化系统中,如装配线、包装和搬运等任务。它可以帮助实现高效、精确和可靠的机器人控制,从而提高生产效率和产品质量。无人驾驶:ControlNet可用于无人驾驶车辆的控制系统,支持各种传感器(如雷达、激光雷达和摄像头)的数据采集和处理,以及执行机构(如电机和制动器)的控制。它可以实现自动驾驶、路径规划和障碍物检测等功能。家庭自动化:ControlNet可用于家庭自动化

用通俗易懂的方式讲解:十分钟读懂 Stable Diffusion 运行原理

AIGC热潮正猛烈地席卷开来,可以说StableDiffusion开源发布把AI图像生成提高了全新高度,特别是ControlNet和T2I-Adapter控制模块的提出进一步提高生成可控性,也在逐渐改变一部分行业的生产模式。惊艳其出色表现,也不禁好奇其背后技术。之前写过一篇实战类的文章一文教会你学会AI绘画利器StableDiffusion本文整理了一些学习过程中记录的技术内容,主要包括StableDiffusion技术运行机制,希望帮助大家知其所以然。喜欢记得收藏、关注、点赞,想进行技术交流,也可以加入我们文章目录用通俗易懂的方式讲解系列技术交流一背景介绍二原理简介三模块分析1Unet网络2