草庐IT

sparse_tensor_dense_matmul_op

全部标签

【论文阅读+复现】SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models

SparseCtrl:在文本到视频扩散模型中添加稀疏控制。(AnimateDiffV3,官方版AnimateDiff+ControlNet,效果很丝滑)code:GitHub-guoyww/AnimateDiff:OfficialimplementationofAnimateDiff.paper:https://arxiv.org/abs/2311.16933目录文章1介绍2背景3方法4实验5结论复现1问题2结果文章1介绍动机:不断调整文字prompt以达到理想效果非常耗时费力,作者希望通过添加额外输入条件(草图、深度和RGB图像)来控制T2V生成。方法:提出SparseCtrl,通过带有附加

DENSE: Data-Free One-Shot Federated Learning论文笔记

摘要DENSE的主要特点单轮通信学习:DENSE允许中央服务器在单次通信轮次中学习全局模型,有效降低了通信成本。现有单轮FL方法的局限性:大多数现有的单轮FL方法不切实际或存在固有限制,例如需要公共数据集,客户端模型同质化,以及需要上传额外的数据或模型信息。DENSE的创新解决方案:采用两阶段框架:数据生成阶段和模型蒸馏阶段。数据生成阶段:使用客户端上传的本地模型集合训练生成器(训练了一个同时考虑相似性、稳定性和可转移性的生成器),生成合成数据。模型蒸馏阶段:将集合模型的知识蒸馏到全局模型中。无需额外信息交换:只需在客户端和服务器之间传输模型参数。无需辅助数据集:不需要额外的训练数据。考虑模型

【PyTorch】第一节:张量(Tensor)的定义

作者🕵️‍♂️:让机器理解语言か专栏🎇:PyTorch描述🎨:PyTorch是一个基于Torch的Python开源机器学习库。寄语💓:🐾没有白走的路,每一步都算数!🐾 张量(Tensor)介绍        PyTorch中的所有操作都是在张量的基础上进行的,本实验主要讲解了张量定义和相关张量操作以及GPU和张量之间的关系,为以后使用PyTorch进行深度学习打下坚实的基础。知识点🍉🍓张量的创建🍓张量的运算(加减乘除)🍓自动计算梯度 🍓张量的切片🍓张量的重塑🍓NumPy与Tensor的转换🍓GPU上创建张量张量:Tensor什么是张量?        PyTorch中的所有内容都基于Tenso

强化学习稀疏奖励问题(sparse reward)及解决方法

参考 《EasyRL》1.稀疏奖励通常在训练智能体时,我们希望每一步动作都有相应的奖励。但是某些情况下,智能体并不能立刻获得奖励,比如全局奖励的围棋,最终获胜会得到奖励,但是人们很难去设定中间每步的奖励,这会导致学习缓慢甚至无法进行学习的问题。2.解决方法2.1设计奖励(rewardshaping)除了最终要学习到的目标外,可以额外添加一些奖励用于引导智能体。比如ViZDoom射击游戏,杀了敌人得到正奖励,被杀得到负奖励。探究人员设计了一些新奖励,来引导智能体做的更好,比如掉血就扣分,捡到补给包会加分,待在原地扣分,活着扣一个很小的分(否则智能体只想活着,躲避敌人)等方法。rewardshap

关于pytorch中的tensor用法总结(好办法分享给大家)

tensor-幕布 有思维导图模式。张量类型类型-torch.FloatTensor/torch.float32:单精度浮点型tensor,即32位浮点型。-torch.DoubleTensor/torch.float64:双精度浮点型tensor,即64位浮点型。-torch.HalfTensor/torch.float16:半精度浮点型tensor,即16位浮点型。-torch.ByteTensor/torch.uint8:无符号8位整型tensor。-torch.CharTensor/torch.int8:有符号8位整型tensor。-torch.ShortTensor/torch.in

java - 内部错误 : Bad sparse switch magic - what that means?

今天我得到一个堆栈跟踪,其中有一个非常奇怪的错误。实际上,我可能是第一个得到这个的人(耶!),因为在发布这个问题之前,谷歌中唯一出现的“Badsparseswitchmagic”是在Android源代码中。这是堆栈跟踪的一部分(Android2.3.4):java.lang.InternalError:badsparseswitchmagicatorg.my.app.MyItemAdapter.(MyItemAdapter.java:64)atorg.my.app.MyActivity.onCreate(MyActivity.java:78)从MyItemAdapter构造函数退出时抛

使用ElasticSearch完成大模型+本地知识库:BM25+Embedding模型+Learned Sparse Encoder 新特性

本文指出,将BM25,向量检索Embedding模型后近似KNN相结合,可以让搜索引擎既能理解用户查询的字面意义,又能捕捉到查询的深层次语义,从而提供更全面、更精确的搜索结果。这种混合方法在现代搜索引擎中越来越普遍,因为它结合了传统搜索的精确性和基于AI的搜索的语义理解能力。然后在8.8引入LearnedSparseEncoder新特性,因为densevectorsearch密集向量搜索通常需要在领域内进行重新训练。如果没有在领域内进行重新训练,它们甚至可能表现不如传统的词汇评分,比如Elastic的BM25。HowtogetthebestoflexicalandAI-poweredsearc

pytorch一行实现:计算同一tensor矩阵内每行之间的余弦相似度

文章目录0输入数据1余弦相似度(CosineSimilarity)2torch.cosine_similarity3问题4分析与解决4.1答案5另外的实现方法0输入数据importtorch#设置随机数种子,以保证结果可重现torch.manual_seed(0)a=torch.randn(4,3)tensor([[1.5410,-0.2934,-2.1788],[0.5684,-1.0845,-1.3986],[0.4033,0.8380,-0.7193],[-0.4033,-0.5966,0.1820]])1余弦相似度(CosineSimilarity)  余弦相似度的公式如下所示:2to

【论文笔记】SparseFusion: Fusing Multi-Modal Sparse Representations for Multi-Sensor 3D Object Detection

原文链接:https://arxiv.org/abs/2304.143401.引言  目前的3D目标检测工作都使用模态的密集表达(如BEV、体素、点云),但由于我们只对实例/物体感兴趣,这种密集表达是冗余的。此外,背景噪声对检测有害,且将多模态对齐到同一空间很耗时。  相反,稀疏表达很高效且能达到SotA性能。通常,使用稀疏表达的方法使用物体查询表示物体或实例,并与原始图像和点云特征交互。  本文提出SparseFusion(如下图所示),使用稀疏候选对象产生稀疏表达,使3D目标检测性能高而耗时少。该方法是第一个使用稀疏候选对象和稀疏融合输出的图像-激光雷达融合3D目标检测方法。首先对各模态分

Pytorch中的张量数据类型(Tensor)

文章目录1.常用的张量数据类型2.张量的属性获取3.张量与其他数据类型的相互转换4.生成满足条件的张量5.对张量进行索引和切片6.对张量进行维度变换7.Broadcasting机制8.对张量的拼接和拆分9.张量的数学运算10.张量的布尔值运算11.张量的统计值计算12.where函数和gather函数13.节省内存地进行张量运算14.张量的保存和加载对张量的概述:数学中有标量、向量和矩阵的概念,它们的维度分别是0、1、2。也就是说,标量中元素的位置固定,向量中元素的位置需要通过其索引确定,矩阵中的元素位置需要通过其行号和列号确定。张量可以视为矩阵的扩展,可以用于表示无穷维度的数据。张量(Ten