草庐IT

扩散Transformer

全部标签

ICLR 2022: Anomaly Transformer论文阅读笔记+代码复现

本论文全名为AnomalyTransformer:TimeSeriesAnomalyDetectionwithAssociationDescrepancy(通过关联差异进行时序异常检测),主要提出了一种无监督的异常点检测算法,并在6个benchmarks上测试,获取良好结果。论文链接:ANOMALYTRANSFORMER:TIMESERIESANOMALYDETECTIONWITHASSOCIATIONDISCREPANCY论文主要想法作者这里定义了两个概念:prior-association与series-association,用于捕捉时间序列数据中的异常模式和正常模式。将Transfor

ICLR 2022: Anomaly Transformer论文阅读笔记+代码复现

本论文全名为AnomalyTransformer:TimeSeriesAnomalyDetectionwithAssociationDescrepancy(通过关联差异进行时序异常检测),主要提出了一种无监督的异常点检测算法,并在6个benchmarks上测试,获取良好结果。论文链接:ANOMALYTRANSFORMER:TIMESERIESANOMALYDETECTIONWITHASSOCIATIONDISCREPANCY论文主要想法作者这里定义了两个概念:prior-association与series-association,用于捕捉时间序列数据中的异常模式和正常模式。将Transfor

微软OpenAI决裂/Stability AI倒闭,新架构终结Transformer?福布斯2024年AI十大终极预测

新的发展和变化近日,福布斯发布了2024年的10大AI预测,StabilityAI将会倒闭?微软和OpenAI也将分道扬镳?展望2024,AI领域会有哪些发展和变化?据说StabilityAI将会倒闭?而「情同父子」的微软和OpenAI将会出现裂痕?还有新的职位——ChiefAIOfficer即将出现?另外,2024会不会出现足以取代Transformer的新架构呢?最近,福布斯发布了2024年的10大AI预测。01英伟达将成为云服务商虽然全球都在进行争夺GPU的战争,但大多数组织并不会直接向英伟达购买GPU,而是会选择云服务。他们通过亚马逊、微软或者谷歌的云平台访问GPU,而这些大型云服务厂

Transformer 优秀开源工作:timm 库 vision transformer 代码解读

timm库(PyTorchImageModels,简称timm)是一个巨大的PyTorch代码集合,已经被官方使用了。参考:timm视觉库中的create_model函数详解pretrained\color{red}{pretrained}pretrained如果我们传入pretrained=True,那么timm会从对应的URL下载模型权重参数并载入模型,只有当第一次(即本地还没有对应模型参数时)会去下载,之后会直接从本地加载模型权重参数。model=timm.create_model('resnet34',pretrained=True)输出:Downloading:"https://gi

Transformer模型详解

1.前言transformer结构是google在2017年的AttentionIsAllYouNeed论文中提出,在NLP的多个任务上取得了非常好的效果,可以说目前NLP发展都离不开transformer。最大特点是抛弃了传统的CNN和RNN,整个网络结构完全是由Attention机制组成。由于其出色性能以及对下游任务的友好性或者说下游任务仅仅微调即可得到不错效果,在计算机视觉领域不断有人尝试将transformer引入,近期也出现了一些效果不错的尝试,典型的如目标检测领域的detr和可变形detr,分类领域的visiontransformer等等。本文从transformer结构出发,结合

迈向100倍加速:全栈Transformer推理优化

作者| 符尧,爱丁堡大学博士生OneFlow编译翻译|宛子琳、杨婷假设有两家公司,它们拥有同样强大的模型。公司A可以用1个GPU为10个用户提供模型,而公司B可以用1个GPU为20个用户提供模型。从长远来看,谁会在竞争中获胜呢?答案是公司B,因为它的成本更低。假设一位研究人员提出了一种超级聪明的解码方法:这种方法拥有巧妙的算法和扎实的数学基础,但无法与FlashAttention兼容。它能在生产环境中使用吗?可能不行,因为FlashAttention对大规模模型部署至关重要。对Transformer推理的深入理解对研究和生产极为有益。然而在现实中,大规模生产通常与前沿研究的关联并不密切,了解算

【扩散模型Diffusion Model系列】0-从VAE开始(隐变量模型、KL散度、最大化似然与AIGC的关系)

VAEVAE(VariationalAutoEncoder),变分自编码器,是一种无监督学习算法,被用于压缩、特征提取和生成式任务。相比于GAN(GenerativeAdversarialNetwork),VAE在数学上有着更加良好的性质,有利于理论的分析和实现。文章目录VAE1生成式模型的目标——KL散度和最大化似然MLE2从AE到VAE3VAE的损失函数4结语1生成式模型的目标——KL散度和最大化似然MLE生成式模型(GenerativeModel)的目标是学习一个模型,从一个简单的分布p(x)p(x)p(x)中采样出数据xxx,通过生成模型f(x)f(x)f(x)来逼近真实数据的分布pd

谁能撼动Transformer统治地位?Mamba作者谈LLM未来架构

在大模型领域,一直稳站C位的Transformer最近似乎有被超越的趋势。这个挑战者就是一项名为「Mamba」的研究,其在语言、音频和基因组学等多种模态中都达到了SOTA性能。在语言建模方面,无论是预训练还是下游评估,Mamba-3B模型都优于同等规模的Transformer模型,并能与两倍于其规模的Transformer模型相媲美。论文一经发表,引起了不小的轰动。惊叹之余,大家发现论文作者只有两位,一位是卡内基梅隆大学机器学习系助理教授AlbertGu,另一位是Together.AI首席科学家、普林斯顿大学计算机科学助理教授(即将上任)TriDao。这项研究的一个重要创新是引入了一个名为「选

清华大学提出三维重建的新方法:O²-Recon,用2D扩散模型补全残缺的3D物体

在计算机视觉中,物体级别的三维表面重建技术面临诸多挑战。与场景级别的重建技术不同,物体级别的三维重建需要为场景中的每个物体给出独立的三维表示,以支持细粒度的场景建模和理解。这对AR/VR/MR以及机器人相关的应用具有重要意义。许多现有方法利用三维生成模型的隐空间来完成物体级别的三维重建,这些方法用隐空间的编码向量来表示物体形状,并将重建任务建模成对物体位姿和形状编码的联合估计。得益于生成模型隐空间的优秀性质,这些方法可以重建出完整的物体形状,但仅限于特定类别物体的三维重建,如桌子或椅子。即使在这些类别中,这类方法优化得到的形状编码也往往难以准确匹配实际物体的三维形状。另外一些方法则从数据库中检

【Transformer系列(3)】 《Attention Is All You Need》论文超详细解读(翻译+精读)

前言哒哒~时隔好久终于继续出论文带读了,这次回归当然要出一手王炸呀——没错,今天我们要一起学习的就是传说中的Transformer!在2021年Transformer一经论文《AttentionisAllYouNeed》提出,就如龙卷风一般震惊学术界,不仅在NLP领域大杀四方,在CV领域也是非常火,那我们就一起来看看这到底是何方神圣吧!其实这篇论文我上周就读完了,但当时读的云里雾里,太多专业性语言看不懂,所以在这篇论文带读之前出了两篇分别介绍encoder和decoder(【Transformer系列(1)】encoder(编码器)和decoder(解码器))以及注意力机制介绍(【Transf