Transformer与看图说话

推翻Transformer奠基之作疑被拒收，ICLR评审遭质疑！网友大呼黑幕，LeCun自曝类似经历

去年12月，CMU和普林斯顿的2位研究者发布了Mamba架构，瞬间引起AI社区震动！结果，这篇被众人看好有望「颠覆Transformer霸权」的论文，今天竟曝出疑似被顶会拒收？！今早，康奈尔大学副教授SashaRush最先发现，这篇有望成为奠基之作的论文似乎要被ICLR2024拒之门外。并表示，「说实话，我不理解。如果它被拒绝了，我们还有什么机会」。在OpenReview上可以看到，四位审稿人给出的分数是3、6、8、8。虽然这个分数未必会让论文被拒收，但是3分这样的低分，也是很离谱了。牛文得3分，LeCun都出来喊冤这篇由CMU、普林斯顿大学的2位研究人员发表的论文，提出了一种全新的架构Mam

MBTI+大模型=甜甜的恋爱？美国新年AI裁员潮；中国大模型人才分布图；20分钟览尽NLP百年；Transformer新手入门教程 | ShowMeAI日报

👀日报&周刊合集|🎡生产力工具与行业应用大全|🧡点赞关注评论拜托啦！🉑GenAI是美国「2024年裁员潮」罪魁祸首吗？来看几组数据https://www.trueup.io/layoffs补充一份背景：👆上方链接是TrueUp网站关于科技行业裁员、招聘、股票等信息的汇总页面，其中「TheTechLayoffTracker」实时密切追踪着全球科技公司的裁员信息，覆盖大型科技公司、科技独角兽和初创公司等最近美国科技公司出现了新一轮的「裁员潮」。据TrueUp汇总，2024年到目前为止，科技公司的裁员信息已经有92条之多，影响人数多达17,191(平均每天裁员1,011)。2023年这些数据是，科技

2023年最具影响力的 10 篇AI论文（Llama2、SAM、LLM、 Pythia、QLoRA、BloombergGPT、DPO、Mistral 7B、Orca 2、transformer）

2023一年又过去，这一年，AI圈子以一种“狂飙突进”的速度飞速发展，哪怕在这个领域深耕多年的学者们也开始感叹“从没有见过哪个领域在哪一年如同AI领域在2023年这样如此飞速的发展与不断的进化”，毫无疑问，这一年AI，尤其是大模型的爆发将会深刻影响未来我们生活的方方面面。抱着年终总结，也是对过去的2023这一里程碑式的一年回顾与展望的态度，来自AheadAI的SebastianRaschka博士为我们带来了2023年最值得大家关注，也是最有影响力的十篇AI论文，这里我们就和大家一起，用这十篇工作再次为2023年写下一段注脚（十篇论文不分先后）一、Pythia—大模型该如何训练？来自

【论文笔记】Learned Fusion: 3D Object Detection using Calibration-Free Transformer Feature Fusion

原文链接：https://arxiv.org/abs/2312.090821.引言目前的3D目标检测一来传感器的校准信息。这种情况下，校准信息需要及其精确，但在产品尺度上，获取高质量校准信息是很困难的（需要逐传感器校准，且运行过程中可能会变化）。本文基于Transformer，提出无需校准信息的传感器融合方法。3.方法从基于Transformer的方法中直接移除校准信息会导致训练困难。3.1TransFuseDet本文的模型包含融合编码器、上采样和任务头。使用两个ResNet分别编码激光雷达和相机的特征，然后在不同特征尺度上使用Transformer融合，类似TransFuser。但不同的是，

AAAI 2024｜ETH轻量化Transformer最新研究，浅层MLP完全替换注意力模块提升性能

论文题目：RethinkingAttention:ExploringShallowFeed-ForwardNeuralNetworksasanAlternativetoAttentionLayersinTransformers论文链接： https://arxiv.org/abs/2311.10642代码仓库： GitHub-vulus98/Rethinking-attention:Myimplementationoftheoriginaltransformermodel(Vaswanietal.).I'veadditionallyincludedtheplayground.pyfilefor

论文阅读——Slide-Transformer（cvpr2023）

Slide-Transformer:HierarchicalVisionTransformerwithLocalSelf-Attention一、分析1、改进transformer的几个思路：（1）将全局感受野控制在较小区域，如：PVT，DAT，使用稀疏全局注意力来从特征图选择稀疏的键对值，并且在所有查询中共享它们。（2）就是SwinTransformer这条窗口注意力范式，输入被分为特殊设计的窗口，特征在窗口中提取并融合。非常有效，但是有一些局限性，一方面，稀疏全局注意力在捕捉局部特征方面往往较差，并且容易受到关键和值位置的影响，在这些位置，其他区域中的信息特征可能会被丢弃。另一方面，窗口注意

论文阅读笔记AI篇 —— Transformer模型理论+实战 (二)

论文阅读笔记AI篇——Transformer模型理论+实战（二）第二遍阅读（通读）2.1Background2.2ModelArchitecture2.2.1EncoderandDecoderStacks2.2.2ScaledDot-ProductAttention2.2.3Multi-HeadAttention2.3WhySelf-Attention2.4Training2.5Results2.6Conclusion资源地址Attentionisallyouneed.pdf(0积分)-CSDN第二遍阅读（通读）图1——Transformer结构图图2——Attention结构图2.1Back

WidthFormer：实时自动驾驶！助力基于Transformer的BEV方案量产

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&行业理解基于BEV的transformer方案今年量产的主要方案，transformer结构和CNN相比，特征提取能力更强，但需要较多的算力，这也是为什么许多车上都是1~2颗orin芯片支持。所以如何轻量化基于Transformer的BEV方案，成为各大自动驾驶公司后面优化的重点，地平线的最新工作，将Transformer+BVE轻量化，保持了性能领先和速度领先。WidthFormer有哪些优势？WidthFormer是一种轻量级且易于部署的BEV变换方法，它使用单层transformer解码器来计算BEV表示。除此之外，还提出了参考

ConvNet与Transformer谁更强？Meta评测4个领先视觉模型，LeCun转赞

如何根据特定需求选择视觉模型？ConvNet/ViT、supervised/CLIP模型，在ImageNet之外的指标上如何相互比较？来自MABZUAI和Meta的研究人员发表的最新研究，在「非标准」指标上全面比较了常见的视觉模型。论文地址：https://arxiv.org/pdf/2311.09215.pdf就连LeCun称赞道，非常酷的研究，比较了相似大小的ConvNext和VIT架构，无论是在监督模式下训练，还是使用CLIP方法进行训练，并在各种属性上进行了比较。超越ImageNet准确性计算机视觉模型格局，变得越来越多样复杂。从早期的ConvNets到VisionTransforme

云图说丨安全云脑：开箱即用的安全运营体验

摘要：安全云脑（SecMaster）是华为云原生的新一代安全运营中心。为了协助用户在海量日志中高效感知安全事件、快速闭环安全事件，安全云脑将华为云多年的“修炼”成果融合到服务中，用户开箱即可共享成果。本文分享自华为云社区《【云图说】第300期安全云脑——开箱即用的安全运营体验》，作者：阅识风云。安全云脑（SecMaster）是华为云原生的新一代安全运营中心。为了协助用户在海量日志中高效感知安全事件、快速闭环安全事件，安全云脑将华为云多年的“修炼”成果融合到服务中，用户开箱即可共享成果。点击关注，第一时间了解华为云新鲜技术~