ViT简述【Transformer】

矩阵模拟！Transformer大模型3D可视化，GPT-3、Nano-GPT每一层清晰可见

「矩阵模拟」的世界或许真的存在。模拟人类神经元，不断进化的Transformer模型，一直以来都深不可测。许多科学家都试着打开这个黑盒，看看究竟是如何工作的。而现在，大模型的矩阵世界，真的被打开了！一位软件工程师BrendanBycroft制作了一个「大模型工作原理3D可视化」网站霸榜HN，效果非常震撼，让你秒懂LLM工作原理。图片1750亿参数的GPT-3，模型层足足有8列，密密麻麻没遍布了整个屏幕。图片GPT-2模型不同参数版本的架构可视化，差异巨大。如下是有150亿参数GPT-2（XL），以及有1.24亿参数GPT-2（Small）。图片图片这个3D模型可视化还展示了，大模型生成内容的每

Transformer算法解读（self-Attention/位置编码/多头注意力/掩码机制/QKV/Transformer堆叠/encoder/decoder）

本文主要从工程应用角度解读Transformer，如果需要从学术或者更加具体的了解Transformer，请参考这篇文章。目录1自然语言处理1.1RNN1.2Transformer1.3传统的word2vec2Attention 2.1Attention是什么意思2.2self-Attention是什么2.3self-attention如何计算？2.3.1如何计算关系2.3.2QKV向量2.3.3计算2.4多头注意力机制3位置信息4堆叠多层5decoder6最终输出结果7整体梳理1自然语言处理1.1RNN RNN系列算法包括GUR、LSTM等变体，主体部分是一样的，内部结构不同。

【论文笔记】OpenAI宫斗背后：发现了可能优于小鸡毛表现的机器人，AGI的希望 Q* search and Q transformer(A star search with Q-Learning)

前言最近OpenAI的宫斗剧上演的精妙绝伦，简直就是《硅谷》+《继承》，强烈推荐这两部剧集。AIGC的群里都在说Q*是揭示AI接近AGI的一篇论文，那就费点时间拨开云雾吧。为了方便大众更好地理解Q*，本人在快速浏览过论文后首先得出此结论公式： Q*= (1992年的Q-learning+1968年的Astar算法)*DeepTransformerLearning 本篇文章解读两篇论文。强烈建议延伸阅读第二篇文章的视频：Q-TransformerQ-Transformer简介之机器人如何实现自主Q学习的动画1、第一篇介绍Q*search论文全称是：A*SEARCHWI

Vit极简原理+pytorch代码

Vit比它爹Transformer步骤要简单的多，需要注意的点也要少得多，最令人兴奋的是它在代码中没有令人头疼的MASK，还有许多简化的操作，容我慢慢道来。原理1、打成patch+线性变化它所解决的核心问题就是如何将图片塞入Transformer，如果每个像素作为输入的话，那么一个小小的224*224的图片的序列长度就会是50176，而nlp的Transformer最初设定长度才是512，并且attention的复杂度是平方级的，这50176令人不敢恭维。Vit无非就是将一张图片打成一个一个的patch，将每个patch作为一个输入，仅此而已。将图片打成patch可以通过很简单的卷积实现。使用

[论文阅读]Ghost-free High Dynamic Range Imaging with Context-aware Transformer

Ghost-freeHDRIwithContext-awareTransformer背景介绍已有算法本文算法实验对比背景介绍高动态范围成像（HDR）是一种图像技术，它能够捕捉到比传统图像更广泛的亮度范围。1997年，PaulDebevec在他的论文《RecoveringHighDynamicRangeRadianceMapsfromPhotographs》中提出了HDR的概念。论文里提出可以通过对同一个场景进行不同曝光时间的拍摄，然后用这些低动态范围（LDR）图像合成一张高动态范围（HDR）图像。这样做可以捕捉到从暗部的阴影到亮部的高光，或者说是高反光的更大动态范围的场景。HDR技术主要应用于

LATR：3D Lane Detection from Monocular Images with Transformer

参考代码：LATR动机与主要工作：之前的3D车道线检测算法使用诸如IPM投影、3Danchor加NMS后处理等操作处理车道线检测，但这些操作或多或少会存在一些负面效应。IPM投影对深度估计和相机内外参数精度有要求，anchor的方式需要一些如NMS的后处理辅助。这篇文章主要的贡献有两点：1）针对车道线的特性基于DETR目标检测算法提出了一种基于landlinequery的检测方法，为了使得query的初始化更合理借鉴了SparseInst方法从2D图像域中用不同实例来初始化query，并且建立车道线query的粒度不是车道线级别而是具体到了车道线上的点。2）用图像特征作为key和val是较难去

Transformer变革3D建模，MeshGPT生成效果惊动专业建模师，网友：革命性idea

在计算机图形学中，「三角形网格」是3D几何物体的主要表现形式，也是游戏、电影和VR界面中主要使用的3D资产表示方法。业界通常基于三角形网格来模拟复杂物体的表面，如建筑、车辆、动物，常见的几何变换、几何检测、渲染着色等动作，也需要基于三角形网格进行。与点云或体素等其他3D形状表示法相比，三角形网格提供了更连贯的表面表示法：更可控、更易操作、更紧凑，可直接用于现代渲染流水线，以更少的基元获得更高的视觉质量。此前，已有研究者尝试过使用体素、点云和神经场等表示方法生成3D模型，这些表示也需要通过后处理转换成网格以在下游应用中使用，例如使用MarchingCubes算法进行iso-surfacing处理

简化版Transformer来了，网友：年度论文

Transformer架构可以说是近期深度学习领域许多成功案例背后的主力军。构建深度Transformer架构的一种简单方法是将多个相同的Transformer「块」（block）依次堆叠起来，但每个「块」都比较复杂，由许多不同的组件组成，需要以特定的排列组合才能实现良好的性能。自从2017年Transformer架构诞生以来，研究者们基于其推出了大量衍生研究，但几乎没有改动过Transformer「块」。那么问题来了，标准Transformer块是否可以简化？在最近的一篇论文中，来自ETHZurich的研究者讨论了如何在不影响收敛特性和下游任务性能的情况下简化LLM所必需的标准Transfo

HarmonyOS简述及开发环境搭建

一、HarmonyOS简介1、介绍HarmonyOS是一款面向万物互联时代的、全新的分布式操作系统。有三大系统特性，分别是：硬件互助，资源共享；一次开发，多端部署；统一OS，弹性部署。HarmonyOS通过硬件互助，资源共享的能力，将多个形态不一的设备进行组网，共同构成一个超级终端，可在超级终端中实现任务分发与数据共享。硬件互助依赖HarmonyOS的分布式软总线，在此基础上，HarmonyOS还具备了分布式硬件虚拟化、分布式数据管理、分布式任务调度等分布式特性。在传统的单设备系统能力基础上，HarmonyOS提出了基于同一套系统能力、适配多种终端形态的分布式理念，能够支持手机、平板、智能穿戴

南开&山大&北理工团队开发trRosettaRNA：利用Transformer网络自动预测RNA 3D结构

RNA3D结构预测是一个长期存在的挑战。受最近蛋白质结构预测领域突破的启发，南开大学、山东大学以及北京理工大学的研究团队开发了trRosettaRNA，这是一种基于深度学习的自动化RNA3D结构预测方法。trRosettaRNA流程包括两个主要步骤：通过transformer网络进行1D和2D几何形状预测；以及通过能量最小化进行的3D结构折叠。基准测试表明trRosettaRNA优于传统的自动化方法。在CASP15和RNA-Puzzles实验的盲测中，对天然RNA的自动trRosettaRNA预测与人类的顶级预测具有竞争力。当通过均方根偏差的Z分数进行测量时，trRosettaRNA的性能也优