草庐IT

transformers

全部标签

ChatGPT危了!「注意力公式」8年神秘bug首曝光,Transformer模型恐大受冲击

「注意力公式」中存在了8年的bug,竟被国外小哥发现了?瞬间,这个话题就在网上炸开了锅。现在基于Transformer打造的主流模型,GPT-4、Lalma2、PaLM等都将受到影响。Eppo初创公司的工程师EvanMiller今天在博客中介绍了这一重大发现,并表示:研究人员上个月分离了bug——但是他们误失了一个简单的解决方案,「为什么LLM设计人员应该停止使用Softmax?」图片那么,究竟是什么bug,能够暗藏8年?作者在博文中,引用了维特根斯坦别有蕴意的一句话,「对于无法言说之事,必须保持沉默」。图片注意力是OffByOne这篇博文标题为「注意力是OffByOne」。图片你能看到这个公

"-webkit-transform"的 iOS Safari 内存使用情况

https://jsfiddle.net/ES4xG/8/使用大量内存。iOSSafari通过某些-webkit-transform指令使用大量内存。这种方法有助于提供更复杂的图形,但似乎会消耗大量内存,甚至可能导致崩溃。上面的演示显示了一个显示150次的文本,否则该文本将在PC浏览器上正常运行:字体大小和元素数量被夸大导致崩溃。-webkit-transform:translate3d(0,0,0)旨在强制GPU加速绘制每个元素。在实际应用中,我们使用的是translateX、Y、Z、scale等看似以相同的方式连接到GPU使用。图像和Sprite也被使用,但它们与崩溃没有直接联系。

"-webkit-transform"的 iOS Safari 内存使用情况

https://jsfiddle.net/ES4xG/8/使用大量内存。iOSSafari通过某些-webkit-transform指令使用大量内存。这种方法有助于提供更复杂的图形,但似乎会消耗大量内存,甚至可能导致崩溃。上面的演示显示了一个显示150次的文本,否则该文本将在PC浏览器上正常运行:字体大小和元素数量被夸大导致崩溃。-webkit-transform:translate3d(0,0,0)旨在强制GPU加速绘制每个元素。在实际应用中,我们使用的是translateX、Y、Z、scale等看似以相同的方式连接到GPU使用。图像和Sprite也被使用,但它们与崩溃没有直接联系。

论文阅读:《PETR: Position Embedding Transformation for Multi-View 3D Object Detection》

图1NuScences纯视觉3D检测榜单(2022.3.18)  这篇论文对应NuScenes纯视觉榜三方法PETR,旷视科技于2022年3月上传至arXiv。PETR是DETR3D的改进,在没有外部训练数据的情况下,性能已经优于DETR3D。本人由于工作原因比较关注ATE(平均目标中心点误差)和AOE(平均目标偏航角误差)两项指标,从图2可以看出,PETR方法AOE指标基本和DETR3D方法持平,但ATE指标除了bicycle类别均优于DETR3D,尤其是bus和constructionvehicle这类大型车辆目标。图2PETR和DETR3D性能对比PETR论文链接:https://arx

论文阅读:《PETR: Position Embedding Transformation for Multi-View 3D Object Detection》

图1NuScences纯视觉3D检测榜单(2022.3.18)  这篇论文对应NuScenes纯视觉榜三方法PETR,旷视科技于2022年3月上传至arXiv。PETR是DETR3D的改进,在没有外部训练数据的情况下,性能已经优于DETR3D。本人由于工作原因比较关注ATE(平均目标中心点误差)和AOE(平均目标偏航角误差)两项指标,从图2可以看出,PETR方法AOE指标基本和DETR3D方法持平,但ATE指标除了bicycle类别均优于DETR3D,尤其是bus和constructionvehicle这类大型车辆目标。图2PETR和DETR3D性能对比PETR论文链接:https://arx

Unity --- UGUI --- Rect Transform(矩形变换) --- 锚点及其相关应用

 1.所有的UI物体都没有Transform组件,取而代之的是Transform组件的派生---RectTransform(矩形变换)2.RectTransform和Transform一样都有旋转和缩放,它两之间的区别是:RectTransform多了:a.Pibot轴心点;b.Anchors锚点;c.宽度,高度和略加改变后的x,y,z3.Posx,Posy,Posz这三个值所表示的是UI物体的轴心点相对于锚点的坐标1.将上面这个Center改为Pivot就可以移动UI物体的轴心点了2.UI物体的轴心点就是上图中的那个蓝色空心圆圈,这个点的坐标就是UI的具体位置,且UI物体的旋转是绕着轴心点旋

【时间序列】Transformer for TimeSeries时序预测算法详解

一、介绍1.1背景2017年,Google的一篇 AttentionIsAllYouNeed 为我们带来了Transformer,其在NLP领域的重大成功展示了它对时序数据的强大建模能力,自然有人想要把Transformer应用到时序数据预测上。在Transformer的基础上构建时序预测能力可以突破以往的诸多限制,最明显的一个增益点是,TransformerforTS可以基于Multi-headAttention结构具备同时建模长期和短期时序特征的能力。本文将要介绍的一个充分利用了Transformer的优势,并在Transformer的基础上改进了Attention的计算方式以适应时序数据

[AI]如何让语言模型LLMs流式输出:HuggingFace Transformers实现

HugginFaceTransforms是一个非常方便的库,集成了非常多SOTA的模型,包含:LLAMA,GPT,ChatGLMMoss,等。目前基本上主流的方案都是基于HugginFaceTransforms这个框架实现的。以前如果要流式输出需要自己去改模型底层的推理逻辑。如ChatGLM,自己实现的流式输出如下:#chatglm-6bmodel/modeling_chatglm.py@torch.no_grad()defstream_chat(self,tokenizer,query:str,history:List[Tuple[str,str]]=None,max_length:int=

flutter - 如何在 Transform 动画 Flutter 中固定位置 'Matrix.translationValues'?

我使用Matrix4.translationValues创建了自定义float操作栏,包括动画子菜单。你可以查看我的gistshere这是我按下float操作按钮后子菜单动画位置的代码:@overrideWidgetbuild(BuildContextcontext){returnStack(children:[Transform(transform:Matrix4.translationValues(0.0,_translateButton.value*1.8,0.0,),child:add(),),Transform(transform:Matrix4.translationVal

flutter - 如何在 Transform 动画 Flutter 中固定位置 'Matrix.translationValues'?

我使用Matrix4.translationValues创建了自定义float操作栏,包括动画子菜单。你可以查看我的gistshere这是我按下float操作按钮后子菜单动画位置的代码:@overrideWidgetbuild(BuildContextcontext){returnStack(children:[Transform(transform:Matrix4.translationValues(0.0,_translateButton.value*1.8,0.0,),child:add(),),Transform(transform:Matrix4.translationVal