招让_草庐IT

2招让坚持变简单

前言昨天讨论了一个问题，坚持很难，尝试分析得到了两个可能的原因。一、时间管理能力弱二、价值排序和flag不匹配原文请点击：坚持有何难-简书(jianshu.com)面对如何解决坚持的挑战，我做了一些努力尝试，我试着分享。第一，目标要小Flag树立的时候，一定要小，一定要具体，要简单，要轻便。当我们制定的flag比较小的时候，就更有可能实现，一旦实现了，会有成就感，成就感反向来会驱动下一步行动。当然会出现一个状况是有一个很大的目标，很大的flag，当我们的flag足够大的时候，我们必须还具备另外一个能力，就是拆解目标的能力，把目标拆解的颗粒度足够小。比如我说要学习提升，这算一个目标吗？其实算，要

视觉Transformer中ReLU替代softmax，DeepMind新招让成本速降

Transformer架构已经在现代机器学习领域得到了广泛的应用。注意力是transformer的一大核心组件，其中包含了一个softmax，作用是产生token的一个概率分布。softmax有较高的成本，因为其会执行指数计算和对序列长度求和，这会使得并行化难以执行。GoogleDeepMind想到了一个新思路：用某种不一定会输出概率分布的新方法替代softmax运算。他们还观察到：在用于视觉Transformer时，使用ReLU除以序列长度的注意力可以接近或匹敌传统的softmax注意力。论文：https://arxiv.org/abs/2309.08586这一结果为并行化带来了新方案，因为