草庐IT

2招让坚持变简单

前言昨天讨论了一个问题,坚持很难,尝试分析得到了两个可能的原因。一、时间管理能力弱二、价值排序和flag不匹配原文请点击:坚持有何难-简书(jianshu.com)面对如何解决坚持的挑战,我做了一些努力尝试,我试着分享。第一,目标要小Flag树立的时候,一定要小,一定要具体,要简单,要轻便。当我们制定的flag比较小的时候,就更有可能实现,一旦实现了,会有成就感,成就感反向来会驱动下一步行动。当然会出现一个状况是有一个很大的目标,很大的flag,当我们的flag足够大的时候,我们必须还具备另外一个能力,就是拆解目标的能力,把目标拆解的颗粒度足够小。比如我说要学习提升,这算一个目标吗?其实算,要

视觉Transformer中ReLU替代softmax,DeepMind新招让成本速降

Transformer架构已经在现代机器学习领域得到了广泛的应用。注意力是transformer的一大核心组件,其中包含了一个softmax,作用是产生token的一个概率分布。softmax有较高的成本,因为其会执行指数计算和对序列长度求和,这会使得并行化难以执行。GoogleDeepMind想到了一个新思路:用某种不一定会输出概率分布的新方法替代softmax运算。他们还观察到:在用于视觉Transformer时,使用ReLU除以序列长度的注意力可以接近或匹敌传统的softmax注意力。论文:https://arxiv.org/abs/2309.08586这一结果为并行化带来了新方案,因为