MindSpore尝鲜之Vmap功能

Dechin的博客 2023-03-28 原文

技术背景

Vmap是一种在python里面经常提到的向量化运算的功能，比如之前大家常用的就是numba和jax中的向量化运算的接口。虽然numpy中也使用到了向量化的运算，比如计算两个numpy数组的加和，就是一种向量化的运算。但是在numpy中模块封装的较好，定制化程度低，但是使用便捷，只需要调用最上层的接口即可。现在最新版本的mindspore也已经推出了vmap的功能，像mindspore、numba还有jax，与numpy的最大区别就是，需要在使用过程中对需要向量化运算的函数额外嵌套一层vmap的函数，这样就可以实现只对需要向量化运算的模块进行扩展。用一个公式来理解向量化运算的话就是：

\[a_1+b_1=c_1\\ a_2+b_2=c_2\\ .\\ .\\ .\\ a_n+b_n=c_n\\ \Downarrow\\ \vec{a}+\vec{b}=\vec{c} \]

安装最新版MindSpore

关于jax中的vmap使用案例，可以参考前面介绍的LINCS约束算法实现和SETTLE约束算法批量化实现这两篇文章，都有使用到jax的vmap功能，这里我们着重介绍的是MindSpore中最新实现的vmap功能。首先我们需要安装mindspore最新的Nightly版本，其对应的是MindSpore的Gitee仓库中的master分支，具体安装指令可以参考其官方链接：

因为我们本地已经安装过Mindspore的旧版本，因此还需要在安装指令之后加上--upgrade操作，否则会导致系统误以为本地已经安装成功，不会执行安装的操作：

$ python3 -m pip install mindspore-cuda11-dev -i https://pypi.tuna.tsinghua.edu.cn/simple --upgrade

Vmap功能测试

这里我们先来看一个比较简单的示例：

In [1]: from mindspore import Tensor

In [2]: from mindspore.ops.functional import vmap

In [3]: y = lambda a,b: a+b

In [4]: A = Tensor([1,2,3])

In [5]: B = Tensor([3,4,5])

In [6]: vmap_y = vmap(y,in_axes=(0,0))

In [7]: y(A[0],B[0]) # 元素加和
Out[7]: Tensor(shape=[], dtype=Int64, value= 4)

In [8]: vmap_y(A,B) # 矢量加和
Out[8]: Tensor(shape=[3], dtype=Int64, value= [4, 6, 8])

在上面的这个示例中，我们定义了一个加法函数y，作用就是把输入的两个对象相加。这里需要注意的是，如果输入给y的是两个Mindspore的Tensor对象，那么会直接返回两个Tensor对应位置相加的结果。但是如果输入给y的是两个普通python的list，则输出的结果会是两个list的拼接，这跟不同类型的加法的实现方式有关，在文末总结中会进行解释。这里我们只是想说明：y本身是一个元素加和的函数，可以通过vmap使其称为矢量加和的函数。关于输入的in_axes参数，指的是扩展的维度。比如我们写了一个支持\((A,A)\times(A,1)\)维度的函数，如果把in_axes参数设置为0，那么就可以得到一个支持计算\((B,A,A)\times(B,A,1)\)维度的函数。其中in_axes参数，决定的是被扩展的维度B所在的位置。这一点我们可以看一下vmap的官方示例：

在这个案例中，也是定义了一个普通的加和函数，通过vmap去扩展不同的维度，大致的计算逻辑为：

\[(A,)+(A,)+(A,)\\ \Downarrow^{in\_axes=(0,1,None)}\\ (B,A)+(A,B)+(A,)=(B,A)+(B,A)+(1,A)=(B,A)\\ \Downarrow^{out\_axes=1}\\ (A,B) \]

其实这个过程中关于in_axes是比较容易可以理解的，但是这个out_axes有时候会让人难以捉摸，在github上专门有人提出了这个issue并有人做出了解释：

结合上面的案例，其实out_axes就是决定了扩展的维度B在结果中的位置，比如out_axes=1，所对应的结果中就是\((x,B,x,...x)\)。也就是说，其不影响计算的结果，但是有可能会对计算结果进行转置操作，在MindSpore和Numpy中称为swap_axes。

总结概要

本文介绍了华为推出的深度学习框架MindSpore中最新支持的vmap功能函数，可以用于向量化的计算，本质上的主要作用是替代并加速python中的for循环的操作。最早是在numba和pytroch、jax中对vmap功能进行了支持，其实numpy中的底层计算也用到了向量化的运算，因此速度才如此之快。vmap在python中更多的是与即时编译功能jit一同使用，能够起到简化编程的同时对性能进行极大程度的优化，尤其是python中的for循环的优化。但是对于一些numpy、jax或者MindSpore中已有的算子而言，还是建议直接使用其已经实现的算子，而不是vmap再手写一个。

版权声明

本文首发链接为：https://www.cnblogs.com/dechinphy/p/ms-vmap.html

作者ID：DechinPhy

更多原著文章请参考：https://www.cnblogs.com/dechinphy/

打赏专用链接：https://www.cnblogs.com/dechinphy/gallery/image/379634.html

腾讯云专栏同步：https://cloud.tencent.com/developer/column/91958

参考链接

https://gitee.com/mindspore/mindspore/blob/master/mindspore/python/mindspore/ops/functional.py#L845

有关MindSpore尝鲜之Vmap功能的更多相关文章

ruby-on-rails - Cucumber 是否只是 rspec 的包装器以帮助将测试组织成功能？ - 2
只是想确保我理解了事情。据我目前收集到的信息，Cucumber只是一个“包装器”，或者是一种通过将事物分类为功能和步骤来组织测试的好方法，其中实际的单元测试处于步骤阶段。它允许您根据事物的工作方式组织您的测试。对吗？最佳答案有点。它是一种组织测试的方式，但不仅如此。它的行为就像最初的Rails集成测试一样，但更易于使用。这里最大的好处是您的session在整个Scenario中保持透明。关于Cucumber的另一件事是您(应该)从使用您的代码的浏览器或客户端的角度进行测试。如果您愿意，您可以使用步骤来构建对象和设置状态，但通常您
ruby-on-rails - rails 功能测试 - 2
在Rails自动生成的功能测试(test/functional/products_controller_test.rb)中，我看到以下代码:classProductsControllerTest我的问题是:方法调用products()在哪里/如何定义？products(:one)到底是什么意思？看代码，大概意思是“创建一个产品”，但是它是如何工作的呢？注意我是Ruby/Rails的新手，如果这些是微不足道的问题，我深表歉意。最佳答案如果您查看test/fixtures文件夹，您会看到一个products.yml文件。这是在您创建
ruby-on-rails - 功能测试 Authlogic？ - 2
在我的一些Controller中，我有一个before_filter检查用户是否登录？用于CRUD操作。application.rbdeflogged_in?unlesscurrent_userredirect_toroot_pathendendprivatedefcurrent_user_sessionreturn@current_user_sessionifdefined?(@current_user_session)@current_user_session=UserSession.findenddefcurrent_userreturn@current_userifdefine
ruby - Ruby 中允许 "p *1..10"打印出数字 1-10 的功能是什么？ - 2
require'pp'p*1..10这会打印出1-10。为什么这么简洁？您还可以用它做什么？最佳答案它是“splat”运算符。它可用于分解数组和范围并在赋值期间收集值。这里收集赋值中的值:a,*b=1,2,3,4=>a=1b=[2,3,4]在此示例中，内部数组([3,4])中的值被分解并收集到包含数组中:a=[1,2,*[3,4]]=>a=[1,2,3,4]您可以定义将参数收集到数组中的函数:deffoo(*args)pargsendfoo(1,2,"three",4)=>[1,2,"three",4]
ruby - 现代计算机的功能是否不足以处理字符串而无需使用符号(在 Ruby 中) - 2
我读过的关于Ruby符号的每一篇文章都在谈论符号相对于字符串的效率。但是，这不是1970年代。我的电脑可以处理一些额外的垃圾收集。我错了吗？我拥有最新最好的奔腾双核处理器和4GBRAM。我认为这应该足以处理一些字符串。最佳答案您的计算机可能能够处理“一点点额外的垃圾收集”，但是当“一点点”发生在运行数百万次的内部循环中时呢？如果它在内存有限的嵌入式系统上运行呢？有很多地方你可以随意使用字符串，但在某些地方你不能。这完全取决于上下文。关于ruby-现代计算机的功能是否不足以处理字符串
ruby - 如何在 Cucumber 的功能名称中使用空格 - 2
我正在使用Windows并尝试运行一个现有的功能包，该功能包最初是在MacOS上构建的，这允许他们通过使用带空格的"\"来解决问题。我正在使用Ruby2.2.3和Cucumber。功能名称包含空格，我无法更改它。我尝试使用""和''来绕过空白，但每次都有同样的问题。这是问题的一个例子。如果我运行:cucumberfeatures/'Namecontainingwhitespaces.feature'它工作正常。但是当我运行时:cucumber-pmy_profile和cucumber.yml包含:my_profile:features/'Namecontainingwhitespace
ruby - 如何测试在运行之间提供功能的 Ruby 脚本？ - 2
单元测试的好方法是测试脚本在执行之间保持正确数据的能力——在使用Ctrl-C终止脚本然后重新运行之后？是否有针对执行类似操作的现有模块或脚本的任何测试可以针对最佳实践进行审查？最佳答案像http://avdi.org/devblog/2010/07/19/greenletters-painless-automation-and-testing-for-command-line-applications/一样使用库或者期望、运行、终止并重新运行您的程序，并检查它是否运行正确。好的做法是将程序设计为独立的模块，每个模块都经过良好测试
vue 实现内容超出两行显示展开更多功能，可依据需求自定义任意行数！ - 2
平时开发中我们经常会遇到这样的需求，在一个不限高度的盒子中会有很多内容，如果全部显示用户体验会非常不好，所以可以先折叠起来，当内容达到一定高度时，显示展开更多按钮，点击即可显示全部内容，先来看看效果图：这样做用户体验瞬间得到提升，接下来看看具体细节。0">主要操作在内容这里{{item.username}},……展开更多样式大家可依据自己项目需求进行设计，这里就不贴了，主要说几个关键的。1、在data中定义三个属性isShowMore:false, //控制展开更多的显示与隐藏textHeight:null, //框中内容的高度status:false, //内容状态是否打开2.计算内容是否
ruby-on-rails - rspec 用户故事功能 vs cucumber - 2
提前说明一下，尽管标题看起来与线程RSpecvsCucumber(RSpecstories)相似，但是我的问题根本不同。我理解测试用户故事和单独测试对象行为之间的区别。我的问题是，为什么Cucumber通常与RSpec结合使用来编写用户故事，而RSpec从1.1开始就具有用户故事功能？是不是因为RSpec的重点仍然是单个对象测试，而Cucumber自那以后一直在大力开发，重点放在用户故事上？上下文切换是一件痛苦的事情，而我们开发人员需要处理足够多的工具。我宁愿只使用RSpec，但如果Cucumber与RSpec有一些重要区别，请告诉我。最佳答案
ruby-on-rails - 'starts_with' 和 'start_with' 在 Ruby 中有相同的功能吗？ - 2
显然他们在任何输入上都给我相同的输出，比如"Rubyisred".start_with?("Ruby")或"Rubyisred".starts_with?("Ruby")两者都给出相同的结果。最佳答案在Ruby添加String#start_with?作为核心库的一部分之前，Rails的主动支持实现了String#starts_with?方法。现在它只是为了向后兼容而保留的别名。是的-他们做同样的事情，第一个来自Ruby，第二个-来自Rails。关于ruby-on-rails-'st