大家看完代码不妨看一下后文的详解哦~
默子在原有基础上增加了很多新的内容。
解释的更加详细,更加具体,更加新颖!
废话不多说,我们直接开始。
复制下列代码到IDE中运行
import torch
print('CUDA版本:',torch.version.cuda)
print('Pytorch版本:',torch.__version__)
print('显卡是否可用:','可用' if(torch.cuda.is_available()) else '不可用')
print('显卡数量:',torch.cuda.device_count())
print('是否支持BF16数字格式:','支持' if (torch.cuda.is_bf16_supported()) else '不支持')
print('当前显卡型号:',torch.cuda.get_device_name())
print('当前显卡的CUDA算力:',torch.cuda.get_device_capability())
print('当前显卡的总显存:',torch.cuda.get_device_properties(0).total_memory/1024/1024/1024,'GB')
print('是否支持TensorCore:','支持' if (torch.cuda.get_device_properties(0).major >= 7) else '不支持')
print('当前显卡的显存使用率:',torch.cuda.memory_allocated(0)/torch.cuda.get_device_properties(0).total_memory*100,'%')
如果可以正常使用,大概率是这样的
CUDA版本: 11.7
Pytorch版本: 1.13.1+cu117
显卡是否可用: 可用
显卡数量: 1
是否支持BF16数字格式: 不支持
当前显卡型号: NVIDIA GeForce GTX 960M
当前显卡的CUDA算力: (5, 0)
当前显卡的总显存: 3.9998779296875 GB
是否支持TensorCore: 不支持
当前显卡的显存使用率: 0.0 %
代码逐行剖析:
torch.version.cuda
会输出当前CUDA的版本,一般来说,会有 11.7 和 11.3 (更老的版本可能会出现兼容性问题,建议大家去更新一下,直接到 Nvidia 官网就可以)
torch.__version__ .
会输出当前 Pytorch 的版本,
对于1.13.1+cu117
1.13.0 表示当前Pytorch的大版本,目前主流的版本大约在 1.8.0 - 1.13.0,当大家开始复现代码时,就会发现自己要在电脑上同时装好多个Pytorch版本,所以用 Conda 去管理虚拟环境是很有必要的一件事哦~,大家对Conda虚拟环境管理 感兴趣的话,不妨点个赞,默子看看下期要不要出。
cu113 表示当前 Pytorch 是GPU的,CUDA版本是11.3,如果是 cp39 表示当前 Pytorch 是CPU版本,Python版本是3.9.X
有的同学会看到dev开头的一串序号,dev20230114 表示是开发构建版(Pytorch.Nightly),具体构建日期为2023年1月14日,没有的话则是稳定版(Pytorch.Stable)。
torch.cuda.is_available()
返回GPU是否可用,可用为True,不可用为 False
torch.cuda.device_count()
返回显卡数量,大家的电脑一般都是 1 啦,哈哈哈(友情提示:如果电脑是多GPU的,上述代码只能列出第一个GPU设备的部分信息,并不能列出全部GPU的信息。如果想获取全部信息,可以先获取GPU列表,然后循环输出每个GPU)
torch.cuda.is_bf16_supported()
显卡是否支持BF16计算,支持为True,不支持为 False
BF16,有时也被称为BFloat16或Brain Float16,是一种针对人工智能与深度学习应用程序进行优化的新数字格式。 它在谷歌、 英特尔 、 Arm 和许多其他公司的人工智能加速器得到了广泛的应用。使用BF16主要是因为,神经网络对指数的大小比尾数敏感得多,所以不必使用传统尾数精度更高的FP64或者是FP32。 默子的960M是肯定不支持BF16的,目前支持BF16的显卡有很多,比较大众化的应该就是NVIDIA 老黄家NVIDIA创始人兼首席执行官的 RTX3060 和 RTX3070 了。至于专业的深度学习卡,绝大部分都是支持的。
torch.cuda.get_device_capability()
获取GPU的算力 (CUDA Capability Major/Minor version number) ,对于N卡来说,查看全部型号显卡的算力请访问 https://developer.nvidia.com/cuda-gpus#compute (其余显卡请读者自行搜索吧)
在官方给出的文档中,如果进行神经网络的训练,建议GPU此数值在 5.0 以上(默子的卡刚刚及格,呜呜呜)
torch.cuda.get_device_properties(0).total_memory该条命令可以获取到当前GPU的总显存大小。详细信息可参考Pytorch官方文档https://pytorch.org/docs/stable/generated/torch.cuda.get_device_properties.html
TensorCore 能力传统的N卡GPU都会有CUDA核心,用来处理大量的浮点运算。而 Tensor核心能加速处于深度学习神经网络训练和推理运算核心的矩阵计算,能够在维持超低精度损失的同时大幅加速推理吞吐效率。不过,最近几年的卡才会搭载TensorCore,这个会直接体现在显卡的算力等级上,大于7的显卡才会有搭载 TensorCore。
具体是如何加速的,以及具体会加速多少,这个涉及到CUDA和Tensor核心的底层原理与深度学习相关知识。默子就不在这里展开阐述了,感兴趣的同学可以找一些文章、视频去看看。但就一句话,在深度学习方面,
TensorCore吊打CUDACore。
更多内容将同步发布在作者微信公众号上,感兴趣的同学可以关注喔 ~
公众号名称:
AinfO Tech,下方图片扫码关注~

给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru
这个问题在这里已经有了答案:Checktoseeifanarrayisalreadysorted?(8个答案)关闭9年前。我只是想知道是否有办法检查数组是否在增加?这是我的解决方案,但我正在寻找更漂亮的方法:n=-1@arr.flatten.each{|e|returnfalseife
我收到这个错误:RuntimeError(自动加载常量Apps时检测到循环依赖当我使用多线程时。下面是我的代码。为什么会这样?我尝试多线程的原因是因为我正在编写一个HTML抓取应用程序。对Nokogiri::HTML(open())的调用是一个同步阻塞调用,需要1秒才能返回,我有100,000多个页面要访问,所以我试图运行多个线程来解决这个问题。有更好的方法吗?classToolsController0)app.website=array.join(',')putsapp.websiteelseapp.website="NONE"endapp.saveapps=Apps.order("
我有一个包含多个键的散列和一个字符串,该字符串不包含散列中的任何键或包含一个键。h={"k1"=>"v1","k2"=>"v2","k3"=>"v3"}s="thisisanexamplestringthatmightoccurwithakeysomewhereinthestringk1(withspecialcharacterslike(^&*$#@!^&&*))"检查s是否包含h中的任何键的最佳方法是什么,如果包含,则返回它包含的键的值?例如,对于上面的h和s的例子,输出应该是v1。编辑:只有字符串是用户定义的。哈希将始终相同。 最佳答案
我需要检查DateTime是否采用有效的ISO8601格式。喜欢:#iso8601?我检查了ruby是否有特定方法,但没有找到。目前我正在使用date.iso8601==date来检查这个。有什么好的方法吗?编辑解释我的环境,并改变问题的范围。因此,我的项目将使用jsapiFullCalendar,这就是我需要iso8601字符串格式的原因。我想知道更好或正确的方法是什么,以正确的格式将日期保存在数据库中,或者让ActiveRecord完成它们的工作并在我需要时间信息时对其进行操作。 最佳答案 我不太明白你的问题。我假设您想检查
我在app/helpers/sessions_helper.rb中有一个帮助程序文件,其中包含一个方法my_preference,它返回当前登录用户的首选项。我想在集成测试中访问该方法。例如,这样我就可以在测试中使用getuser_path(my_preference)。在其他帖子中,我读到这可以通过在测试文件中包含requiresessions_helper来实现,但我仍然收到错误NameError:undefinedlocalvariableormethod'my_preference'.我做错了什么?require'test_helper'require'sessions_hel
我的日期格式如下:"%d-%m-%Y"(例如,今天的日期为07-09-2015),我想看看是不是在过去的七天内。谁能推荐一种方法? 最佳答案 你可以这样做:require"date"Date.today-7 关于ruby-检查日期是否在过去7天内,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/32438063/
这里有一个很好的答案解释了如何在Ruby中下载文件而不将其加载到内存中:https://stackoverflow.com/a/29743394/4852737require'open-uri'download=open('http://example.com/image.png')IO.copy_stream(download,'~/image.png')我如何验证下载文件的IO.copy_stream调用是否真的成功——这意味着下载的文件与我打算下载的文件完全相同,而不是下载一半的损坏文件?documentation说IO.copy_stream返回它复制的字节数,但是当我还没有下
我们的git存储库中目前有一个Gemfile。但是,有一个gem我只在我的环境中本地使用(我的团队不使用它)。为了使用它,我必须将它添加到我们的Gemfile中,但每次我checkout到我们的master/dev主分支时,由于与跟踪的gemfile冲突,我必须删除它。我想要的是类似Gemfile.local的东西,它将继承从Gemfile导入的gems,但也允许在那里导入新的gems以供使用只有我的机器。此文件将在.gitignore中被忽略。这可能吗? 最佳答案 设置BUNDLE_GEMFILE环境变量:BUNDLE_GEMFI
这似乎非常适得其反,因为太多的gem会在window上破裂。我一直在处理很多mysql和ruby-mysqlgem问题(gem本身发生段错误,一个名为UnixSocket的类显然在Windows机器上不能正常工作,等等)。我只是在浪费时间吗?我应该转向不同的脚本语言吗? 最佳答案 我在Windows上使用Ruby的经验很少,但是当我开始使用Ruby时,我是在Windows上,我的总体印象是它不是Windows原生系统。因此,在主要使用Windows多年之后,开始使用Ruby促使我切换回原来的系统Unix,这次是Linux。Rub