NVIDIA$CPU$DPU$GPU

Pytorch Mac GPU 训练与测评

今天中午看到Pytorch的官方博客发了AppleM1芯片GPU加速的文章，这是我期待了很久的功能，因此很兴奋，立马进行测试，结论是在MNIST上，速度与P100差不多，相比CPU提速1.7倍。当然这只是一个最简单的例子，不能反映大部分情况。这里详细记录操作的一步步流程，如果你也感兴趣，不妨自己上手一试。加速原理苹果有自己的一套GPU实现APIMetal，而Pytorch此次的加速就是基于Metal，具体来说，使用苹果的MetalPerformanceShaders（MPS）作为PyTorch的后端，可以实现加速GPU训练。MPS后端扩展了PyTorch框架，提供了在Mac上设置和运行操作的脚

测评训练 xff0c xff0 xff python 深度学习 pytorch

PVE配置GPU显卡直通(亲测可用)

PVE配置GPU显卡直通(亲测可用)1.进入网址2.输入用户名密码3.点击local上传镜像4.进入命令行模式shell5.换源aptinstallapt-transport-httpsca-certificatesnano/etc/apt/sources.list保存并替换如下内容：#默认注释了源码镜像以提高aptupdate速度，如有需要可自行取消注释debhttps://mirrors.tuna.tsinghua.edu.cn/debian/bullseyemaincontribnon-free#deb-srchttps://mirrors.tuna.tsinghua.edu.cn/de

直通显卡 span class token linux 服务器运维网络

AIGC靠GPU还是CPU？高性能计算两大技术方向演变

2023年的AI产业可以用风起云涌来形容。ChatGPT的横空出世让生成式AI技术一夜之间红遍全球，很多从未了解过人工智能的普通人也开始对大模型产生了浓厚的兴趣。媒体、调研机构纷纷推出长篇专题，论证ChatGPT、StableDiffusion、Midjourney等文本和图像大模型会对哪些行业产生颠覆式影响；甚至有很多员工和企业开始利用这些大模型提升日常工作中的生产力，乃至取代人类岗位。毫无疑问，2023年将是大模型技术开始爆发的转折点，一场影响深远的技术革命正在徐徐拉开帷幕。在AI行业内，虽然OpenAI凭借ChatGPT暂时处于领先地位，但巨大的市场前景已经吸引了一大批企业与科研机构加入

高性能演变 xff0c xff0 xff AIGC 高性能计算 HPC 并行计算

zsh: bad CPU type in executable: /usr/local/bin/git

MAC安装nvm的时候报错zsh:badCPUtypeinexecutable:/usr/local/bin/git查找原因：通过wheregit可以看到有2个路径一个/usr/bin/git一个/usr/bin/local/gitwhichgit返回/usr/bin/local/git而/usr/bin/local/git--version也报这个错zsh:badCPUtypeinexecutable应该是由于mac自带git，而我又安装了一个git，导致产生冲突解决方式就是卸载掉自己安装的gitsh/usr/local/git/uninstall.sh然后就ok了继续安装nvmsudocu

executable local span class token 前端

nvidia显卡驱动程序旧版本下载

旧版本下载地址：https://www.nvidia.cn/Download/Find.aspx?lang=cn直接进入后选择对应型号，然后下拉就有往期的版本，点击进入后选择下载结束：LastupdatedpostsinttfNVIDIA340.108/390.154PatcherforKernel6.2/6.1/6.0/5.19/5.18/5.17/5.16/5.15/5.14/5.13[BASHScript]Fedora37/36/35NVIDIADriversInstallGuide[530.30.02/525.89.02/520.56.06/515.86.01/510.108.03/4

驱动程序显卡 340.108 NVIDIA 390.157 linux ubuntu debian

Linux提高CPU及内存使用率的脚本

Linux提高CPU及内存使用率的脚本CPU内存参考测试或运维中，有时会特意提高CPU及内存使用率，观察运行情况，以下脚本供参考。CPU#通过以下脚本可将CPU使用率提高到100%，如需调整使用率，只需调整$CPU_NUM的值即可CPU_NUM=$(cat/proc/cpuinfo|grep"processor"|wc-l)#查看本机CPU核数echo$CPU_NUM#每有一核CPU，启动一个dd进程，共启动CPU_NUM个dd进程foriin`seq1$CPU_NUM`do ddif=/dev/zeroof=/dev/null&done#结束上述脚本pkill-9dd内存#!/bin/bas

使用率脚本 span class token linux bash 运维

解决报错：“slow_conv2d_cpu“ not implemented for ‘Half‘ | 训练DreamBooth

用了autodl上的镜像：CrazyBoyM/dreambooth-for-diffusion/dreambooth-for-diffusion:v3，在无卡模式下调试代码到时候，因为没有Cuda支持，无法使用半精度VAE模块进行推理，因此在获取latent图像时出现报错："slow_conv2d_cpu"notimplementedfor'Half'解决方案：参考python-"RuntimeError:"slow_conv2d_cpu"notimplementedfor'Half'"-StackOverflow既然无法使用half精度，那就不进行转换。找到train_dreambooth.

ldquo lsquo xff xff0c 精度 python 人工智能深度学习

Ubuntu20.04 编译 gstreamer 支持gpu硬编解 opencv-python同支持gst

什么是Gstreamer？Gstreamer是一个支持Windows，Linux，Android，iOS的跨平台的多媒体框架，应用程序可以通过管道（Pipeline）的方式，将多媒体处理的各个步骤串联起来，达到预期的效果。每个步骤通过元素（Element）基于GObject对象系统通过插件（plugins）的方式实现，方便了各项功能的扩展。下图是对基于Gstreamer框架的应用的简单分层：可参考新版编解码gstreamer自1.17.1开始，便抛弃了老版本的gpu硬编解方案，采取了新方案，新方案对环境要求放松，意味着更好编译，更稳定：老版方案装一些预环境还比较麻烦，所以建议抛弃老版本，用新版

支持 opencv-python span class token python opencv 开发语言

四大主流cpu架构

四大主流cpu架构：1、X86架构，采用CISC指令集（复杂指令集计算机），程序的各条指令是按顺序串行执行的，每条指令中的各个操作也是按顺序串行执行的。2、ARM架构，是一个32位的精简指令集（RISC）架构。3、RISC-V架构，是基于精简指令集计算（RISC）原理建立的开放指令集架构。4、MIPS架构，是一种采取精简指令集（RISC）的处理器架构，可支持高级语言的优化执行。本教程操作环境：windows7系统、DellG3电脑。中央处理器（CPU）是你智能设备的大脑。它的任务是通过执行一系列指令来驱动你的设备，包括显示屏、触摸屏、调制解调器等，让一坨塑料金属混合物变成闪亮的智能手机或者平

架构主流 span style color

ZKP加速 GPU/FPGA/ASIC

1.引言参考资料有：[1]FigmentCapital团队2023年4月博客AcceleratingZero-KnowledgeProofs[2]Ulvetanna团队2023年5月博客PoseidonMerkleTreesinHardware[3]supranational2023年1月博客OpenVDF:AcceleratingtheNovaSNARK-basedVDF【采用ASIC加速Nova实现的VDF，开源代码见：https://github.com/supranational/minroot_hardware（Verilog）】[4]Ingonyama团队2023年5月博客Intr

加速 FPGA https href mutourend 零知识证明

164 165 166167168 169 170