CANN_草庐IT

昇腾CANN DVPP硬件加速训练数据预处理，友好解决Host CPU预处理瓶

本文分享自华为云社区《昇腾CANN7.0黑科技：DVPP硬件加速训练数据预处理，友好解决HostCPU预处理瓶颈》，作者：昇腾CANN。随着人工智能的快速发展，越来越多的应用场景需要使用机器学习和深度学习模型。AI网络模型的训练一般分成两个关键部分，一个是训练数据预处理，一个是模型训练，如何提升两者的处理性能成为提升模型训练性能的关键。一般情况下，数据加载预处理由hostCPU处理，而模型训练计算是在NPU或GPU上处理的，两者一般并行执行，因此训练一次迭代的时间通常是两个处理时间的最大值。在NPU/GPU上进行模型训练计算，为了充分使用计算资源，一般采用批量数据处理方式，因此一般情况下为提升

预处理友好 section span AI综合

昇腾CANN 7.0 黑科技：大模型训练性能优化之道

本文分享自华为云社区《昇腾CANN7.0黑科技：大模型训练性能优化之道》，作者：昇腾CANN。目前，大模型凭借超强的学习能力，已经在搜索、推荐、智能交互、AIGC、生产流程变革、产业提效等场景表现出巨大的潜力。大模型经过海量数据的预训练，通常具有良好的通用性和泛化性。用户基于“大模型预训练+微调”开发范式即可在实际业务场景取得理想的效果。从经济成本和时间成本来看，预训练是构筑各种行业模型的主要部分，优化大模型预训练具有非常重要的意义。OpenAI研究表明：大模型表现好坏强烈依赖于模型规模，弱依赖于架构；模型表现随着计算量、数据量和参数量提升；模型表现随着训练数据量和参数量的提升是可预测的。总体

模型性能算子通信大模型

CANN开发实践：4个DVPP内存问题的典型案例解读

摘要：由于DVPP媒体数据处理功能对存放输入、输出数据的内存有更高的要求（例如，内存首地址128字节对齐），因此需调用专用的内存申请接口，那么本期就分享几个关于DVPP内存问题的典型案例，并给出原因分析及解决方法。本文分享自华为云社区《FAQ_DVPP内存问题案例》，作者：昇腾CANN。DVPP是昇腾AI处理器内置的图像处理单元，通过AscendCL媒体数据处理接口提供强大的媒体处理硬加速能力，主要功能包括图像编解码、视频编解码、图像抠图缩放等。由于媒体数据处理功能对存放输入、输出数据的内存有更高的要求（例如，内存首地址128字节对齐），因此需调用专用的内存申请接口，那么本期就分享几个关于DV

典型案例典型 data-pid span data 人工智能

CANN2022训练营第一季，学习笔记——初级应用开发3

CANN2022训练营第一季，学习笔记（含打卡截图）——初级应用开发3学习笔记模型转换工具（ATC工具）将TensorFlow/Caffe等开源网络的模型通过ATC工具转为昇腾AI处理器支持格式的模型（Model.omfile）流程：开始→环境准备（获取ATC工具、设置环境变量）→模型准备→ATC模型转换（可以根据需要进行配置）→结束ACL简介（见第二节课内容）用于加速推理的应用开发框架（不是新手训练用的）。其向上可以供第三方框架、开发第三方lib库调用，向下可以调用GE执行器、运行管理器等一、开发图片分类运用学习ACL主要接口调用流程（实验ACL开发应用的基本流程）：ACL初始化→运行管理

mdash 应用开发 xff strong xff0c 华为云

【2023 · CANN训练营第一季】昇腾AI入门课（Pytorch)---昇腾AI入门课（PyTorch）微认证考试

1、下列不属于昇腾计算服务层的是()2、AscendCL的优势包括()3、使用AscendCL开发应用的基本流程，以下正确的是？4、关于AscendCL初始化，以下说法不正确的是？5、以下关于ATC工具说法正确的是6、模型转换工具的名称是？7、关于达芬奇架构中的计算单元，以下说法正确的是8、手工迁移多卡场景下不同的启动方式会对训练性能造成影响，以下选项中性能最高的启动方式是()9、模型迁移时遇到报错，可以采用DEBUG手段进行排查，常用的DEBUG手段包括哪些?10、我们可以使用脚本转换工具进行PyTorch模型迁移，以下关于该脚本转换工具介绍正确的是()11、下列关于AscendCL的说法正

入门认证考试 blockquote 插入 img 人工智能 pytorch 深度学习

【CANN训练营机器狗系列】安装ROS环境及初体验

实例代码仓地址https://gitee.com/HUAWEI-ASCEND/quadruped-robot实验环境操作系统：Ubuntu20.04CPU：Intel®Xeon®Gold6278CCPU@2.60GHz内存：16GB准备环境安装IntelOneAPIBaseKit（非必须）IntelOneAPI是什么InteloneAPI是一个跨行业、开放、基于标准的统一的编程模型，它为跨CPU、GPU、FPGA、专用加速器的开发者提供统一的体验，包含两个组成部分∶一项行业计划和一款英特尔beta产品。oneAPI开放规范基于行业标准和现有开发者编程模型，广泛适用于不同架构和来自不同供应商的硬

训练营机器 span class 英特 ubuntu linux 运维

【2023 · CANN训练营第一季】昇腾AI入门课（Pytorch)——第一章学习笔记

第一章昇腾AI基础知识介绍第2节昇腾AI全栈架构昇腾AI全栈可以分成四个大部分：1．应用使能层面，此层面通常包含用于部署模型的软硬件，例如API、SDK、部署平台，模型库等等。2.AI框架层面，此层面包含用于构建模型的训练框架，例如华为的MindSpore、TensorFlow、Pytorch等。3．异构计算架构，偏底层、偏通用的计算框架，用于针对上层AI框架的调用进行加速，力求向上支持多种AI框架，并在硬件上进行加速。4．计算硬件，本层是AI计算的底座，有了强力的芯片及硬件设备，上层的加速才有实施的基础。第3节异构计算架构CANN华为公司面向计算机视觉、自然语言处理、推荐系统、类机器人等领域

mdash 训练营 xff xff0 xff0c 人工智能学习华为昇腾 CANN

华为CANN训练营笔记[1]——架构介绍

1.课程概述及安排略2.AI应用开发课程2.1昇腾软硬件基础知识入门2.1.1AI基础软硬件平台1.处理器有310和9102.AICore2.1.2异构计算架构CANN华为针对AI场景推出的异构计算架构，包含统一的编程语言、统一网络构图接口、高性能计算引擎以及算子库。1.AscendCL昇腾计算语言开发接口昇腾计算开放编程框架，封装底层昇腾计算服务接口，提升编程易用性。应用开发接口：提供深度学习推理计算，图像预处理，单算子加速计算能力图开发：提供统一网络构图接口（支持通过算子原型构图；支持通过Parser解析为IR图）算子开发：多种算子开发2.昇腾计算服务层昇腾算子库AOL基于深度学习构建的模

mdash 训练 xff xff0c img 人工智能深度学习华为云

CANN训练：模型推理时数据预处理方法及归一化参数计算

摘要：在做基于AscendCL模型推理时，通常使用的有OpenCV、AIPP、DVPP这三种方式，或者是它们的混合方式，本文比较了这三种方式的特点，并以Resnet50的pytorch模型为例，结合训练营提供的sample，说明了分别是如何实现预处理的。本文分享自华为云社区《【2023·CANN训练营第一季】——模型推理时数据预处理方法及归一化参数计算》，作者：dayao。前言：对待推理图片执行模型推理前，需要对图片进行预处理，以满足模型的输入要求。我们可以通过阅读模型训练代码，查看预处理的方法。在做基于AscendCL模型推理时，通常使用的有OpenCV、AIPP、DVPP这三种方式，或者是

时数训练 data data-pid https 人工智能

CANN训练：模型推理时数据预处理方法及归一化参数计算

摘要：在做基于AscendCL模型推理时，通常使用的有OpenCV、AIPP、DVPP这三种方式，或者是它们的混合方式，本文比较了这三种方式的特点，并以Resnet50的pytorch模型为例，结合训练营提供的sample，说明了分别是如何实现预处理的。本文分享自华为云社区《【2023·CANN训练营第一季】——模型推理时数据预处理方法及归一化参数计算》，作者：dayao。前言：对待推理图片执行模型推理前，需要对图片进行预处理，以满足模型的输入要求。我们可以通过阅读模型训练代码，查看预处理的方法。在做基于AscendCL模型推理时，通常使用的有OpenCV、AIPP、DVPP这三种方式，或者是

时数训练 data data-pid https 人工智能