草庐IT

昇腾CANN DVPP硬件加速训练数据预处理,友好解决Host CPU预处理瓶

本文分享自华为云社区《昇腾CANN7.0黑科技:DVPP硬件加速训练数据预处理,友好解决HostCPU预处理瓶颈》,作者:昇腾CANN。随着人工智能的快速发展,越来越多的应用场景需要使用机器学习和深度学习模型。AI网络模型的训练一般分成两个关键部分,一个是训练数据预处理,一个是模型训练,如何提升两者的处理性能成为提升模型训练性能的关键。一般情况下,数据加载预处理由hostCPU处理,而模型训练计算是在NPU或GPU上处理的,两者一般并行执行,因此训练一次迭代的时间通常是两个处理时间的最大值。在NPU/GPU上进行模型训练计算,为了充分使用计算资源,一般采用批量数据处理方式,因此一般情况下为提升

昇腾CANN 7.0 黑科技:大模型训练性能优化之道

本文分享自华为云社区《昇腾CANN7.0黑科技:大模型训练性能优化之道》,作者:昇腾CANN。目前,大模型凭借超强的学习能力,已经在搜索、推荐、智能交互、AIGC、生产流程变革、产业提效等场景表现出巨大的潜力。大模型经过海量数据的预训练,通常具有良好的通用性和泛化性。用户基于“大模型预训练+微调”开发范式即可在实际业务场景取得理想的效果。从经济成本和时间成本来看,预训练是构筑各种行业模型的主要部分,优化大模型预训练具有非常重要的意义。OpenAI研究表明:大模型表现好坏强烈依赖于模型规模,弱依赖于架构;模型表现随着计算量、数据量和参数量提升;模型表现随着训练数据量和参数量的提升是可预测的。总体

CANN开发实践:4个DVPP内存问题的典型案例解读

摘要:由于DVPP媒体数据处理功能对存放输入、输出数据的内存有更高的要求(例如,内存首地址128字节对齐),因此需调用专用的内存申请接口,那么本期就分享几个关于DVPP内存问题的典型案例,并给出原因分析及解决方法。本文分享自华为云社区《FAQ_DVPP内存问题案例》,作者:昇腾CANN。DVPP是昇腾AI处理器内置的图像处理单元,通过AscendCL媒体数据处理接口提供强大的媒体处理硬加速能力,主要功能包括图像编解码、视频编解码、图像抠图缩放等。由于媒体数据处理功能对存放输入、输出数据的内存有更高的要求(例如,内存首地址128字节对齐),因此需调用专用的内存申请接口,那么本期就分享几个关于DV

CANN2022训练营第一季,学习笔记——初级应用开发3

 CANN2022训练营第一季,学习笔记(含打卡截图)——初级应用开发3学习笔记模型转换工具(ATC工具)将TensorFlow/Caffe等开源网络的模型通过ATC工具转为昇腾AI处理器支持格式的模型(Model.omfile)流程:开始→环境准备(获取ATC工具、设置环境变量)→模型准备→ATC模型转换(可以根据需要进行配置)→结束ACL简介(见第二节课内容)用于加速推理的应用开发框架(不是新手训练用的)。其向上可以供第三方框架、开发第三方lib库调用,向下可以调用GE执行器、运行管理器等一、开发图片分类运用学习ACL主要接口调用流程(实验ACL开发应用的基本流程):ACL初始化→运行管理

【2023 · CANN训练营第一季】昇腾AI入门课(Pytorch)---昇腾AI入门课(PyTorch)微认证考试

1、下列不属于昇腾计算服务层的是()2、AscendCL的优势包括()3、使用AscendCL开发应用的基本流程,以下正确的是?4、关于AscendCL初始化,以下说法不正确的是?5、以下关于ATC工具说法正确的是6、模型转换工具的名称是?7、关于达芬奇架构中的计算单元,以下说法正确的是8、手工迁移多卡场景下不同的启动方式会对训练性能造成影响,以下选项中性能最高的启动方式是()9、模型迁移时遇到报错,可以采用DEBUG手段进行排查,常用的DEBUG手段包括哪些?10、我们可以使用脚本转换工具进行PyTorch模型迁移,以下关于该脚本转换工具介绍正确的是()11、下列关于AscendCL的说法正

【CANN训练营机器狗系列】安装ROS环境及初体验

实例代码仓地址https://gitee.com/HUAWEI-ASCEND/quadruped-robot实验环境操作系统:Ubuntu20.04CPU:Intel®Xeon®Gold6278CCPU@2.60GHz内存:16GB准备环境安装IntelOneAPIBaseKit(非必须)IntelOneAPI是什么InteloneAPI是一个跨行业、开放、基于标准的统一的编程模型,它为跨CPU、GPU、FPGA、专用加速器的开发者提供统一的体验,包含两个组成部分∶一项行业计划和一款英特尔beta产品。oneAPI开放规范基于行业标准和现有开发者编程模型,广泛适用于不同架构和来自不同供应商的硬

【2023 · CANN训练营第一季】昇腾AI入门课(Pytorch)——第一章学习笔记

第一章昇腾AI基础知识介绍第2节昇腾AI全栈架构昇腾AI全栈可以分成四个大部分:1.应用使能层面,此层面通常包含用于部署模型的软硬件,例如API、SDK、部署平台,模型库等等。2.AI框架层面,此层面包含用于构建模型的训练框架,例如华为的MindSpore、TensorFlow、Pytorch等。3.异构计算架构,偏底层、偏通用的计算框架,用于针对上层AI框架的调用进行加速,力求向上支持多种AI框架,并在硬件上进行加速。4.计算硬件,本层是AI计算的底座,有了强力的芯片及硬件设备,上层的加速才有实施的基础。第3节异构计算架构CANN华为公司面向计算机视觉、自然语言处理、推荐系统、类机器人等领域

华为CANN训练营笔记[1]——架构介绍

1.课程概述及安排略2.AI应用开发课程2.1昇腾软硬件基础知识入门2.1.1AI基础软硬件平台1.处理器有310和9102.AICore2.1.2异构计算架构CANN华为针对AI场景推出的异构计算架构,包含统一的编程语言、统一网络构图接口、高性能计算引擎以及算子库。1.AscendCL昇腾计算语言开发接口昇腾计算开放编程框架,封装底层昇腾计算服务接口,提升编程易用性。应用开发接口:提供深度学习推理计算,图像预处理,单算子加速计算能力图开发:提供统一网络构图接口(支持通过算子原型构图;支持通过Parser解析为IR图)算子开发:多种算子开发2.昇腾计算服务层昇腾算子库AOL基于深度学习构建的模

CANN训练:模型推理时数据预处理方法及归一化参数计算

摘要:在做基于AscendCL模型推理时,通常使用的有OpenCV、AIPP、DVPP这三种方式,或者是它们的混合方式,本文比较了这三种方式的特点,并以Resnet50的pytorch模型为例,结合训练营提供的sample,说明了分别是如何实现预处理的。本文分享自华为云社区《【2023·CANN训练营第一季】——模型推理时数据预处理方法及归一化参数计算》,作者:dayao。前言:对待推理图片执行模型推理前,需要对图片进行预处理,以满足模型的输入要求。我们可以通过阅读模型训练代码,查看预处理的方法。在做基于AscendCL模型推理时,通常使用的有OpenCV、AIPP、DVPP这三种方式,或者是

CANN训练:模型推理时数据预处理方法及归一化参数计算

摘要:在做基于AscendCL模型推理时,通常使用的有OpenCV、AIPP、DVPP这三种方式,或者是它们的混合方式,本文比较了这三种方式的特点,并以Resnet50的pytorch模型为例,结合训练营提供的sample,说明了分别是如何实现预处理的。本文分享自华为云社区《【2023·CANN训练营第一季】——模型推理时数据预处理方法及归一化参数计算》,作者:dayao。前言:对待推理图片执行模型推理前,需要对图片进行预处理,以满足模型的输入要求。我们可以通过阅读模型训练代码,查看预处理的方法。在做基于AscendCL模型推理时,通常使用的有OpenCV、AIPP、DVPP这三种方式,或者是