草庐IT

性能优化-高通的Hexagon DSP和NPU

原文来自【  Qualcomm’sHexagonDSP,andnow,NPU 】本文主要介绍QualcommHexagonDSP和NPU,这些为处理简单大量运算而设计的硬件。🎬个人简介:一个全栈工程师的升级之路!📋个人专栏:高性能(HPC)开发基础教程🎀CSDN主页 发狂的小花🌄人生秘诀:学习的本质就是极致重复!目录一、前言二、HighLevel三、Frontend四、FetchandDecode五、ScalarIntegerExecution六、VectorExecution(HVX)七、Tensor八、FinalWords九、参考一、前言手机必须处理电信和视听处理,同时最大限度地延长电池寿

高通Hexagon通用计算DSP介绍

QualcommHexagonComputeDSP(cDSP)是高通平台上专门用来做通用计算的硬件加速单元,与主机CPU相比,DSP通常以较低的时钟速度运行,并提供更多的并行指令级。这使得DSP在功耗方面成为CPU的更好替代品。因此,将尽可能多的大型计算密集型任务移植到DSP上,可以降低设备的整体功耗。cDSP主要用途有:摄像头、视频的图像增强相关处理计算机视觉、增强、虚拟现实处理深度学习硬件加速cDSP在SOC架构中位于下图红色框内。cDSP硬件架构HexagonScalarCore        Hexagon标量核心包含4个或更多的DSP硬件线程,每个DSP硬件线程都可以访问Hexago