草庐IT

经典 backbone 总结

文章首发于我的github仓库-cv算法工程师成长之路,欢迎关注我的公众号-嵌入式视觉。目录VGGResNetInceptionv3Resnetv2ResNeXtDarknet53DenseNetCSPNetVoVNet一些结论参考资料VGGVGG网络结构参数表如下图所示。ResNetResNet模型比VGG网络具有更少的滤波器数量和更低的复杂性。比如Resnet34的FLOPs为3.6G,仅为VGG-1919.6G的18%。注意,论文中算的FLOPs,把乘加当作1次计算。ResNet和VGG的网络结构连接对比图,如下图所示。不同层数的Resnet网络参数表如下图所示。看了后续的ResNeXt

经典 backbone 总结

文章首发于我的github仓库-cv算法工程师成长之路,欢迎关注我的公众号-嵌入式视觉。目录VGGResNetInceptionv3Resnetv2ResNeXtDarknet53DenseNetCSPNetVoVNet一些结论参考资料VGGVGG网络结构参数表如下图所示。ResNetResNet模型比VGG网络具有更少的滤波器数量和更低的复杂性。比如Resnet34的FLOPs为3.6G,仅为VGG-1919.6G的18%。注意,论文中算的FLOPs,把乘加当作1次计算。ResNet和VGG的网络结构连接对比图,如下图所示。不同层数的Resnet网络参数表如下图所示。看了后续的ResNeXt

一文搞懂视频编解码原理

一,基本术语1.1,颜色亮度和我们的眼睛二,视频编码的实现原理2.1,视频编码技术概述2.2,帧类型2.3,帧内编码(帧内预测)2.4,帧间编码(帧间预测)三,实际的视频编码器如何工作3.1,视频容器(视频数据封装)3.2,编码器发展历史3.3,通用编码器工作流程3.3.1,第一步-图片分区3.3.2,第二步-预测3.3.3,第三步-转换3.3.4,第四步-量化3.3.5,第五步-熵编码3.3.6,第六步-比特流格式参考资料视频编解码算法分为传统算法和基于深度学习的方法,本文主要介绍基于传统算法的视频编解码技术的原理,部分内容和图片参考网上技术博客(链接已放在文章末尾)。一,基本术语数字图像的

一文搞懂视频编解码原理

一,基本术语1.1,颜色亮度和我们的眼睛二,视频编码的实现原理2.1,视频编码技术概述2.2,帧类型2.3,帧内编码(帧内预测)2.4,帧间编码(帧间预测)三,实际的视频编码器如何工作3.1,视频容器(视频数据封装)3.2,编码器发展历史3.3,通用编码器工作流程3.3.1,第一步-图片分区3.3.2,第二步-预测3.3.3,第三步-转换3.3.4,第四步-量化3.3.5,第五步-熵编码3.3.6,第六步-比特流格式参考资料视频编解码算法分为传统算法和基于深度学习的方法,本文主要介绍基于传统算法的视频编解码技术的原理,部分内容和图片参考网上技术博客(链接已放在文章末尾)。一,基本术语数字图像的

阿里云产品-图像搜索快速测评

背景知识什么是云计算对于纯新人,首先我们需要了解下什么是云计算。所谓云计算,就是指通过互联网,以按需服务的形式提供计算资源。这样企业就无需自行采购、配置或管理资源,而且只需要为实际使用的资源付费。通俗来讲,就是将实体物理计算机提供的各种服务搬到了线上,这样即使我们没有实体电脑也能体验和使用一些计算资源,比如:云服务器、云数据库、人工智能相关服务等。阿里云产品阿里云计算提供的热门产品包括以下几类:计算:如云服务器ECS,可能最为畅销存储:如文件存储NAS网络:如负载均衡SLB、弹性公网IP安全:如WEB应用防火墙容器与中间件:如分布式容器服务平台数据库:如关系型数据库、数据仓库大数据计算:如云原

阿里云产品-图像搜索快速测评

背景知识什么是云计算对于纯新人,首先我们需要了解下什么是云计算。所谓云计算,就是指通过互联网,以按需服务的形式提供计算资源。这样企业就无需自行采购、配置或管理资源,而且只需要为实际使用的资源付费。通俗来讲,就是将实体物理计算机提供的各种服务搬到了线上,这样即使我们没有实体电脑也能体验和使用一些计算资源,比如:云服务器、云数据库、人工智能相关服务等。阿里云产品阿里云计算提供的热门产品包括以下几类:计算:如云服务器ECS,可能最为畅销存储:如文件存储NAS网络:如负载均衡SLB、弹性公网IP安全:如WEB应用防火墙容器与中间件:如分布式容器服务平台数据库:如关系型数据库、数据仓库大数据计算:如云原

互联网技术大佬独立博客推荐

1,bang'sblog17年就是蚂蚁金服P8的前端大佬。博客质量基本都很高,看他的文章会让我得到些思考,比如文章中的“心流”(我的叫法跟他的不一样,但内核一样)的描述,我之前也有过类似的状态,但只有一次,就是高三临场抱佛脚,花了3周让自己的排名进步了近1000名的复习经历,可惜这种状态太难得了,他首先需要的就是无与伦比的专注!2,GuiboWangblog腾讯广告算法大佬的博客,我是通过他的《手撸一个简单深度学习框架》文章找到他的博客站的,网站文章数量不多,但是基本是高质量!作者部分博客文章截图如下:3,yongyuanblog快手算法大佬,专注CBIR(基于内容的图像检索)领域,我是通过他

互联网技术大佬独立博客推荐

1,bang'sblog17年就是蚂蚁金服P8的前端大佬。博客质量基本都很高,看他的文章会让我得到些思考,比如文章中的“心流”(我的叫法跟他的不一样,但内核一样)的描述,我之前也有过类似的状态,但只有一次,就是高三临场抱佛脚,花了3周让自己的排名进步了近1000名的复习经历,可惜这种状态太难得了,他首先需要的就是无与伦比的专注!2,GuiboWangblog腾讯广告算法大佬的博客,我是通过他的《手撸一个简单深度学习框架》文章找到他的博客站的,网站文章数量不多,但是基本是高质量!作者部分博客文章截图如下:3,yongyuanblog快手算法大佬,专注CBIR(基于内容的图像检索)领域,我是通过他

阿里云产品-智能语音交互快速测评

一,产品概述阿里云的智能语音交互产品提供语音识别、语音合成、自然语言理解等技术,实现“能听、会说、懂你”式的智能人机交互体验,适用于智能客服、质检、会议纪要、实时字幕等多个企业应用场景。其主要有以下优势:定制识别及发音:可用于客服、阅读、虚拟人等场景易接入:并提供API和多种SDK识别准确率高:持续迭代提升响应速度快:低延迟,秒级处理返回语音识别结果二,产品在线使用2.1,开通产品服务首先,进入智能语音交互产品首页,单击开通并购买,然后在产品开通页面,选择服务类型并选中服务协议,单击立即开通,即可开通智能语音交互服务。2.2,管理项目登录智能语音交互控制台,创建项目生成Appkey,并进入项目

阿里云产品-智能语音交互快速测评

一,产品概述阿里云的智能语音交互产品提供语音识别、语音合成、自然语言理解等技术,实现“能听、会说、懂你”式的智能人机交互体验,适用于智能客服、质检、会议纪要、实时字幕等多个企业应用场景。其主要有以下优势:定制识别及发音:可用于客服、阅读、虚拟人等场景易接入:并提供API和多种SDK识别准确率高:持续迭代提升响应速度快:低延迟,秒级处理返回语音识别结果二,产品在线使用2.1,开通产品服务首先,进入智能语音交互产品首页,单击开通并购买,然后在产品开通页面,选择服务类型并选中服务协议,单击立即开通,即可开通智能语音交互服务。2.2,管理项目登录智能语音交互控制台,创建项目生成Appkey,并进入项目