译者|涂承烨根据工信部在“2022中国算力大会”上披露,截至7月底,全国在用超大型、大型数据中心共计497个。与此同时,数据中心的耗电量日益成为了不可忽视的问题。除供电外,大型或超大型数据中心的散热占去了大多数能耗。参考中国信息通信研究院泰尔系统实验室联合IBM1月5日发布的《可持续计算蓝皮报告(2022年)》,温控、供电两项的能耗之和超过整体的50%,温控系统为41%,供电系统为10%,IT设备本身为46%。“可持续计算”、“绿色数据中心”一类概念应需而生。十年前,数据的云存储被视为环保救星。但是,数据流的急剧增长正在扩大云的碳足迹,因此,寻找更节能的计算方式似乎比以往任何时候都更加迫切。
由于一些客户的内部系统需要提取一些记录信息,如果手工录入会变得比较麻烦,因此考虑使用百度云的OCR进行图片文字的提取处理,综合比较了一下开源免费的Tesseract类库进行处理,不过识别效果不太理想,因此转为了百度的OCR云接口处理方式,测试的效果比较理想,基本上较少出现错别字。本篇随笔介绍如何利用百度OCR进行图片文字的提取处理,以便从别的系统中批量化获得响应的系统数据,然后进行相应的格式化处理。1、百度OCR服务申请百度的OCR接口调用是收费的接口,不过一般是在超过一定量的情况后进行收费,我们可以申请获得每月免费的额度。百度智能云地址:https://login.bce.baidu.com
由于一些客户的内部系统需要提取一些记录信息,如果手工录入会变得比较麻烦,因此考虑使用百度云的OCR进行图片文字的提取处理,综合比较了一下开源免费的Tesseract类库进行处理,不过识别效果不太理想,因此转为了百度的OCR云接口处理方式,测试的效果比较理想,基本上较少出现错别字。本篇随笔介绍如何利用百度OCR进行图片文字的提取处理,以便从别的系统中批量化获得响应的系统数据,然后进行相应的格式化处理。1、百度OCR服务申请百度的OCR接口调用是收费的接口,不过一般是在超过一定量的情况后进行收费,我们可以申请获得每月免费的额度。百度智能云地址:https://login.bce.baidu.com
“数据湖”、“湖仓一体”及“流批一体”等概念,是近年来大数据领域热度最高的词汇,在各大互联网公司掀起了一波波的热潮,各家公司纷纷推出了自己的技术方案,其中作为全链路数字化技术与服务提供商的袋鼠云,在探索数据湖架构的早期,就调研并选用了Iceberg作为基础框架,在落地过程中深度使用了Iceberg并进行了部分改造,在这个过程中,我们积累出了一些经验和探索实践,希望通过本篇文章与大家分享,也欢迎大家一起共同讨论。一、为什么选择IcebergIceberg作为Apache基金会下的一个顶级项目,是业界公认的开源数据湖实现方案之一,考虑到任何概念的提出本质上是源于底层软硬件技术或架构上取得了新的突破
“数据湖”、“湖仓一体”及“流批一体”等概念,是近年来大数据领域热度最高的词汇,在各大互联网公司掀起了一波波的热潮,各家公司纷纷推出了自己的技术方案,其中作为全链路数字化技术与服务提供商的袋鼠云,在探索数据湖架构的早期,就调研并选用了Iceberg作为基础框架,在落地过程中深度使用了Iceberg并进行了部分改造,在这个过程中,我们积累出了一些经验和探索实践,希望通过本篇文章与大家分享,也欢迎大家一起共同讨论。一、为什么选择IcebergIceberg作为Apache基金会下的一个顶级项目,是业界公认的开源数据湖实现方案之一,考虑到任何概念的提出本质上是源于底层软硬件技术或架构上取得了新的突破
虽然业界有很多的争论,但是LiDAR在目前的L3/L4级自动驾驶系统中依然是不可或缺的传感器,因为它可以提供稠密的3D点云,非常精确的测量物体在3D空间中的位置和形状,而这是摄像头和毫米波雷达很难做到的。那么相应的,基于LiDAR点云的感知算法也就成为了近年来自动驾驶研发的重点之一。与图像的感知算法类似,LiDAR点云的感知算法也分为物体检测(包括跟踪)和语义分割两大类。这篇文章主要关注基于LiDAR点云的物体检测算法,语义分割算法留待以后再做介绍。 很多综述性的文章把LiDAR点云的物体检测算法粗略分为四类:Multi-view方法,Voxel方法,Point方法,以及Point和Voxe
虽然业界有很多的争论,但是LiDAR在目前的L3/L4级自动驾驶系统中依然是不可或缺的传感器,因为它可以提供稠密的3D点云,非常精确的测量物体在3D空间中的位置和形状,而这是摄像头和毫米波雷达很难做到的。那么相应的,基于LiDAR点云的感知算法也就成为了近年来自动驾驶研发的重点之一。与图像的感知算法类似,LiDAR点云的感知算法也分为物体检测(包括跟踪)和语义分割两大类。这篇文章主要关注基于LiDAR点云的物体检测算法,语义分割算法留待以后再做介绍。 很多综述性的文章把LiDAR点云的物体检测算法粗略分为四类:Multi-view方法,Voxel方法,Point方法,以及Point和Voxe
编译|影子策划|云昭云原生时代,选择一家靠谱的云产品,成为了技术人在设计和部署架构时不得不面临的难题。内存、容量、数据库、流量计费等等都是大家常见的可选参数。然而,官网上那些承诺的“高可用、弹性扩容、实时伸缩”的产品,果真靠谱吗?一份来自知名云服务商Fly.io公司Leader的“检讨书”,或许能给大家带来答案。美国初创公司Fly.io,是一个应用服务器提供商,而且即便不考虑其免费套餐,定价也极为亲民,不用担心免费额度用超了以后的价格问题。尤其在容器部署部署方面,颇受开发者追捧:它部署起来极为方便,性价比很高。因而,近几年发展极为快速,但发展快并不总是件好事。最近,一篇“自我检讨”式的博客:
编译|影子策划|云昭云原生时代,选择一家靠谱的云产品,成为了技术人在设计和部署架构时不得不面临的难题。内存、容量、数据库、流量计费等等都是大家常见的可选参数。然而,官网上那些承诺的“高可用、弹性扩容、实时伸缩”的产品,果真靠谱吗?一份来自知名云服务商Fly.io公司Leader的“检讨书”,或许能给大家带来答案。美国初创公司Fly.io,是一个应用服务器提供商,而且即便不考虑其免费套餐,定价也极为亲民,不用担心免费额度用超了以后的价格问题。尤其在容器部署部署方面,颇受开发者追捧:它部署起来极为方便,性价比很高。因而,近几年发展极为快速,但发展快并不总是件好事。最近,一篇“自我检讨”式的博客: