
今年二月,东数西算工程全面启动,在各界掀起了一股热潮,资本、媒体、行业,乃至民众都纷纷加入了话题讨论。
如今,算力不仅仅是数字经济时代的新生产力,更是成为与 “水、电、气” 并驾齐驱的国家级资源,是国民经济发展的重要基础。
工信部《新型数据中心发展三年行动计划(2021-2023 年)》提出,到 2023 年底,全国总算力超过 200 EFLOPS,高性能算力占比达到 10%,国家枢纽节点算力规模占比超过 70%。[1] 随着人工智能应用的蓬勃兴起和大规模发展,对智能算力和超算算力的需求与日俱增。
由 IDC 浪潮信息和清华大学全球产业研究院最新联合发布的《2021-2022 全球计算力指数报告》指出,AI 计算能力反映一国最前沿的计算能力。综合评估 15 个国家来看,AI 算力支出占总算力支出从 2016 年的 9% 增加到 12%,预计到 2025 年将达到 25%。中国 AI 算力发展领跑全球,AI 服务器支出规模同比大幅增长 44.5%,并首次超过美国位列全球第一。在 15 个国家 AI 算力支出的增长中,近 60% 来自中国。[2]
随着 AI 应用在各个行业的不断深入,数据规模、算法复杂度、企业业务场景多样性都呈几何倍数增加,这带来了一系列问题:突飞猛进的机器学习算法和日益捉襟见肘的 AI 算力引发供需不平衡,如雨后春笋般涌现的 xPU、ASIC、FPGA 等异构 AI 算力芯片带来算力基础设施异构化挑战,各种层出不穷的深度学习框架安装部署相对复杂对算力资源消耗巨大,服务器规模激增但资源利用率低,导致投入产出比低、运维成本高,桎梏了企业 AI 转型进程。
悄然来袭的云原生浪潮,为上述难题的解决带来了希望的曙光。「DaoCloud 道客」在云原生领域深耕多年,针对 AI 场景,提出了「超道云原生人工智能算力平台」解决方案,实现了异构算力基础设施统一纳管、容器标准化的算力池化调度、AI 模型的开发运营一体化、AI 应用的云原生编排及企业级多租户管理等,可满足企业 4 个层次的需求:
打造弹性扩展、高效统一的算力基础设施:统一管控和调度分散的、异构的计算资源,进行动态资源分配,负载均衡,提升算力基础设施整体利用率,降低各种算力的使用门槛。
适配多种算法模型与主流框架:内置优化多种主流深度学习框架和组件,基于云原生的模式实现了分布式训练框架的运行调度,简化配置与操作;还支持对接算法 ISV (Independent Software Vendors,独立软件开发商) 持续扩展平台能力。
实现 AI 模型端到端全生命周期管理,加速人工智能应用创新:提供从数据准备、模型构建、模型训练、模型调优及模型运营的 AI 模型全生命周期管理能力,大幅缩短企业 AI 模型创作和更新周期,提升企业 AI 生产力。结合底层平台提供的云原生应用编排调度能力,加速 AI 算法能力支撑企业实际业务场景的进程。
企业级多租户管理:平台内置多租户管理,按需适配企业组织管理要求,实现多团队共享算力资源,同时支持多维度的资源监控与告警,结合可视化看板能力,轻松实现运营管理。
超道云原生人工智能算力平台,提供多元异构算力服务和基于异构算力之上的 AI 模型全生命周期管理服务。一方面通过平台可以更方便、更快捷地获取多元算力,另一方面也加速了人工智能科学家们,从算法研发到模型发布的效率,提升企业 AI 的整体生产力。
此外,基于数字原生的底座平台同时提供了对计算、存储、网络等基础资源管理和调度的完整解决方案,提升算力利用率。
平台提供 AI 创新生态开放能力,除支持内置 AI 服务以 API 方式对外开放,同时还可集成 ISV 人工智能开发组件,提供第三方算法及模型服务,并与 ISV 形成联合方案。致力于为终端客户提供全链条的场景化服务,覆盖工业、金融、医疗、安防和教育等多种行业场景。

「超道云原生人工智能算力平台」解决方案架构示意图
该平台具有生态兼容、高效稳定、弹性灵活、应用无感迁移、跨云管理等特性,并且用户可根据自身需求定制应用服务,在平台上部署即可运行,有效降低人工智能开发、应用的难度,加快产品或服务的上线速度,减少管理开销,增强企业的竞争力。
为进一步提升算力利用率,「DaoCloud 道客」联合趋动科技发布了 GPU 资源池化云服务联合解决方案。该方案基于云原生架构全面整合虚拟化、网络、存储、安全等能力,实现了 GPU 资源池化、动态伸缩和灵活调度,在企业级 Kubernetes 平台「DaoCloud Enterprise (DCE)」上进行 GPU 资源的细粒度管理和监控,让企业内的 AI 用户可共享数据中心内所有服务器上的 GPU 算力,不必关注底层资源的具体细节,助力企业 AI 应用开发敏捷化和高效化。
同时借助云原生天然的分布式、弹性扩展和轻量虚拟化能力,该方案能够简化异构算力资源的管理,屏蔽硬件基础设施的复杂性,实现池化和弹性算力资源供给,有效缓解计算压力,大幅提升 AI 应用的业务效率并避免供应商锁定,广泛服务于深度学习、模型训练、科学计算、图形图像处理等人工智能场景。

「DaoCloud 道客」&趋动科技 GPU 资源池化云服务联合解决方案示意图
未来,「DaoCloud 道客」将继续深化云原生与 AI 在算力基础设施层面的研发及探索,持续打造和优化云原生算力引擎,为企业、开发者提供灵活、高性能以及易用的 AI 应用基础环境,使他们更加专注于AI 应用、模型及算法调优等业务领域本身,加快人工智能应用步伐。
目录SpringBootStarter是什么?以前传统的做法使用SpringBootStarter之后starter的理念:starter的实现: 创建SpringBootStarter步骤在idea新建一个starter项目、直接执行下一步即可生成项目。 在xml中加入如下配置文件:创建proterties类来保存配置信息创建业务类:创建AutoConfiguration测试如下:SpringBootStarter是什么? SpringBootStarter是在SpringBoot组件中被提出来的一种概念、简化了很多烦琐的配置、通过引入各种SpringBootStarter包可以快速搭建出一
文章目录前言1.AI的发展历程2.我是如何接触到人工智能的概念和产品的3.对于ChatGPT的一点看法4.AI对大学毕业生的职业发展的利与弊5.对于AI的思考和问题前言随着ChatGPT的爆火,生成式AI,大模型的人工智能被越来越多的人注意到,同时他也带来了许多问题。本文将对几方面进行探讨。1.AI的发展历程远古时期在公元前第一个千禧年,中国,印度和希腊哲学家都提出了一些推理的研究理论,比如亚里士多德(Aristotle)进行了演绎推理三段论的完整分析,欧几里得(Euclid)所著Elements是一种形式推理的模型,MuḥammadibnMūsāal-Khwārizmī,发明了代数学,即我们
目录1古彝文与古典保护2古文识别的挑战2.1西文与汉文OCR2.2古彝文识别难点3合合信息:古彝文保护新思路3.1图像矫正3.2图像增强3.3语义理解3.4工程技巧4总结1古彝文与古典保护彝文指的是云南、贵州、四川等地的彝族人使用的文字,区别于现代意义上的彝文,古彝文指的是在民间流通使用的原生态彝文,多达87046字。古彝文的起源距今至少数千年,是世界上最古老的文字之一。对古彝文字集研究有助于理解尚未被翻译成汉文、用字尚未规范化的古籍,更深层、透彻地作用于传统文化保护。古彝文字义对照图(网络资料+邵文苑供图)古籍是不可再生的宝贵资源,应当得到妥善保护。中国的古籍在历史上迭经水火兵燹等自然灾害、
我在/usr/local/lib中安装了一些本地库。我现在正在尝试安装一个需要这些的gem,以便正确构建,但是gem构建失败,因为它找不到图书馆。gem的extconf.rb文件试图确认它可以找到库have_library()但由于某种原因失败了。我尝试设置一堆环境变量,但似乎没有任何效果:irb(main):003:0>require'mkmf'=>trueirb(main):004:0>have_library('gecodesearch')checkingformain()in-lgecodesearch...no=>falseirb(main):005:0>ENV['LD_LI
文章目录Kubernetes(k8s)工作负载一、Workloads二、Pod三、Deployment四、RC、RS、DaemonSet、StatefulSet五、Job、CronJob1、Job2、CronJob六、GCKubernetes(k8s)工作负载一、Workloads什么是工作负载(Workloads)工作负载是运行在Kubernetes上的一个应用程序。一个应用很复杂,可能由单个组件或者多个组件共同完成。无论怎样我们可以用一组Pod来表示一个应用,也就是一个工作负载Pod又是一组容器(Containers)所以关系又像是这样工作负载(Workloads)控制一组PodPod控制
接口测试究竟是什么?为什么要用接口测试?它有哪些工具呢?这一连串的问题敲击着我们,请带着这些问题,在本文中寻找答案,我将为您打开接口测试的大门。1初探接口测试接口测试是什么。它检查数据的交换,传递和控制管理过程,它绕过了移动端,对服务端进行测试,是个十足的跨栏高手。图片来源:网络你一定听说过ui测试,它可以对前端进行测试,例如selenium工具是一个典型的ui测试工具,是否可以通过ui测试来诊断后端呢?不可以!因为后端非常复杂,就像下图这样。ui测试无法涵盖这么复杂的链路的,在这么庞大的结构下,selenium显得力不从心。这就是我们为什么要绕过移动端,从而使用接口测试的原因。图片来源:阿里
我正在试验iPhoneSDK并在Nic博士的rbiPhoneTest项目中做一些TDD。我想知道有多少人(如果有的话)成功地使用了这个或任何其他iPhone/Cocoa测试框架?更重要的是,我想知道如何最好地断言专有的二进制请求/响应协议(protocol)。这个想法是通过网络发送二进制请求并接收二进制响应。请求和响应是使用byteand'ing和or'ing创建的。我正在使用黄金副本模式来测试我的请求。这是我到目前为止所拥有的。不要笑,因为我是ObjectiveC和Ruby的新手:requireFile.dirname(__FILE__)+'/test_helper'require'
本文导读一、前言二、Ingress和pod有什么关系三、使用Ingress对外暴露应用1.创建应用并使用NodePort暴露端口2.应用Ingress(1)部署IngressController(2)创建Ingress规则(3)在Windows系统的hosts文件添加域名访问规则一、前言在以往的操作过程中,我们都是将某端口号对外暴露,然后再使用IP+端口号进行访问服务,这是通过Service中的NodePort实现的。但是NodePort有着明显的缺陷:NodePort会在每一个node节点都启用一个端口,也就是说在集群中的任何一个node节点中,使用节点IP+端口号都能访问到该服务;每个端口
Serverless时代已经到来!企业的技术架构,总是伴随着不断增长的数据与日趋复杂的业务持续演进。如何通过构建更易用的技术架构来聚焦在业务本身,而不必在底层基础设施的管理上投入过多的精力,是数据驱动型企业需要思考的重要议题。 ServerlessData作为云原生数据服务的下一代技术架构与“新常态”,正在推动云计算的进一步发展,并且已经成为云原生数据库、大数据分析乃至人工智能等云计算服务的重要发展趋势。Serverless所带来的不仅仅是IT技术领域的创新性飞跃,同时也是数字经济趋势下,企业实现快速发展的重要机遇。十七年持续创新全方位拥抱Serverless从2006年亚马逊云科技的第一个
作者|Harper审核 |gongyouliu编辑|auroral-L机器学习的商业应用上期给大家介绍了机器学习的概念,但是理解机器学习最好方法之一,就是了解其在具体商业世界中的各种应用。在道格’罗斯的这本《认识AI,人工智能赋能商业》中,介绍了几类机器学习的商业应用,在这里我给大家归纳一下。第一,数据安全,为了避免被发现,制造恶意软件的人会不断更改代码,通常为2%~10%的修改,但是通过机器学习,安全软件可以适应这一小部分变化,并准确识别新创建的恶意软件。它还可以寻找访问方式的模式,以识别可能的安全威胁。第二,投资。机器学习使得计算机能够处理大量的财务数据,并利用其发现的规律预测市场及每只股