草庐IT

算力时代已至,服务器也要“四高”发展

张申宇 2023-03-28 原文

算力,是个即老又新的词。算力伴随着​​云计算​​的商用,成为人们的焦点,火了十几年。今年2月份,伴随着“东数西算”工程的正式启动,算力又一次成为行业,乃至全社会关注的焦点。

作为重要的算力基础设施,在算力需求与日俱增的背景下,对​​数据中心​​的要求也越来越高。《新型数据中心发展三年行动计划(2021-2023年)》中指出,新型数据中心要具有“高技术、高算力、高能效、高安全”特征。“四高”已经成为未来数据中心的必备条件。

作为数据中心将瓦特转化为比特的关键设备——服务器,在企业对算力和数据中心的需求愈发强烈的背景下,服务器市场也迎来爆发式增长。Gartner公布2022年最新全球服务器市场数据显示,2022年上半年全球服务器市场增加强劲,出货量为668.9万台,同比增加11.8%,销售额566.5亿美元,同比增加24.1%。2022年上半年服务器市场增长强劲。

在市场增长强劲的同时,服务器也应满足新型数据中心“四高”的要求,向着“高技术、高算力、高能效、高安全”的方向发展。

高安全

众所周知,数据中心对业务连续性的要求极高,一次宕机对企业而言,造成的损失不容小觑。

2021年,国际科技巨头Facebook数据中心服务器宕机,旗下Facebook、Instagram、WhatsApp、Messenger等网站、应用都出现了响应服务器错误,全球35亿用户将近6个小时无法使用这些社交平台。此次宕机让Facebook股票暴跌6%,扎克伯格个人财富一日蒸发近60亿美元。

服务器宕机轻则造成财产损失,重则将让企业数据安全受到威胁。现阶段,服务器宕机主要有两大原因:网络攻击和运营环境(包括软件,以及机房环境影响)。

网络攻击:网络攻击是不可避免的,在部署业务时,企业应当选用可靠的安全解决方案,甚至极早期预警,利用态势感知、动态防御+风控前置等技术手段。除此之外,近来炒的火热的DPU还可以从“硬件”层面帮助服务器提升抵抗网络攻击的能力。

为了确保网络和系统的安全,人们会在服务器中加入大量加密算法,这些算法以往都是由CPU负责“处理”的。现在,DPU可以分担CPU这部分的工作,在提升CPU效率的同时,还能加强服务器硬件层面的安全能力。

运营环境:保障运营环境的稳定与数据中心业务连续性及稳定性息息相关。软件层面,选用大品牌,可靠的供应商提供的成熟的产品自然不用多说。硬件层面,为了满足更高功率、更高算力的服务器,数据中心物理层面也要面临着改变,总结为八个字——“因地制宜,按需部署”。无论是选择列头柜,还是小母线;无论是选择风冷,还是液冷,企业都需按照自身需求,以及所选服务器特性进行选择。

高算力

在产业互联网已至的当下,对数据中心的算力要求也越来越高,边缘侧的数据中心需要具备超高算力来应对各种复杂的计算场景,提高算力成为行业广泛关注的焦点。

盘点当下提高服务器算力的方式,主要有两种——使用新型芯片(GPU、DPU)、提高密度。

新型芯片:受到包括摩尔定律“逐步失效”在内等因素的影响,高算力已经不仅局限于CPU简单的堆叠。可以想见,未来GPU、DPU、智能网卡等硬件将会被越来越多的应用在服务器中,作为CPU的“得力助手”,随着应用的普及,也必将对服务器内部架构产生重要的影响。

不过现阶段业界对于GPU、DPU的看法还尚没有统一的“认知”,尤其是DPU,有些厂商认为DPU将成为解放CPU,释放更多算力的关键“钥匙”,甚至是推进区块链技术真正落地的决定性因素。有些人则认为DPU只是厂商炒作的概念,对应用前景并不看好。

在笔者看来,“释放”算力不仅需要硬件层面CPU、GPU,甚至DPU的协同,更需要从软件层面,通过利用AI等技术手段,实现算力在服务器内的灵活、智能的调度与分配,方能激发算力“潜能”。

提高密度:为了满足现阶段企业对云计算、数据中心、互联网的需求,高密度服务器应运而生。这类优化架构的服务器设备可以在非常小的物理空间内集成更多的处理器和I/O扩展能力,这样的设计可以极大程度的去降低客户的空间成本,并且能显著的提升计算机的性能。

高密度服务器主要通过可扩展、双主板、横向扩展等设计,更大程度的去减低客户的空间费用,而且能明显的增强计算机的特性。同时,高密度服务器通过共享电源和风扇等设配(普通服务器大多采用独立电源和风扇设计),降低服务器的整体功耗,大大提高电源和散热系统的使用效率,对于客户不同的需求也会有灵活的处理方式。

在产品布局方面,各家厂商针对高密度的看法也不尽相同。整机柜服务器是目前高密度计算解决方案之一。

整机柜服务器按照模块化设计思路打造的服务器解决方案,系统架构由机柜、网络、供电、服务器节点、集中散热、集中管理6个子系统组成,在同一个机箱里由多台服务器节点共享电源和风扇,这样的设计可以大幅提高电源和散热系统的使用效率,最终使得机体的重量更轻,成本也更低,高密度服务器采用这样的设计可以降低用户的使用成本。不仅于此,整机柜服务器采用工厂预制的设计,大幅缩短了工期,在“唯快不破”的互联网时代,越早部署投产,越早打通业务,就能帮助用户越早“获利”。

当然,整机柜的推广自然也对服务器的尺寸、标准化,以及兼容性等方面提出了更高的要求。提到整机柜服务器不得不提浪潮。从近两年浪潮的产品布局也不难看出,浪潮将产品布局主要集中在整机柜,力图推进整机柜标准化、开源化进程。

世界因不同而精彩,IBM方面有着有浪潮截然不同的看法。IBM认为,相较于整机柜,用户更关心“Cloud in a Box”的概念。IBM亚太区主机及LinuxONE技术总监 应康勇指出,用户更需要一个像“盒子中的云”的服务器,可以在有限空间内托管数以万计的工作负载,且还能保证彼此相互隔离和交易的服务级别。在笔者看来,这对服务器纵横双向的拓展能力,以及服务器软硬件协同提出了更高的要求。

无论是将服务器与电源、制冷等设备“融合”,整体化方案,还是重心放在提高服务器本身性能,做到“以一顶百”,业内仍处于争论不断的阶段。但可以确定的是,提高单位密度算力,已经成为不争的事实,无论是“物理”层面的高密度,还是“虚拟”层面的高密度,高密度已经是服务器发展趋势之一。

高能效

在全行业共同推进​​碳中和​​进程的背景下,服务器如何提高能效已然成为服务器供应商及用户广泛关注的焦点。

据国际能源署的数据,世界各地的数据中心总共消耗 250 太瓦时(TWh)的电力;据生态环境部发布的数据显示,2021年我国数据中心总耗电量达到2166亿千瓦时,占全社会用电量的2.6%,碳排放则占全国碳排放量的1.14%左右。这其中IT设备占了很大一部分比重。

在数据中心碳中和的道路上,服务器能耗问题也将成为接下来数据中心节能减排重点关注的方向。无论是从履行社会责任,还是遵从国家“双碳”目标出发,数据中心都需要高能效的服务器。

盘点服务器实现“高效低碳”的技术手段,虚拟化技术肯定“榜上有名”。自2000以来,虚拟化技术逐步成为数据中心关键技术之一。

虚拟化技术能让一台物理服务器运行多个虚拟主机,让单独服务器的计算资源可以被多、个环境共享,通过调整服务器的负载,帮助数据中心充分利用未使用的资源,从而降低二氧化碳排放量,降低管理和运营成本。当下,超融合、虚拟化是数据中心服务器层面实现资源优化、节能减排层面最主要的手段。

结合现阶段行业发展趋势,对于用户而言,仅靠虚拟化手段已经不能满足推进“双碳”战略落地的需求,行业用户开始更多的关注服务器硬件如何提高效能。

从硬件角度出发,提高服务器效能的手段如今主要有:提高可再生材料使用占比(从服务器全生命周期角度减碳);合理优化内部散热布局,减少过多气流,提高散热效率;应用GPU、DPU等新一代芯片技术,分担CPU压力,从而将激发服务器最大算力潜能,提高效率。

除了软件(超融合、虚拟化等技术)、硬件两大手段提高服务器能效以外,还可以通过改变服务器周边“环境”,降低数据中心能耗,从而间接提升服务器能效。

应用液冷是现阶段通过改变服务器所处“环境”降低能耗的手段之一。不过随着液冷的应用,对服务器也提出了新的要求,比如对服务器接口的尺寸、阻抗、插入力、以及固定方式等诸多“衔接”方面;对服务器整体的尺寸、材质、抗腐蚀性、抗震动、电磁兼容性,以及运维方式等方面都提出了更高的要求。为了更好的应用推广液冷技术,也自然对服务器内部架构,以及所用电子元器件的材质等诸多方面提出了新的挑战,目前已有如宁畅、联想、浪潮等多家服务器供应商布局液冷服务器业务,浪潮更是提出了“ALL IN”液冷的口号。

不过,降低服务器能耗是有前提的——不能以牺牲性能为代价,这点可以说是服务厂商们不谋而合的态度。服务器行业已经步入“高效低碳”的时代。

高技术

除了液冷以外,还有部分供应商将重心放在新一代服务器的研发方面。随着企业​​数字化转型​​进程的推进,企业对于​​数字化​​成本问题也愈发关注,在选择产品的过程中渴望获得定制化的“权力”,也渴望能根据自身需求,有更多类型的服务器可供选择。

在云计算火热的当下,选择ARM架构服务器的用户越来越多,最近,阿里云和微软Azure两大公有云服务商更新了采用Arm处理器实例的最新动态;IBM则是将重心放在新一代Z主机,通过 IBM Telum 处理器,以独特的方式将 AI 推理与 IBM 众所周知的高度安全且可靠的大批量交易处理能力结合起来。

值得注意的是,近期,IBM推出了新一代Linux服务器,据IBM提供资料显示,将相同工作负载运行在类似条件下的x86服务器上相比,新一代Linux服务器每年可为企业减少75%的能耗,节约50%的空间,减少超过850公吨的二氧化碳排放量。

虽然以现阶段的体量来看,其他架构类型的服务器在市场占有率方面,尚不能与X86服务器匹敌,不过技术的更迭可以给用户带来更丰富的选择,让用户“按需采购”。

展望未来,可以预见,在企业对于高算力的需求下,服务器市场的格局将发生变化,高密度、高算力、高可用性、低碳成为未来服务器发展的四大趋势。在此背景下,服务器行业必将迎来新一轮的创新热潮。

有关算力时代已至,服务器也要“四高”发展的更多相关文章

  1. ruby - 使用 ruby​​ 和 savon 的 SOAP 服务 - 2

    我正在尝试使用ruby​​和Savon来使用网络服务。测试服务为http://www.webservicex.net/WS/WSDetails.aspx?WSID=9&CATID=2require'rubygems'require'savon'client=Savon::Client.new"http://www.webservicex.net/stockquote.asmx?WSDL"client.get_quotedo|soap|soap.body={:symbol=>"AAPL"}end返回SOAP异常。检查soap信封,在我看来soap请求没有正确的命名空间。任何人都可以建议我

  2. ruby - 具有身份验证的私有(private) Ruby Gem 服务器 - 2

    我想安装一个带有一些身份验证的私有(private)Rubygem服务器。我希望能够使用公共(public)Ubuntu服务器托管内部gem。我读到了http://docs.rubygems.org/read/chapter/18.但是那个没有身份验证-如我所见。然后我读到了https://github.com/cwninja/geminabox.但是当我使用基本身份验证(他们在他们的Wiki中有)时,它会提示从我的服务器获取源。所以。如何制作带有身份验证的私有(private)Rubygem服务器?这是不可能的吗?谢谢。编辑:Geminabox问题。我尝试“捆绑”以安装新的gem..

  3. ruby-on-rails - 启动 Rails 服务器时 ImageMagick 的警告 - 2

    最近,当我启动我的Rails服务器时,我收到了一长串警告。虽然它不影响我的应用程序,但我想知道如何解决这些警告。我的估计是imagemagick以某种方式被调用了两次?当我在警告前后检查我的git日志时。我想知道如何解决这个问题。-bcrypt-ruby(3.1.2)-better_errors(1.0.1)+bcrypt(3.1.7)+bcrypt-ruby(3.1.5)-bcrypt(>=3.1.3)+better_errors(1.1.0)bcrypt和imagemagick有关系吗?/Users/rbchris/.rbenv/versions/2.0.0-p247/lib/ru

  4. ruby-on-rails - s3_direct_upload 在生产服务器中不工作 - 2

    在Rails4.0.2中,我使用s3_direct_upload和aws-sdkgems直接为s3存储桶上传文件。在开发环境中它工作正常,但在生产环境中它会抛出如下错误,ActionView::Template::Error(noimplicitconversionofnilintoString)在View中,create_cv_url,:id=>"s3_uploader",:key=>"cv_uploads/{unique_id}/${filename}",:key_starts_with=>"cv_uploads/",:callback_param=>"cv[direct_uplo

  5. ruby - 用 Ruby 编写一个简单的网络服务器 - 2

    我想在Ruby中创建一个用于开发目的的极其简单的Web服务器(不,不想使用现成的解决方案)。代码如下:#!/usr/bin/rubyrequire'socket'server=TCPServer.new('127.0.0.1',8080)whileconnection=server.acceptheaders=[]length=0whileline=connection.getsheaders想法是从命令行运行这个脚本,提供另一个脚本,它将在其标准输入上获取请求,并在其标准输出上返回完整的响应。到目前为止一切顺利,但事实证明这真的很脆弱,因为它在第二个请求上中断并出现错误:/usr/b

  6. ruby-on-rails - 在 Rails 中调试生产服务器 - 2

    您如何在Rails中的实时服务器上进行有效调试,无论是在测试版/生产服务器上?我试过直接在服务器上修改文件,然后重启应用,但是修改好像没有生效,或者需要很长时间(缓存?)我也试过在本地做“脚本/服务器生产”,但是那很慢另一种选择是编码和部署,但效率很低。有人对他们如何有效地做到这一点有任何见解吗? 最佳答案 我会回答你的问题,即使我不同意这种热修补服务器代码的方式:)首先,你真的确定你已经重启了服务器吗?您可以通过跟踪日志文件来检查它。您更改的代码显示的View可能会被缓存。缓存页面位于tmp/cache文件夹下。您可以尝试手动删除

  7. ruby - 我的 Ruby IRC 机器人没有连接到 IRC 服务器。我究竟做错了什么? - 2

    require"socket"server="irc.rizon.net"port="6667"nick="RubyIRCBot"channel="#0x40"s=TCPSocket.open(server,port)s.print("USERTesting",0)s.print("NICK#{nick}",0)s.print("JOIN#{channel}",0)这个IRC机器人没有连接到IRC服务器,我做错了什么? 最佳答案 失败并显示此消息::irc.shakeababy.net461*USER:Notenoughparame

  8. ruby - Rails 开发服务器、PDFKit 和多线程 - 2

    我有一个使用PDFKit呈现网页的pdf版本的Rails应用程序。我使用Thin作为开发服务器。问题是当我处于开发模式时。当我使用“bundleexecrailss”启动我的服务器并尝试呈现任何PDF时,整个过程会陷入僵局,因为当您呈现PDF时,会向服务器请求一些额外的资源,如图像和css,看起来只有一个线程.如何配置Rails开发服务器以运行多个工作线程?非常感谢。 最佳答案 我找到的最简单的解决方案是unicorn.geminstallunicorn创建一个unicorn.conf:worker_processes3然后使用它:

  9. ruby - Dropbox 类似 git 的服务——没有 rsync 和 inotify - 2

    关于如何使用git设置类似Dropbox的服务,您有什么建议吗?您认为git是解决此问题的合适工具吗?我在考虑使用git+rush解决方案,你觉得怎么样? 最佳答案 检查这个开源项目:https://github.com/hbons/SparkleShare来自项目的自述文件:Howdoesitwork?SparkleSharecreatesaspecialfolderonyourcomputer.Youcanaddremotelyhostedfolders(or"projects")tothisfolder.Theseprojec

  10. ruby TFTP 服务器 - 2

    我将以下代码放在一起用于一个简单的RubyTFTP服务器。它工作正常,因为它监听端口69并且我的TFTP客户端连接到它,我能够将数据包写入test.txt,但我不只是写入数据包,我希望能够从我的客户端通过TFTP传输文件到/temp目录。预先感谢您的帮助!require'socket.so'classTFTPServerdefinitialize(port)@port=portenddefstart@socket=UDPSocket.new@socket.bind('',@port)whiletruepacket=@socket.recvfrom(1024)putspacketFile

随机推荐