草庐IT

你要的并不是ChatGPT,而是强大和经济的算力

pangtout 2023-11-16 原文

编辑:阿冒

设计:沐由

2022年12月,AI创业公司OpenAI推出了聊天机器人ChatGPT。作为生成式AI在文本领域的实际应用之一,ChatGPT的问世距今不过百天而已,却已经火爆了全球。

君不见,大学生们用它撰写论文,商业人士用它制定提案,诗人们用它创作诗歌,程序员们用它编写代码……网友们纷纷感叹:“只有你想不到的,没有ChatGPT办不成的。”

口说无凭,让真实的数据来说话——上线不到两个月,ChatGPT的全球活跃用户就突破了一亿大关。如此惊人的增长速度,真的是震碎了一地眼镜。

一时间,大量的企业投入到生成式 AI领域,大有“任彼桑田变沧海,一丸丹药定千春”的架势。有人问,创意创作已经无法阻拦人工智能,以后岂不是万千行业都要被彻底颠覆与重构?

愿望很美好,现实很骨感。很可惜,归根到底还是那句话:没有强大和经济的算力,一切无从谈起。

正如亚马逊云科技首席执行官亚Adam Selipsky所言:“生成式AI有可能会改变整个产业,但是它所需的成本和专业知识,使得除了少数几家公司之外,几乎所有公司都无法使用这项技术。”

始于毫末的伟大突破

我们的世界,正处于算力爆发的时代。


以ChatGPT等AI大模型的发展为例,其算力需求大致是每两个月就会增加一倍。这样的增长要求,即便是实现了翻倍的摩尔定律也难以企及,更不消说巨大的成本需求。

我们看到,像谷歌这样的巨头也正在做类似的技术。不过假如将ChatGPT部署到谷歌搜索中,即便是只考虑服务器和网络的前期开销,其成本也将超过1000亿美元。

此时,我们还没有考虑后期的运营及其他成本。据测算,ChatGPT的单次回复至少要花费1美分。在未成为“爆款”前,满足当时100多万用户的需求,公司每天至少需要10 万美元运行成本。然而当用户数高达数亿之后,每年的成本支出就将超过50亿美元。

显然,如此高昂的成本对任何一家企业来说,基本上都是无法接受的,即便是家里有矿也经不起这样折腾。在这种情况下,想要成百上千倍地提升算力,必然需要全新的算力平台。

2月28日,市场调研机构Counterpoint公布了最新的服务器CPU调查报告。该报告的一大亮点,就是在传统的两家芯片厂商之外,亚马逊云科技的排名来到了第三,3.16%的市场份额较2021年提升了近一倍。

虽然看起来与领先者还有比较大的差距,但是科技领域里所有的伟大突破都是起始于毫末。“星星之火,可以燎原”的例证,实际上在计算领域也是被一再验证过的。

需要指出的是,从第一代Amazon Graviton开始,亚马逊云科技就不对外销售,而是将其完全用于对外提供云服务。这也就是说,通过Graviton,在传统的算力之外,亚马逊云科技为广大客户带来了全新且更为普惠的算力。


在去年底举行的亚马逊云科技2022 re:Invent全球大会上,亚马逊云科技自研的基于Arm架构CPU芯片Graviton发布了增强的第三代版本Graviton3E,并将之用于更多的计算实例。

Graviton不仅用于大名鼎鼎的EC2(Amazon Elastic Compute Cloud),当前亚马逊云科技更多的托管服务,譬如最新的容器等都是基于Graviton打造。事实上,很多客户在使用这些服务的时候,已经明显感受到Graviton带来的性价比提升。

人工智能的落地关键

毫无疑问,机器学习正在深刻影响,并且推动着关乎我们工作和生活方方面面的突破。从传统企业到创新企业,每一家公司都在使用机器学习技术解决生存与发展的相关命题。 

“不管是智能语音、自动驾驶,抑或是最近火热的AI绘画,所有的AI发展都使得机器学习模型变得越来越复杂。”在日前的一场交流中,亚马逊云科技的技术专家这样表示。

诚然如此。过去几年里,模型的规模不断扩充,参数更是从数亿增加到上千亿个之多,训练和部署这些日益复杂的机器学习模型的高成本,正在将很多企业,尤其是小型创新公司拒之门外。

据介绍,从2017年起,亚马逊云科技的工程师团队就注意到这样的趋势。在他们看来,如果不去尽快满足客户的需求,那么机器学习带来的高昂成本,很快就会成为客户不能承受之重。

为此,亚马逊云科技在2019年设计和推出了Amazon Inferentia,来为机器学习应用程序提供高性能,让广大客户在尽享AI红利的同时,同样能够负担得起。


在芯片的设计和构建方面,亚马逊云科技拥有业界顶尖的团队,在十多年的发展中已经开发出众多优秀的产品,譬如我们前文提到的Graviton系列、Inferentia,以及Amazon Nitro系统等。

作为一种专门用于机器学习推理及驱动的服务器芯片,Inferentia与同类基于 GPU 的服务器相比,提供了更好的性价比、更高的吞吐量和更低的延迟。

同样是在2022 re:Invent全球大会上,亚马逊云科技推出了Inferentia2芯片和Inf2实例。与前代相比,新的Inf2实例的每瓦性能提升45%,吞吐量提升4倍,延时只有1/10,能够支持多达1750亿个参数的超大型复杂深度学习模型。GPT类型的模型?尽管放马过来吧!

虽然机器学习的芯片性能进步很大,但是仍然难以跟上训练复杂度的提升程度,可行的解决方案就是利用分布式多处理器,通过网络进行协同计算、协同训练。


为此,亚马逊云科技还专门构建了用于机器学习的Amazon Trainum芯片,在搭载了16颗Trainum、512GB加速器内存和800GBps的网络带宽之后,Trn1实例充分诠释了它的强大:

与基于GPU的类似实例相比,训练成本降低了50%。以一个具备万亿级参数的大模型进行两周训练为例,GPU服务器P3dn需要600个实例,最新一代GPU实例P4d需要128个实例,但Trn1只需要用96个实例,经济性由此也可见一斑。

在去年底的大会上,亚马逊云科技还推出了基于Trn1的网络优化型实例Trn1n,将网络带宽从800GBps擢升到1600GBps,能够将超过1万个Trainium芯片构建在一个超大规模集群里……

通过以亲民的成本提供强大的性能,亚马逊云科技为客户的创新开辟出全新的途径。

数字经济比拼的是算力

人工智能的火热出圈,并不只是由于最近的ChatGPT点燃。事实上,去年游戏设计师杰森·艾伦通过Midjourney平台创作的画作赢得艺术类比赛一等奖,更是我们记忆里活色生香的例证之一。

在这幅名为《太空歌剧院》的作品中,阳光透过巨大的圆窗照进整个大厅,在一座巴洛克风格的宫殿内,几位女性身着华贵的古典服饰眺望太空。


然而,《太空歌剧院》却是人工智能的作品。尽管业界不乏“艺术创造性工作不应受到机器影响”这样的声音,但是丝毫也不影响一波AIGC热潮的到来。

AIGC(AI Generated Content,人工智能自动生成内容),是继专业生产内容(PGC, Professional-generated Content)、用户生产内容(UGC, User-generated Content)之后的新型内容创作方式。

在创意、表现力、迭代、传播、个性化等方面,AIGC能够充分发挥技术优势,打造出新的数字内容生成与交互形态,现有的AI 绘画、AI 写作,以及前面所说的ChatGPT等,都属于AIGC的具体表现形式。

当然,AIGC并不是只用于聊天、绘画,必然会在大量的探索和尝试之后,转向更有价值的行业应用领域,从而对经济和社会发展产生巨大的影响力。

某种程度上,AIGC 也不只是技术创新或是应用创新,而是一次全新的商业模式创新。在“木头姐”Cathie Wood所率团队撰写的2023年度报告中,列举了12个前景广阔的投资主题,AIGC就名列其中。

由于AIGC的拉动,企业对高算力的需求出现了新一轮的指数级增长——所有人都明白,强大和经济的算力支撑,已经成为AIGC深入发展的必要前提,能够为新一轮的商业创新提供良机。


“临渊羡鱼,不如退而结网。”其实,面对AIGC带来的巨大商机,企业完全不必去自己“结网”。围绕各种需求,亚马逊云科技早已织就了一张张动力强劲的算力网,让数字时代的红利能够普惠到万千企业。

就这样,通过在芯片、服务等方面的不断创新,亚马逊云科技帮助广大客户更深入了解和探索 AIGC在各个领域的实践,实现AIGC的关键趋势洞察和快速落地。

随着我国数字经济的持续快速发展,类似AIGC这样的新业态、新模式和新应用仍在快速涌现,它们也无一例外地对算力提出更高的要求。通过提供强大、经济且绿色的通用与智能算力,亚马逊云科技致力于更多客户的商业成功,全力支持和推动中国数字经济的高质量发展。

点击“阅读原文”,下载《下一代云基础架构白皮书》

有关你要的并不是ChatGPT,而是强大和经济的算力的更多相关文章

  1. 亚特兰蒂斯的回声(中文版): chatGPT 的杰作 - 2

    英文版英文链接关注公众号在“亚特兰蒂斯的回声”中踏上一段难忘的冒险之旅,深入未知的海洋深处。足智多谋的考古学家AriaSeaborne偶然发现了一件古代神器,揭示了一张通往失落之城亚特兰蒂斯的隐藏地图。在她神秘的导师内森·兰登教授的指导和勇敢的冒险家亚历克斯·默瑟的帮助下,阿丽亚开始了一段危险的旅程,以揭开这座传说中城市的真相。他们的冒险之旅带领他们穿越险恶的大海、神秘的岛屿和充满陷阱和谜语的致命迷宫。随着Aria潜在的魔法能力的觉醒,她被睿智勇敢的QueenNeria的幻象所指引,她让她为即将到来的挑战做好准备。三人组揭开亚特兰蒂斯令人惊叹的隐藏文明,并了解到邪恶的巫师马拉卡勋爵试图利用其古

  2. 【Java 面试合集】HashMap中为什么引入红黑树,而不是AVL树呢 - 2

    HashMap中为什么引入红黑树,而不是AVL树呢1.概述开始学习这个知识点之前我们需要知道,在JDK1.8以及之前,针对HashMap有什么不同。JDK1.7的时候,HashMap的底层实现是数组+链表JDK1.8的时候,HashMap的底层实现是数组+链表+红黑树我们要思考一个问题,为什么要从链表转为红黑树呢。首先先让我们了解下链表有什么不好???2.链表上述的截图其实就是链表的结构,我们来看下链表的增删改查的时间复杂度增:因为链表不是线性结构,所以每次添加的时候,只需要移动一个节点,所以可以理解为复杂度是N(1)删:算法时间复杂度跟增保持一致查:既然是非线性结构,所以查询某一个节点的时候

  3. ruby-on-rails - 只有当不是 nil 时才执行映射? - 2

    如果names为nil,则以下中断。我怎样才能让这个map只有在它不是nil时才执行?self.topics=names.split(",").mapdo|n|Topic.where(name:n.strip).first_or_create!end 最佳答案 其他几个选项:选项1(在其上执行map时检查split的结果):names_list=names.try(:split,",")self.topics=names_list.mapdo|n|Topic.where(name:n.strip).first_or_create!e

  4. ruby-on-rails - Rails 格式验证——字母数字,但不是纯数字 - 2

    什么是测试格式验证的最佳方法让我们说一个用户名,使用字母数字的正则表达式,但不是纯数字?我一直在我的模型中使用以下验证validates:username,:format=>{:with=>/^[a-z0-9]+[-a-z0-9]*[a-z0-9]+$/i}数字用户名(例如“342”)通过了验证,这是我不想要的。 最佳答案 您想“向前看”一封信:/\A(?=.*[a-z])[a-z\d]+\Z/i 关于ruby-on-rails-Rails格式验证——字母数字,但不是纯数字,我们在Sta

  5. ruby - 强制浏览器下载文件而不是打开文件 - 2

    我要下载http://foobar.com/song.mp3作为song.mp3,而不是让Chrome在其native中打开它浏览器中的播放器。我怎样才能做到这一点? 最佳答案 您只需要确保发送这些header:Content-Disposition:attachment;filename=song.mp3;Content-Type:application/octet-streamContent-Transfer-Encoding:binarysend_file方法为您完成:get'/:file'do|file|file=File.

  6. ruby - 更改 $LOAD_PATH 时,为什么使用 unshift 而不是 push? - 2

    我发现ruby加载路径是一个数组,很多项目都是这样使用的:$:.unshift(File.expand_path("../../lib",__FILE__))可以将本地文件添加到ruby路径数组的前面,方便我们require或者load。所以,我希望知道为什么我们不使用push将文件添加到数组的末尾? 最佳答案 假设您有一个“date.rb”文件(为什么不呢)并且您想要加载这个文件,而不是标准库日期。如果您使用追加,当您调用require'date'时您的文件将永远不会被加载,因为它位于数组的末尾并且标准日期会在之前找到。因此,如果

  7. ruby - 如何排序不是简单的哈希(哈希的哈希) - 2

    我有一个这样的哈希{55=>{:value=>61,:rating=>-147},89=>{:value=>72,:rating=>-175},78=>{:value=>64,:rating=>-155},84=>{:value=>90,:rating=>-220},95=>{:value=>39,:rating=>-92},46=>{:value=>97,:rating=>-237},52=>{:value=>73,:rating=>-177},64=>{:value=>69,:rating=>-167},86=>{:value=>68,:rating=>-165},53=>{:va

  8. ruby - Unicorn 使用 `reload` 而不是 `restart`? - 2

    我在这里对我的部署策略有点困惑,在什么情况下部署时我想向unicorn发送reload信号?例如在我的例子中它会是这样的:sudokill-sUSR2`cat/home/deploy/apps/my_app/current/tmp/pids/unicorn.pid`我一直在通过杀死那个pid来部署我的应用程序,然后通过类似的东西再次启动unicorn:bundleexecunicorn-cconfig/unicorn/production.rb-Eproduction-D我只是想知道为什么要使用重新加载?我可以通过这样做获得部署的任何性能吗? 最佳答案

  9. ruby - 使用 Ruby FileUtils 而不是 Bash 命令的好处? - 2

    使用FileUtils方法有什么好处http://ruby-doc.org/core/classes/FileUtils.html比等效的Bash命令? 最佳答案 除此之外,您不必担心确保您的目标平台安装了您正在使用的特定工具这一事实,以及正确引用shell异常的问题(如果您的目标是特别有问题的)Windows和Unix-alikes——尽管有Cygwin、GNUWin32等),如果你使用Ruby的FileUtils,你有一个Ruby函数调用的中等大小的开销,而如果你使用外部实用程序,你有相当大的开销来启动一个外部进程的每一次“调用

  10. ruby-on-rails -/usr/local/lib/libz.1.dylib,文件是为 i386 构建的,它不是被链接的体系结构 (x86_64) - 2

    在我的mac上安装几个东西时遇到这个问题,我认为这个问题来自将我的豹子升级到雪豹。我认为这个问题也与macports有关。/usr/local/lib/libz.1.dylib,filewasbuiltfori386whichisnotthearchitecturebeinglinked(x86_64)有什么想法吗?更新更具体地说,这发生在安装nokogirigem时日志看起来像:xslt_stylesheet.c:127:warning:passingargument1of‘Nokogiri_wrap_xml_document’withdifferentwidthduetoproto

随机推荐