ChatGPT造孽！中国高校因它算力荒

QbitAl 2023-04-13 原文

衡宇发自凹非寺
量子位 | 公众号 QbitAI

不做大模型，就没有算力用。

这是ChatGPT点燃AI风口后，国内某top3高校AI实验室的残酷现状。

同一个实验室里，非大模型团队6人用4块3090卡，比起同实验室的大模型团队10个人用10块A800卡，本就已经不算富裕。

现在，校企合作也更偏爱大模型。去年11月ChatGPT发布后，与非大模型团队合作的企业骤减，近期找上门的，也是张口就问：

“你们做大模型不？”

做，有高校和企业的通力支持；不做？那就只能眼睁睁看着算力花落别家。

哪怕某量化私募基金的有10000张A100卡，还对高校研究团队开放申请，也不见得能落一张到你头上。

“要是我们组能分到一些就好了。”看到这条微博，非大模型团队带队的数据科学方向博士小哥羡慕不已，因为缺算力，他都愁得快仰天长啸了：我们也值得投资啊！！！

现在，大伙争先恐后扑向ChatGPT背后GPT-3.5般的各种大模型，算力流向亦然。

其他AI领域本就不足的算力更荒了，尤其是国内学界手里的算力分配下来，贫富差距肉眼可见。

一整个实验室就4块3090卡

巨大规模算力以月为单位的租用成本，对研究团队来说不是小数目。大模型正当其道，学界研究大模型的实验室或团队拥有算力资源的优先分配权。

就拿小哥在学校的亲身体验来说，在他们研究室，大模型小组10个人有10块A800卡可用，而另一个研究传统机器学习方向的实验室，整个实验室只有4块3090卡。

拥抱主流趋势是一重原因，另一重原因是实验室需要运转和维护的经费，获得拨款的一种形式是申请国家项目，但必要步骤是提供论文成果。

双重原因下，本就不多的算力资源，不得不优先分配给大模型这样热门且相对容易出成果的研究。哪怕对学界来说，训一个大模型其实练不太动——因为数据、算力和资金都有些捉襟见肘。

为了获得更多的资源，有的非大模型实验室甚至额外专门成立研究大模型的团队。

当然，想要获得资金和资源，校企合作也是不可或缺的一种方式。

这种推动产研融合的重要支撑形式持续已久，2020年，KDD中校企合作论文占比超过50%，这个比例在ICCV中达到45%。

举例来说，2021年，清华大学KEG、PACMAN（并行与分布式计算机系统）、NLP等实验室着手推进训练千亿参数的稠密模型，但团队用于训练模型的计算资源并不充足。最终，校外企业智谱AI租用了近百台A100的服务器，免费提供所需算力，这才有了双语预训练语言大模型GLM-130B的诞生。

△GLM-130B的任务表现

但在众人争先恐后扑向GPT-3.5般大模型的当下，非大模型团队开始不太好谈这类合作了。

去年11月ChatGPT发布后，与小哥所在团队洽谈校企合作事宜的公司数量急剧减少。在其他高校，AI领域的非大模型团队也总是面临企业询问，“要不要/会不会做大模型”。

本就稀缺的算力，在学界有成为追逐热点的砝码的倾向，算力资源分配的马太效应由此逐渐扩大，带给学术研究很大困扰。

ChatGPT加剧算力分配贫富分化

算力是AI飞速发展必不可少的指标，2018年，OpenAI发布的报告中点出一个算力趋势：

自2012年以来，AI训练任务所运用的算力每3.43个月就会翻倍。到2018年，AI算力需求增长了30万倍。

产学研对算力需求暴增，我们能提供的算力有多少？

据中国算力集团统计，截至2022年6月底，我国数据中心机架使用总规模超过590万标准机架，服务器规模约2000万台，算力总规模排名全球第2。

这个排名还算不错，但摊开来看仍旧远远不够，毕竟放眼全球，没有哪个国家不是嗷嗷待哺，等着更多的算力资源“投喂”。

再退一步讲，买得起显卡，拥有的算力上去了，电费也是天文数字。

况且我国还有特殊情况——

开放原子开源基金会业务发展部部长朱其罡在本月举办的CCF YOCSEF上发言阐述现状称，超算领域的核心技术，一个是IBM LSF超算系统，一个是开源系统。目前，国内多数超算中心都基于开源系统做封装，但这个版本调度资源的效率和能力都有很大的提升空间。

以及，因为众所周知的原因，A100、H100这俩目前性能最强的GPU，还没找到可规模替代的方案。

△英伟达A100显卡

综上，算力不够已是积弊，但ChatGPT时代，算力需求剧烈扩张，除了大量训练算力，大量推理算力也需要支撑。

所以现在的情况是，因为ChatGPT显示出大模型的推理能力，训练和研究大模型的算力需求增加；同时因为大模型热度爆棚，蜂拥至大模型的算力资源也增加。

分配给大模型领域的算力资源丰富起来，其他AI领域缺衣少食的情况逐渐加剧，研发能力受到掣肘。

可以说，ChatGPT成为如今的AI届白月光后，加剧了算力分配的贫富分化。

这般“富”甲一方的大模型，是不是AI研究路径上最好的？还没人能够回答。

但值得引起注意和重视的是，GPT系列为首的大模型不应该吸引全部目光，整个AI领域还有各种各样的研究方向，还有更加细分的垂直领域，以及带来更多生产力的模型和产品。

当ChatGPT的热度趋于平缓，学界的算力资源分配差距会缩小吗？

所有非大模型方向的实验室和团队，恐怕都在期待之中。

— 联系作者 —

— 完 —

「中国AIGC产业峰会」启动

邀您共襄盛举

「中国AIGC产业峰会」即将在今年3月举办，峰会将邀请AIGC产业相关领域的专家学者，共同探讨生成新世界的过去、现在和未来。

峰会上还将发布《中国AIGC产业全景报告暨AIGC 50》，全面立体描绘我国当前AIGC产业的竞争力图谱。点击链接或下方图片查看大会详情：

被ChatGPT带飞的AIGC如何在中国落地？量子位邀你共同参与中国AIGC产业峰会

点这里👇关注我，记得标星哦～

造孽 ChatGPT xff0c xff0 xff 人工智能大数据

有关ChatGPT造孽！中国高校因它算力荒的更多相关文章

亚特兰蒂斯的回声（中文版): chatGPT 的杰作 - 2
英文版英文链接关注公众号在“亚特兰蒂斯的回声”中踏上一段难忘的冒险之旅，深入未知的海洋深处。足智多谋的考古学家AriaSeaborne偶然发现了一件古代神器，揭示了一张通往失落之城亚特兰蒂斯的隐藏地图。在她神秘的导师内森·兰登教授的指导和勇敢的冒险家亚历克斯·默瑟的帮助下，阿丽亚开始了一段危险的旅程，以揭开这座传说中城市的真相。他们的冒险之旅带领他们穿越险恶的大海、神秘的岛屿和充满陷阱和谜语的致命迷宫。随着Aria潜在的魔法能力的觉醒，她被睿智勇敢的QueenNeria的幻象所指引，她让她为即将到来的挑战做好准备。三人组揭开亚特兰蒂斯令人惊叹的隐藏文明，并了解到邪恶的巫师马拉卡勋爵试图利用其古
智能客服 | 浅谈人工智能聊天机器人ChatGPT - 2
2022年底，OpenAI的预训练模型ChatGPT给人工智能领域的爱好者和研究人员留下了深刻的印象和启发，他展现的惊人能力将人工智能的研究和应用热度推向高潮，网上也充斥着和ChatGPT的各种聊天，他可以作诗、写小说、写代码、讨论疫情问题等。下面就是一些他的神回复：人命关天的坑：写歌，留给词作者的机会不多了。。。回答人类怎么样面对人工智能：什么是ChatGPT？借用网上的一段介绍，ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型，一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动
【ChatGPT】ChatGPT 的 N 种用法 - 2
目录ChatGPT简介技术原理应用未来发展ChatGPT的10 种用法ChatGPT简介ChatGPT是一种基于深度学习的大型语言模型，由OpenAI公司开发。技术原理GPT是GenerativePre-trainedTransformer的缩写，意为生成式预训练变压器。它的技术原理是使用了一个基于注意力机制的变压器（Trans
「想体验ChatGPT中文聊天？」那快进来，你用不上算我输 - 2
♥️作者：白日参商🤵‍♂️个人主页：白日参商主页♥️坚持分析平时学习到的项目以及学习到的软件开发知识，和大家一起努力呀！！！🎈🎈加油！加油！加油！加油🎈欢迎评论💬点赞👍🏻收藏📂加关注+！「想体验ChatGPT中文聊天？」那快进来，你用不上算我输项目场景：项目条件一、那就开始吧1、安装ChatGPT-Desktop2、OpenAPI设置二、使用实例恭喜你！！！配置成功了！！！API和URL都是博主免费提供给大家的！！！恭喜你！！！配置成功了！！！API和URL都是博主免费提供给大家的！！！🎈🎈加油！加油！加油！加油🎈欢迎评论💬点赞👍🏻收藏📂加关注+！项目场景：近几个月可以说ChatGPT是火得一
半个月狂飙1000亿，ChatGPT概念股凭什么？ - 2
ChatGPT掀起了AI股历史上最疯狂的一轮市值狂飙。自春节后至今，ChatGPT概念股开始了暴走模式，短短半月时间，海天瑞声、开普云等ChatGPT概念股市值累计增加了近1400亿。如此的爆炸效应，得益于ChatGPT所展现出商业化落地的巨大潜力。要知道，在此之前，无论是十年AI投入超千亿的百度，还是困在硬件化里的AI四小龙，都在重复着AI商业化难落地的故事。ChatGPT的出现，让AI从生产力的赋能者直接成为一种创造生产力的工具。随着订阅模式的推出，ChatGPT已经成为第一个以AI技术为核心直接变现的消费者应用。本文持有以下核心观点：1、ChatGPT是AI技术迭代的受益者。过去受限技术
未来的趋势————以ChatGPT为标杆的AI对生活的影响是巨大的 - 2
文章目录前言1.AI的发展历程2.我是如何接触到人工智能的概念和产品的3.对于ChatGPT的一点看法4.AI对大学毕业生的职业发展的利与弊5.对于AI的思考和问题前言随着ChatGPT的爆火，生成式AI，大模型的人工智能被越来越多的人注意到，同时他也带来了许多问题。本文将对几方面进行探讨。1.AI的发展历程远古时期在公元前第一个千禧年，中国，印度和希腊哲学家都提出了一些推理的研究理论，比如亚里士多德（Aristotle）进行了演绎推理三段论的完整分析，欧几里得（Euclid）所著Elements是一种形式推理的模型，MuḥammadibnMūsāal-Khwārizmī,发明了代数学，即我们
山石发声｜风暴眼中的ChatGPT，看NLPer怎么说？ - 2
当前科技领域最有热度的话题，无疑是OpenAI新提出的大规模对话语言模型ChatGPT，一经发布上线，短短五天就吸引了百万用户，仅一个多月的时间月活已然破亿，并且热度一直在持续发酵，各行各业的从业人员、企业机构都开始体验关注甚至自研“类ChatGPT”模型。这里，笔者从一位NLP从业人员的角度谈一谈对ChatGPT的一些看法和思考。1、ChatGPT诞生之路1.1BERT2018年，谷歌提出BERT（BidirectionalEncoderRepresentationfromTransformer）模型，一时之间疯狂屠榜，在各种自然语言处理领域建模任务中取得了最佳的成绩，NLP自此进入了大规模
ChatGPT教程之深入了解魔术背后的技术 - 2
解开谜团：深入探索ChatGPT的技术奇迹。ChatGpt无处不在，无论是在播客、博客、YouTube还是社交媒体上。当我注意到这项新技术如此受欢迎时，我决定试一试，我被震惊了！有很多关于ChatGpt及其魔力的博客，但在这篇博客中，我将深入探讨其内部技术及其工作原理！ChatGpt简介根据OpenAI，ChatGpt被描述为：“我们训练了一个名为ChatGpt的模型，它以对话方式进行交互。对话格式使ChatGpt可以回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。ChatGPT是InstructGPT的兄弟模型，它经过训练可以按照提示中的说明进行操作并提供详细的响应。”OpenA
火爆的ChatGPT快速学成，要看哪些书？ - 2
以前我们经常打趣说：***，你out了！当然了，玩笑成分居多。但是如果作为一名技术人员，现在还没有听说过ChatGPT，那么你可能真的“out”了。比尔·盖茨说，ChatGPT的重要性堪比互联网的发明，甚至它“将改变我们的世界”。ChatGPT得到科技界大佬的如此推崇，那么，ChatGPT到底是什么？ChatGPT是2022年11月底，美国OpenAI公司推出的一款人工智能聊天机器人。两个月后，ChatGPT的月活用户已经突破1亿，成为有史以来增长速度最快的消费者应用程序。ChatGPT功能极其强大，它能够通过学习和理解人类的语言进行对话，还能根据上下文进行互动，实现像人类一样的聊天交流。除了
ChatGPT陷伦理风波 “纯净版”机器人在赶来的路上 - 2
近期，AI安全问题闹得沸沸扬扬，多国“禁令”剑指ChatGPT。自然语言大模型采用人类反馈的增强学习机制，也被担心会因人类的偏见“教坏”AI。4月6日，OpenAI官方发声称，从现实世界的使用中学习是创建越来越安全的人工智能系统的“关键组成部分”，该公司也同时承认，这需要社会有足够时间来适应和调整。至于这个时间是多久，OpenAI也没给出答案。大模型背后的“算法黑箱”无法破解，开发它的人也搞不清机器作答的逻辑。十字路口在前，一些自然语言大模型的开发者换了思路，给类似GPT的模型立起规矩，让对话机器人“嘴上能有个把门的”，并“投喂”符合人类利益的训练数据，以便它们输出“更干净”的答案。这些研发