GPT-3.5(ChatGPT)训练和部署成本估算

一朵尘埃 2023-08-01 原文

因为ChatGPT（GPT-3.5）未正式公布参数量，暂时按照1750亿参数计算。
后续其他模型公布参数量后，可按参数量线性比例估算相关数值。

以下数值仅为理论估算，可能和实际数值相差很大，敬请谅解。

一、GPT-3.5磁盘占用估算

不同模型之间，磁盘、参数量可以按线性关系粗略估算；
yolov5x：参数量87.6M，磁盘占用166M
175B/87.6M = 1751024/87.6 = 2046
GPT-3.5磁盘占用估算：1662046/1024 = 332G
所以GPT-3.5模型大小约为332G。GPT-3.5参数量是YOLOV5X参数量的2046倍。

二、GPT-3.5用于推理时显存占用估算

显存占用估算方法参考：https://blog.csdn.net/weixin_49305813/article/details/119179849
显存占用=模型显存(参数)+batch_size×每个样本显存(输出和梯度动量)
GPT-3显存占用：17510244 /1024 = 700G (参数为32float，占4个字节)
需要A100数量：700G/80G = 9块A100
所以，GPT-3.5仅做推理时，空转显存占用约700G，需要大约9块A100(80G)显卡。

考虑用户访问模型：
国信证券测算称，训练阶段每个Token的训练成本约为6N（推理成本为2N）。
根据Similarweb的数据，23年1月份当前ChatGPT日活约1300万人，每人平均1000字左右的问题，因此合计产生约130亿字（173.3亿个token）。假设24小时平均分配任务，需要的算力为
173.3亿21750亿/（51%24小时3600秒）=173000000002175000000000/24/3600/0.51/1000000000000000
=137 PetaFLOP/S
由于访问流量存在峰值，假定访问峰值是一天均值的5倍， NVIDIA 80GB A100 GPU理论算力是 0.312 PFLOPS。
需要A100显卡数量 137*5/0.312 = 2195块
所以，大约需要2195块A100可以满足日活约1300万人访问需求。

三、GPT-3.5训练使用的显卡数量估计

据OpenAI团队发表于2020年的论文《Language Models are Few-Shot Learners》，训练一次1746亿参数的 GPT-3模型需要的算力约为3640 PF-days。
如果是 NVIDIA 80GB A100 GPU, 理论算力是 312 TFLOPS，Megatron 利用 tensor parallel 和 pipeline parallel 并行技术能达到 51.4% 的利用率，也即是每秒能完成 0.160 PFLOPS。
一张A100卡需要跑3640/0.16 = 22750(天)
按照1个月的训练时间计算，需要A100卡数量估计 = 22750/30 = 758 (块)
据悉，训练Meta AI的OPT-175B使用了992张80GB的A100 GPU，每个GPU的算力达到了147 TFLOP/s。
所以，综合以上信息估计完成一次训练，A100卡的用量需求大约为1000块。

四、租赁价格估计

显卡（NVIDIA 80GB A100 GPU）的租赁价格为 1.5 刀每小时
综合上面的访问和训练用A100数量：2195+1000=3195；
还需要考虑并行训练、测试等用卡量，总体按10000块A100估计。
10000块A100一天的租赁费用：10000 * 24 * 1.5 = 360000刀 = 36万刀
注：以上未考虑英伟达对OpenAI的优惠价格。

五、其他机构预测（感觉比较离谱）

3月7日消息，市场调查机构TrendForce公布的最新报告指出，如果以英伟达A100显卡的处理能力计算，运行ChatGPT将需要使用到30000块英伟达GPU。
调查机构TrendForce在报告中指出，预估ChatGPT需要20000块显卡来处理训练数据。随着OpenAI继续在商业上部署ChatGPT和该公司的生成式GPT模型，可能需要超过30000块显卡。
目前英伟达 A100 显卡的售价在10000-15000美元之间，该售价取决于OpenAI需要多少显卡，以及英伟达是否会为AI公司提供订单折扣。TrendForce预估英伟达可以赚取超过3亿美元（IT之家备注：当前约 20.82 亿元人民币）收入。
ChatGPT训练阶段总算力消耗约为3640 PF-days（即1PetaFLOP/s效率跑3640天）。据普超资本微信公众号，GPT-3训练成本预计在500万美元/次。

六、参考

以GPT-3 175B为例，说明PF-days和flops的等量关系；
3.64E+03 PF-days=3640 * 1000 * 1000* 100010001000243600 = 3.14E+23 次浮点运算

NVIDIA 80GB A100 GPU 理论算力参考：

Megatron 利用率参考：
GitHub - NVIDIA/Megatron-LM: Ongoing research training transformer models at scale

显卡租赁价格参考：

估算训练 xff xff0c xff0 gpt-3 chatgpt 深度学习

有关GPT-3.5(ChatGPT)训练和部署成本估算的更多相关文章

ruby-on-rails - 每次我尝试部署时，我都会得到 - (gcloud.preview.app.deploy) 错误响应 : [4] DEADLINE_EXCEEDED - 2
我是Google云的新手，我正在尝试对其进行首次部署。我的第一个部署是RubyonRails项目。我基本上是在关注thisguideinthegoogleclouddocumentation.唯一的区别是我使用的是我自己的项目，而不是他们提供的“helloworld”项目。这是我的app.yaml文件runtime:customvm:trueentrypoint:bundleexecrackup-p8080-Eproductionconfig.ruresources:cpu:0.5memory_gb:1.3disk_size_gb:10当我转到我的项目目录并运行gcloudprevie
亚特兰蒂斯的回声（中文版): chatGPT 的杰作 - 2
英文版英文链接关注公众号在“亚特兰蒂斯的回声”中踏上一段难忘的冒险之旅，深入未知的海洋深处。足智多谋的考古学家AriaSeaborne偶然发现了一件古代神器，揭示了一张通往失落之城亚特兰蒂斯的隐藏地图。在她神秘的导师内森·兰登教授的指导和勇敢的冒险家亚历克斯·默瑟的帮助下，阿丽亚开始了一段危险的旅程，以揭开这座传说中城市的真相。他们的冒险之旅带领他们穿越险恶的大海、神秘的岛屿和充满陷阱和谜语的致命迷宫。随着Aria潜在的魔法能力的觉醒，她被睿智勇敢的QueenNeria的幻象所指引，她让她为即将到来的挑战做好准备。三人组揭开亚特兰蒂斯令人惊叹的隐藏文明，并了解到邪恶的巫师马拉卡勋爵试图利用其古
ruby-on-rails - Ruby on Rails 可以部署在 Azure 网站上吗？ - 2
我可以在Azure网站上部署RubyonRails吗？最佳答案还没有。目前仅支持.NET和PHP。关于ruby-on-rails-RubyonRails可以部署在Azure网站上吗？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/12964010/
jenkins部署1--jenkins+gitee持续集成 - 2
前置步骤我们都操作完了，这篇开始介绍jenkins的集成。话不多说，看操作1、登录进入jenkins后会让你选择安装插件，选择第一个默认的就行。安装完成后设置账号密码，重新登录。2、配置JDK和Git都需要执行路径，所以需要先把执行路径找到，先进入服务器的docker容器，2.1JDK的路径root@69eef9ee86cf:/usr/bin#echo$JAVA_HOME/usr/local/openjdk-82.2Git的路径root@69eef9ee86cf:/#whichgit/usr/bin/git3、先配置JDK和Git。点击：ManageJenkins>>GlobalToolCon
深度学习部署：Windows安装pycocotools报错解决方法 - 2
深度学习部署：Windows安装pycocotools报错解决方法1.pycocotools库的简介2.pycocotools安装的坑3.解决办法更多Ai资讯：公主号AiCharm本系列是作者在跑一些深度学习实例时，遇到的各种各样的问题及解决办法，希望能够帮助到大家。ERROR:Commanderroredoutwithexitstatus1:'D:\Anaconda3\python.exe'-u-c'importsys,setuptools,tokenize;sys.argv[0]='"'"'C:\\Users\\46653\\AppData\\Local\\Temp\\pip-instal
Ruby，使用包含 TK GUI 的 ocra 部署一个 exe - 2
Ocra无法处理需要“tk”的应用程序require'tk'puts'nope'用奥克拉http://github.com/larsch/ocra不起作用(如链接中的一个问题所述)问题:https://github.com/larsch/ocra/issues/29(Ocra是1.9的"new"rubyscript2exe，本质上它用于将rb脚本部署为可执行文件)唯一的问题似乎是缺少tcl的DLL文件我不认为这是一个问题据我所知，问题是缺少tk的DLL文件如果它们是已知的，则可以在执行ocra时将它们包括在内有没有办法知道tk工作所需的DLL依赖项？最佳答
ruby-on-rails - NameError(未初始化常量 Unzipper::Zip)但仅在 Heroku 部署(Rails)上 - 2
我有一个类unzipper.rb，它使用Rubyzip解压文件。在我的本地环境中，我可以成功解压缩文件，而无需使用require'zip'明确包含依赖项但是在Heroku上，我得到一个NameError(uninitializedconstantUnzipper::Zip)我只能通过使用明确的require来解决问题:为什么这在Heroku环境中是必需的，但在本地主机上却不是？我的印象是Rails自动需要所有gem。app/services/unzipper.rbrequire'zip'#OnlyrequiredforHeroku.Workslocallywithout!class
ruby - Sinatra + Heroku + Datamapper 使用 dm-sqlite-adapter 部署问题 - 2
出于某种原因，heroku尝试要求dm-sqlite-adapter，即使它应该在这里使用Postgres。请注意，这发生在我打开任何URL时-而不是在gitpush本身期间。我构建了一个默认的Facebook应用程序。gem文件:source:gemcuttergem"foreman"gem"sinatra"gem"mogli"gem"json"gem"httparty"gem"thin"gem"data_mapper"gem"heroku"group:productiondogem"pg"gem"dm-postgres-adapter"endgroup:development,:t
智能客服 | 浅谈人工智能聊天机器人ChatGPT - 2
2022年底，OpenAI的预训练模型ChatGPT给人工智能领域的爱好者和研究人员留下了深刻的印象和启发，他展现的惊人能力将人工智能的研究和应用热度推向高潮，网上也充斥着和ChatGPT的各种聊天，他可以作诗、写小说、写代码、讨论疫情问题等。下面就是一些他的神回复：人命关天的坑：写歌，留给词作者的机会不多了。。。回答人类怎么样面对人工智能：什么是ChatGPT？借用网上的一段介绍，ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型，一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动
【ChatGPT】ChatGPT 的 N 种用法 - 2
目录ChatGPT简介技术原理应用未来发展ChatGPT的10 种用法ChatGPT简介ChatGPT是一种基于深度学习的大型语言模型，由OpenAI公司开发。技术原理GPT是GenerativePre-trainedTransformer的缩写，意为生成式预训练变压器。它的技术原理是使用了一个基于注意力机制的变压器（Trans