别急着给中国版ChatGPT唱赞歌：“追风者”无缘“星辰大海”

Alter1230 2023-07-29 原文

文心一言发布十余天后，争论仍未有止歇的迹象。

有人给出了“拉垮”的评价，相比于多轮迭代的ChatGPT，文心一言在逻辑推理、多轮对话等方面的表现不尽如人意；也有人认为给文心一言值得肯定，原因是填补了中文互联网的空白，以及百度直面竞争的勇气。

可能最终会像李彦宏在发布会上所说的：当前文心一言的内测体验并不能叫作“完美”，发布是因为有市场需求，“文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮，效果会迅速提升，给你‘士别三日，当刮目相看’的惊喜。”

这里并非想对比文心一言与ChatGPT的差距，而是想要讨论这样一个话题：那些以“中国版ChatGPT”自居的玩家们，到底是“追风者”还是“追赶者”，不同的“初心”显然对应着不同的结果。

01 中国版ChatGPT的虚与实
国内企业对ChatGPT的态度，大致可以分为三个阶段：

第一个阶段是2023年农历春节前。

OpenAI在2022年11月30日推出了聊天机器人ChatGPT，5天时间注册用户量就超过了100万。期间不乏国内媒体的报道，微博等社交网络上逐渐流行起各种说法：ChatGPT可能将颠覆谷歌，掀起一场搜索引擎的大革命；大学生开始用ChatGPT写论文，部分高校宣布将禁用ChatGPT……

彼时“中国版ChatGPT”的话题已经在技术论坛里小范围讨论，国内大厂的工程师们大概率有参与其中。可由于ChatGPT频频被曝出回答错误、存在假消息，且商业化落地的前景不明朗，国内大多数企业都选择了缄默。

第二个阶段是ChatGPT爆红后。

时间来到2023年1月末，ChatGPT的注册用户破亿，成为史上扩散速度最快的应用，这场AI风暴终于吹到了太平洋对岸。国内社交媒体上充斥着ChatGPT的对话截图，并且出现了“ChatGPT概念股”的说法。

中国的科技大厂们“猛然醒悟”，纷纷开始就中国版ChatGPT表明态度：百度在2月7日官宣将在3月上线文心一言；腾讯在2月9日回应称“在相关方向上已有布局，专项研究也在有序推进”；阿里传出了类ChatGPT应用的对话截图；京东、网易有道、科大讯飞、小米也先后发声将推出相关产品。

第三个阶段是文心一言上线后。

可能因为发布会上的录屏展示，百度的股价在文心一言发布当天即下跌10%，一度成为互联网上的众嘲对象，即使李彦宏和百度CTO王海峰均在发布会上提前打了“预防针”，直言模型目前“训练不够充分”。

有趣的是其他科技大厂的态度。目前申请测试百度文心的用户已经百万，超过10家企业用户申请调用文心一言的企业版API。如果说ChatGPT的走红只是唤醒了国内网民的好奇心，摆出了一副吃瓜群众的姿态，现在已然被彻底点燃了热情。但百度文心上线近10天后，并未有第二家企业官宣。

个中原因恐怕离不开“功利”二字。

在ChatGPT的方向被论证前，国内的大部分投资人和技术领袖并不敢冒险跟进，不考虑短期收益的只有少数派中的少数派；ChatGPT爆红后，特别是“ChatGPT概念股”出现后，中国版ChatGPT已经成为一种政治正确，大厂们的表态也就无可厚非；文心一言上线后则是另一个极端，在“肉眼可见”的技术差距面前，暂时收敛锋芒是否也是一种避开被舆论讨伐的选项？

“中国版ChatGPT”或喧嚣或冷静的背后，似乎还有另外一种解释：在用户心理阈值最高的时候，跟风放出消息不失为一种聪明的商业策略，而落实到产品上，终归还要结合现实需求。就像科大讯飞董事长刘庆峰的观点：AI要兑现红利，标准之一就是有看得见摸得着的应用场景。

02 空间换时间的认知陷阱
至于ChatGPT类产品的商业空间，微软无疑是最佳的参考对象。

作为OpenAI的大股东，微软被中国网友们戏称为“坐在副驾驶上狂飙”，尤其是在ChatGPT的商业应用上，微软可谓动作频频：1月17日的公开活动上，微软CEO纳德拉表示，计划将ChatGPT整合进其所有产品；半个多月后，微软正式推出新版必应，将ChatGPT与搜索引擎融合；GPT-4发布两天后，微软发布了新功能Copilot，将用于Word、PowerPoint、Excel、Outlook等产品中，可自动生成PPT、自动写文章……

为何国内企业并没有兵临城下的危机感？最常见的说法是“空间换时间”，中文互联网的特殊性，为国内企业留下了充足的反应时间。譬如晚于ChatGPT三个半月诞生的文心一言，照旧抓住了大把的机会。诸如此类的说辞在某种程度上有其道理，却也存在一些不可小觑的认知陷阱。

比如中文语料库的问题。

在不少人的理解中，中文语料库是ChatGPT难以逾越的壁垒，李彦宏称“文心一言是更适合中国市场的人工智能模型”，理由正是中文特殊的分词和语法结构。中文语料库的建设需要大量的人力、物力和财力投入，同时还需要考虑语料的质量、版权等问题，几乎是一个天然避风港。

可国内互联网巨头的“数据隔离”也是不争的事实，尽管在工信部的施压下，大厂们被迫“拆墙”，但不同平台的数据仍然很难产生交流和总结，无形中增加了模型训练的难度。就连文心一言的图像生成都经被传出先将中文指令翻译成英文，再根据英文描述生成图像，中文语料的现状可见一斑。

再比如技术上的硬性门槛。

国内并不缺少媲美GPT-3的大模型，这也是很多企业自信可以开发出ChatGPT类应用的直接原因，然而算力资源、工程能力、模型迭代策略、调优机制等能力的缺失也是不争的事实。还是文心一言的例子，虽然有ChatGPT这个参考答案，迭代、调优的路还是要重新走一遍才行。

一个浅显的道理，OpenAI在推出ChatGPT前，已经在大模型上默默耕耘了4年时间，期间不知道有多少次的试错。毕竟一个现象级产品诞生，往往是资源、基础技术、人才、产业需求等一系列因素的集大成，国内到底有多少家企业能够越过技术上的硬性门槛，目前还是一个未知数。

按照华西证券的测算，百度的文心一言想要达到ChatGPT目前的能力，需要补足的训练、推理和数据标注成本分别为2.29亿元、13.62亿元、0.05亿元，需要保持年均16亿元的投入。

倘若再算上维持正常运转的人力成本、训练模型的算力成本、存储数据的数据中心耗费，百度想要追平OpenAI需要付出相当庞大的投入，遑论其他缺少前期布局的企业。

就在百度们还在追赶GPT-3.5时，OpneAI已经有条不紊的推出了功能更为强大的GPT-4，并在3月24日宣布部分解除了ChatGPT无法联网的限制，正在推出ChatGPT插件，可以访问训练数据外的信息，增加一些特定功能，开始了从工具向平台的进化。

03 “追风者”无缘“星辰大海”
最糟糕的并不是做一个“追赶者”，而是“反应迟钝”的追风者。

早在2020年的时候，OpenAI就借着GPT-3一鸣惊人，随即在全球范围内拉开了一场大模型军备竞赛，国内的华为、智源、浪潮、阿里云、百度、腾讯等企业先后发布了自家的预训练大模型品，并不断从NLP延伸出了双语、CV、跨模态等大模型。

而后的一段日子里，来自中国的大模型覇榜各类榜单，学术论文如流水线般生产。一些研究人员以发论文为己任，鲜有人思考学术以外的价值；企业对大模型满怀信心，并试图推动产业落地中来变现。最终也仅仅止步于此，没有一家企业能创造性地越过大模型到ChatGPT的天堑。

有人在知乎上问道：阻碍国内团队研究 ChatGPT 这样产品的障碍有哪些，技术、钱还是领导力？OneFlow创始人袁进辉的回答道出了问题的本质：“需要有远见且为理想而持之以恒的人。”

不可否认的是，“谈理想”在国内的商业环境中多少有些感性且不切实际，甚至连相应的故事都是“舶来品”：图灵奖得主Hinton潜心研究神经网络50多年；斯坦福的李飞飞教授花费6年时间创建了ImageNet数据集；OpenAI最初被定义为非营利性人工智能组织，要向全世界公开分享他们的研究成果……

国内盛行的是另一种商业故事：张小龙在2010年带领一个不到10人的团队，用了不足70天的时间开发出了微信的第一个版本；出行大战中胜出的滴滴，曾用四个月的时间拉来了一万多名网约车司机；2013年才立项测试外卖项目的美团，到了2014年就将外卖送到了全国200个城市……

问题在于，追逐风口、快速创新的打法到了人工智能时代是否依然奏效？不妨借用英伟达CEO黄仁勋的一个比喻：“每家公司都应该知道，未来的软件开发有点像炼丹，这是一个MLOps的过程。”其中的MLOps可以翻译为“人工智能研发运营体系”，涵盖开发、部署、交付验证三个必不可少的过程。

在中国版ChatGPT的研发中，国内的企业已然走了“捷径”：比如ChatGPT最大的特点就是引入了人类反馈的强化学习（RLHF），即用人工标注的方式，不断地将结果去反馈给模型，让模型不断自我迭代。百度等企业后来也采用了RLHF模式，并辅以“对话增强、有监督精调”等机制，底层架构和技术路径都与OpenAI相似。

最危险的地方恰恰也在于此。

不少人将ChatGPT比作是移动互联网时代的iPhone，意味着ChatGPT只是个开始，将有更多超出固有认知的新事物出现，可能是聊天机器人，可能是“画图高手”，也可能是当前还想不到的应用。同时也预示着层出不穷的新风口，凡是风口，皆有虚实，一味跟着别人走路，总有踏空的时候。

李彦宏曾在2021年初的内部信中写道：“我们熬得过万丈孤独，藏得下星辰大海。”冥冥中成了中国企业面对ChatGPT时的命运写照：熬不过万丈孤独，何谈星辰大海？

04 写在最后
中国版ChatGPT的故事还在继续，不排除有越来越多的相似产品上线，甚至出现“百花齐放”的局面。

需要警惕的是那些自诩为“国产之光“的追风者，聊天机器人的风口来临时，迅速整顿人马开发类似应用；AI生图的热度起来后，快速组建团队抓住新的契机；而当新的风向标出现时，会再次调转方向… 不愿意在底层技术上“苦修”，注定要在风口里兜兜转转。

因为“追赶者”仍抱有理想、信念和希望，“追风者”注定只会在风中盘旋，被风势裹挟。

有关别急着给中国版ChatGPT唱赞歌：“追风者”无缘“星辰大海”的更多相关文章

亚特兰蒂斯的回声（中文版): chatGPT 的杰作 - 2
英文版英文链接关注公众号在“亚特兰蒂斯的回声”中踏上一段难忘的冒险之旅，深入未知的海洋深处。足智多谋的考古学家AriaSeaborne偶然发现了一件古代神器，揭示了一张通往失落之城亚特兰蒂斯的隐藏地图。在她神秘的导师内森·兰登教授的指导和勇敢的冒险家亚历克斯·默瑟的帮助下，阿丽亚开始了一段危险的旅程，以揭开这座传说中城市的真相。他们的冒险之旅带领他们穿越险恶的大海、神秘的岛屿和充满陷阱和谜语的致命迷宫。随着Aria潜在的魔法能力的觉醒，她被睿智勇敢的QueenNeria的幻象所指引，她让她为即将到来的挑战做好准备。三人组揭开亚特兰蒂斯令人惊叹的隐藏文明，并了解到邪恶的巫师马拉卡勋爵试图利用其古
智能客服 | 浅谈人工智能聊天机器人ChatGPT - 2
2022年底，OpenAI的预训练模型ChatGPT给人工智能领域的爱好者和研究人员留下了深刻的印象和启发，他展现的惊人能力将人工智能的研究和应用热度推向高潮，网上也充斥着和ChatGPT的各种聊天，他可以作诗、写小说、写代码、讨论疫情问题等。下面就是一些他的神回复：人命关天的坑：写歌，留给词作者的机会不多了。。。回答人类怎么样面对人工智能：什么是ChatGPT？借用网上的一段介绍，ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型，一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动
【ChatGPT】ChatGPT 的 N 种用法 - 2
目录ChatGPT简介技术原理应用未来发展ChatGPT的10 种用法ChatGPT简介ChatGPT是一种基于深度学习的大型语言模型，由OpenAI公司开发。技术原理GPT是GenerativePre-trainedTransformer的缩写，意为生成式预训练变压器。它的技术原理是使用了一个基于注意力机制的变压器（Trans
「想体验ChatGPT中文聊天？」那快进来，你用不上算我输 - 2
♥️作者：白日参商🤵‍♂️个人主页：白日参商主页♥️坚持分析平时学习到的项目以及学习到的软件开发知识，和大家一起努力呀！！！🎈🎈加油！加油！加油！加油🎈欢迎评论💬点赞👍🏻收藏📂加关注+！「想体验ChatGPT中文聊天？」那快进来，你用不上算我输项目场景：项目条件一、那就开始吧1、安装ChatGPT-Desktop2、OpenAPI设置二、使用实例恭喜你！！！配置成功了！！！API和URL都是博主免费提供给大家的！！！恭喜你！！！配置成功了！！！API和URL都是博主免费提供给大家的！！！🎈🎈加油！加油！加油！加油🎈欢迎评论💬点赞👍🏻收藏📂加关注+！项目场景：近几个月可以说ChatGPT是火得一
半个月狂飙1000亿，ChatGPT概念股凭什么？ - 2
ChatGPT掀起了AI股历史上最疯狂的一轮市值狂飙。自春节后至今，ChatGPT概念股开始了暴走模式，短短半月时间，海天瑞声、开普云等ChatGPT概念股市值累计增加了近1400亿。如此的爆炸效应，得益于ChatGPT所展现出商业化落地的巨大潜力。要知道，在此之前，无论是十年AI投入超千亿的百度，还是困在硬件化里的AI四小龙，都在重复着AI商业化难落地的故事。ChatGPT的出现，让AI从生产力的赋能者直接成为一种创造生产力的工具。随着订阅模式的推出，ChatGPT已经成为第一个以AI技术为核心直接变现的消费者应用。本文持有以下核心观点：1、ChatGPT是AI技术迭代的受益者。过去受限技术
未来的趋势————以ChatGPT为标杆的AI对生活的影响是巨大的 - 2
文章目录前言1.AI的发展历程2.我是如何接触到人工智能的概念和产品的3.对于ChatGPT的一点看法4.AI对大学毕业生的职业发展的利与弊5.对于AI的思考和问题前言随着ChatGPT的爆火，生成式AI，大模型的人工智能被越来越多的人注意到，同时他也带来了许多问题。本文将对几方面进行探讨。1.AI的发展历程远古时期在公元前第一个千禧年，中国，印度和希腊哲学家都提出了一些推理的研究理论，比如亚里士多德（Aristotle）进行了演绎推理三段论的完整分析，欧几里得（Euclid）所著Elements是一种形式推理的模型，MuḥammadibnMūsāal-Khwārizmī,发明了代数学，即我们
山石发声｜风暴眼中的ChatGPT，看NLPer怎么说？ - 2
当前科技领域最有热度的话题，无疑是OpenAI新提出的大规模对话语言模型ChatGPT，一经发布上线，短短五天就吸引了百万用户，仅一个多月的时间月活已然破亿，并且热度一直在持续发酵，各行各业的从业人员、企业机构都开始体验关注甚至自研“类ChatGPT”模型。这里，笔者从一位NLP从业人员的角度谈一谈对ChatGPT的一些看法和思考。1、ChatGPT诞生之路1.1BERT2018年，谷歌提出BERT（BidirectionalEncoderRepresentationfromTransformer）模型，一时之间疯狂屠榜，在各种自然语言处理领域建模任务中取得了最佳的成绩，NLP自此进入了大规模
ChatGPT教程之深入了解魔术背后的技术 - 2
解开谜团：深入探索ChatGPT的技术奇迹。ChatGpt无处不在，无论是在播客、博客、YouTube还是社交媒体上。当我注意到这项新技术如此受欢迎时，我决定试一试，我被震惊了！有很多关于ChatGpt及其魔力的博客，但在这篇博客中，我将深入探讨其内部技术及其工作原理！ChatGpt简介根据OpenAI，ChatGpt被描述为：“我们训练了一个名为ChatGpt的模型，它以对话方式进行交互。对话格式使ChatGpt可以回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。ChatGPT是InstructGPT的兄弟模型，它经过训练可以按照提示中的说明进行操作并提供详细的响应。”OpenA
火爆的ChatGPT快速学成，要看哪些书？ - 2
以前我们经常打趣说：***，你out了！当然了，玩笑成分居多。但是如果作为一名技术人员，现在还没有听说过ChatGPT，那么你可能真的“out”了。比尔·盖茨说，ChatGPT的重要性堪比互联网的发明，甚至它“将改变我们的世界”。ChatGPT得到科技界大佬的如此推崇，那么，ChatGPT到底是什么？ChatGPT是2022年11月底，美国OpenAI公司推出的一款人工智能聊天机器人。两个月后，ChatGPT的月活用户已经突破1亿，成为有史以来增长速度最快的消费者应用程序。ChatGPT功能极其强大，它能够通过学习和理解人类的语言进行对话，还能根据上下文进行互动，实现像人类一样的聊天交流。除了
ChatGPT陷伦理风波 “纯净版”机器人在赶来的路上 - 2
近期，AI安全问题闹得沸沸扬扬，多国“禁令”剑指ChatGPT。自然语言大模型采用人类反馈的增强学习机制，也被担心会因人类的偏见“教坏”AI。4月6日，OpenAI官方发声称，从现实世界的使用中学习是创建越来越安全的人工智能系统的“关键组成部分”，该公司也同时承认，这需要社会有足够时间来适应和调整。至于这个时间是多久，OpenAI也没给出答案。大模型背后的“算法黑箱”无法破解，开发它的人也搞不清机器作答的逻辑。十字路口在前，一些自然语言大模型的开发者换了思路，给类似GPT的模型立起规矩，让对话机器人“嘴上能有个把门的”，并“投喂”符合人类利益的训练数据，以便它们输出“更干净”的答案。这些研发

别急着给中国版ChatGPT唱赞歌：“追风者”无缘“星辰大海”

有关别急着给中国版ChatGPT唱赞歌：“追风者”无缘“星辰大海”的更多相关文章

随机推荐