生成式 AI：百度“文心一言”对标 ChatGPT？什么技术趋势促使 ChatGPT 火爆全网？

白鹿第一帅 2023-10-13 原文

文章目录

前言

2023 年 3 月 27 日，百度文心一言正式发布，李彦宏开场即言，百度是首个做出可以对标 ChatGPT 的产品的大厂，作为“国产版 ChatGPT”、百度全新一代知识增强大语言模型，文心大模型家族的新成员，能够与人对话互动，回答问题，协助创作，高效便捷地帮助人们获取信息、知识和灵感。在 2022 年 11 月 30 日美国 OpenAI 研发的聊天机器人程序 ChatGPT 一经发布，就瞬间爆火全网，作为人工智能技术驱动的自然语言处理工具，它能够通过理解和学习人类的语言来进行对话，还能根据聊天的上下文进行互动，“真正”像人类一样来聊天交流，随着不同版本的迭代和更新，我们可以看到众多使用者甚至能在其帮助下完成撰写邮件、视频脚本、文案、翻译、代码，写论文等任务。百度文心一言能否与 ChatGPT “掰掰手腕”，在二者的背后又是什么技术趋势促使其火爆全网呢？本文我们一探究竟。

一、生成式 AI 的发展和现状

1.1、什么是生成式 AI？

生成式 AI（Generative AI） 是指计算机通过机器学习从现有数据中学习一个对象（物品、产品或任务）的要素，进而生成一个全新的、原创的、真实的、与原来内容相似的对象。作为重要的战略技术，在 2025 年 10+% 的数据将由 AI 创造。

1.2、生成式 AI 的发展趋势

根据 Gartner《2021 年预测：人工智能对人类和社会的影响》 中预测：

至 2023 年将有 20% 的内容被生成式 AI 所创建。
至 2025 年，生成式 AI 产生的数据将占有所有数据的 10%，而今天这个比例不到 1%。

对于生成式 AI 的发展趋势预测，具体如下图所示：

1.3、AI 生成内容的业务场景和分类

在不含 AI 生成代码的情况下，AI 生成内容的业务场景和分类已经囊括众多的技术领域，AIGC 技术场景具体如下图所示：

二、生成式 AI 从分析领域到创作领域

2.1、降低内容创作门槛，增加 UGC 用户群体

AIGC 能够代替人工完成声音录制、图像渲染等工作，使更多人员能够参与到高价值的内容创作流程中。预计这一效果在 2B 结构化内容生成的领域非常明显，个别场景会出现 2C 服务。跨模态生成成为未来重点。

2.2、提升创作及反馈效率，铺垫线上实时互动

AI 同样提升了内容的反馈生成速度，对于实时交互内容有重大意义，具有将线下和真人的快速交互迁移到线上的可能，也即令 AI 承担真人的社交、创作、协作功能，可能会出现新的潜在场景（如社交类和探索类游戏等）。我们在 Game AI 板块所提及的 AIbot 实时玩家教学在一定程度上提供了一种互动的新形式，交互教育/交互探索游戏虚拟陪伴场景值得期待。
目前来看，内容消费者变得更容易将现实情感需求投射在虚拟世界中，预计会产生许多深入实时的互动需求，市场规模可观。

2.3、基于海量数据激发创意认知、提升内容生产多样性

相较于人类艺术家，AI 能够接触借鉴更多的数据，在基于 prompt 进行内容生成后 AI 创作的内容会有更多的二次创造空间和自由度。例如，生成算法能基于特定条件或完全随机的生成现实中不存在的形状、色彩搭配、图案或结构等，赋予内容创作更多可能，产生“超现实感”及“未来感”，推动艺术创新。

2.4、模态元素二次拆解组合，改变内容生产逻辑及形式

通过语音克隆、编曲风格提取等手段，AIGC 能够将原客体所对应的不同模态信息进行拆解，例如演讲者的面部形象、声音、演讲内容等。在重新组合之后，能够完成过往受到条件限制无法完成的工作。例如路人的声音 + 专业的播音逻辑、更符合特定审美的面部等，打破真人/真实场景在要素组合上具有的局限性。

2.5、AI 系统或数据库联动，实现高度个性化/高频优化

在与特定的数据库（例如实时更新的客户数据、市场反馈数据、特定主题下的历史统计数据）或 AI 系统进行联动后（如个性化推荐系统等），AIGC 能够在更为精准的未来预测/个性化预测基础上调整其生成内容。
例如，根据、根据所处渠道风格调整生成内容、参考历史数据优化生成内容等。该价值在内容用户习惯调整内容营销文本营销领域有重大意义。

三、生成式 AI 改变内容创作和分发范式

3.1、当前与未来设计工作流程对比

当前概念设计师工作流程：接到需求→搜集参考（图库）→构思出图→和甲方沟通修改。
未来设计工作流程：创意→AI→创意。

3.2、AI 文生图存在最大的问题是什么？

AI 创作能力在未来短时间内的进步速度，也将取决于各行各业收集和训练行业优质数据的工作。

开发人员使用 AI 生成宠物小精灵，在初期使用“写实”数据集后发现运行效果不理想，重新使用 26 张新数据集训练 20 分钟，我们根据二者之间的对比，可以看到 AI 学习和生成效果是非常棒的，具体如下图所示：

AI 目前最大的问题不是“不够聪明”，而是“书读得太少"。 在 AI 新范式下创作，要考虑什么样的内容更利于 AI 学习和 AI 生成使用。

如果我们将艺术家关键词对生成图像的贡献视为艺术家本/的贡献，我们从原理上就可以为艺术家的创意价值定价了。

3.3、AI 从底层改变了哪些游戏规则？

今天的 AI 从底层改变了游戏规则，接下来会看到以下变化：

不会画画的人用 AI 生产高质量视觉作品。
互联网上难以估量的图像数据被重新组织起来，围绕模型训练和数据标注出现新的生意。
图片版权名存实亡，参与建立 AI 数据集成为艺术家的主要收益。
传统图像处理软件、3D 建模软件被围绕 AI 范式建立的新工具取代。

四、为何生成式 AI 迅速爆发和突破？

4.1、大模型突破瓶颈

根据英特尔（Intel）创始人之一戈登·摩尔（Gordon Moore）提出的 “摩尔定律”：当价格不变时，集成电路上可容纳的晶体管数目，约每隔18个月便会增加一倍，性能也将提升一倍。换言之，每一美元所能买到的电脑性能，将每隔 18 个月翻两倍以上。

而现在由于高效数据、高效算力、高效模型、高效知识需求的增长，摩尔定律原来中的 2 倍将增长至现在的 10 倍，具体如下图所示：

在 “The blessings of scale”中，根据趋势我们可以明确得知：同等条件下，随着模型参数量的增加，更大的模型会带来更好的结果，且目前的趋势并未饱和，故目前阶段大模型的投资依然会增加以获得更高的效益，具体如下图所示：

4.2、多模态融合打破边界

多模态融合打破边界，模型越来越大，模型走向行业，模型走向融合，具体如下表所示：

大模型趋势	内容
模型越来越大	探索极限，目前到 5000 亿仍然保持线性增长。越来越接近人脑神经元连接数，甚至超过。例：OpenAl GPT-3（175B）、谷歌 PaLM（540B）
模型走向行业	在通用预训练大校型（L0）的基础上，在行业数据上更新训练后，适用于行业特征拍取的模型族（L1）。例：煤矿模型，电力大模型，药物分子大模型等。商汤：INTFRN 系统（初学者-专家-通才）；百度:行业大模型。
模型走向融合	未来 2~3 年，视觉和语言大模型统一到多模态大模型，架构上也实现基本统一。各种校态大模型进行充分融合。例：文本 + 视觉，语音 + 文本，文本 + 视频等 OpenAI DALL*E/E2；谷歌 Imagen；微软 GLIP 等。

五、生成式 AI 技术趋势分析

生成式 AI 技术的发展更趋向于：可控、高精度；更快、更好、更便宜。

可控和高精度重建成为技术突破口，带来了超乎想象的结果，得益于 Diffusion model、语言大模型、跨模特大模型、Nerf 等技术的突破，具体如下图所示：

六、生成式 AI 无法产生创意的基本元素

生成式 AI，可控生成于机器而言，是不同语义的重组，于人而言，就是创意！在绘画领域，AIGC 是将绘画的三要素（构图、纹理、着色）进行重组从而产生创意。但是他并不能真的产生创意的基本元素，举例具体如下图所示：

图像生成，反事实是创意，但是对于语言生成，反事实却是灾难，可谓“恐怖如斯”，具体如下图所示：

总结

百度文心一言发布，股价盘中跌超 10%，也看到很多小伙伴们在试用文心一言后发出的吐槽，基于 Generative AI 的发展不是一朝一夕，这个问题的本质也并不是仅在文心一言中存在的，而 ChatGPT 确实在自然语言理解、自然语言处理等方面有进步的地方，同时，在算法、数据、算力上推进了有效结合。而面对 ChatGPT 的热潮，我们应有的态度正如科技部部长王志刚说所说，我们国家对于任何一个新的技术，包括 AI 技术出来以后，在伦理方面都采取了一些相应的措施，对科学技术发展趋利避害，让“利”更好地发挥出来。

我是白鹿，一个不懈奋斗的程序猿。望本文能对你有所裨益，欢迎大家的一键三连！若有其他问题、建议或者补充可以留言在文章下方，感谢大家的支持！

ChatGPT 文心 xff xff0c xff0 人工智能文心一言机器学习生成式AI

有关生成式 AI：百度“文心一言”对标 ChatGPT？什么技术趋势促使 ChatGPT 火爆全网？的更多相关文章

ruby - 使用 RubyZip 生成 ZIP 文件时设置压缩级别 - 2
我有一个Ruby程序，它使用rubyzip压缩XML文件的目录树。gem。我的问题是文件开始变得很重，我想提高压缩级别，因为压缩时间不是问题。我在rubyzipdocumentation中找不到一种为创建的ZIP文件指定压缩级别的方法。有人知道如何更改此设置吗？是否有另一个允许指定压缩级别的Ruby库？最佳答案这是我通过查看rubyzip内部创建的代码。level=Zlib::BEST_COMPRESSIONZip::ZipOutputStream.open(zip_file)do|zip|Dir.glob("**/*")d
ruby - 在 jRuby 中使用 'fork' 生成进程的替代方案？ - 2
在MRIRuby中我可以这样做:deftransferinternal_server=self.init_serverpid=forkdointernal_server.runend#Maketheserverprocessrunindependently.Process.detach(pid)internal_client=self.init_client#Dootherstuffwithconnectingtointernal_server...internal_client.post('somedata')ensure#KillserverProcess.kill('KILL',
ruby - 如何使用 Ruby aws/s3 Gem 生成安全 URL 以从 s3 下载文件 - 2
我正在编写一个小脚本来定位aws存储桶中的特定文件，并创建一个临时验证的url以发送给同事。(理想情况下，这将创建类似于在控制台上右键单击存储桶中的文件并复制链接地址的结果)。我研究过回形针，它似乎不符合这个标准，但我可能只是不知道它的全部功能。我尝试了以下方法:defauthenticated_url(file_name,bucket)AWS::S3::S3Object.url_for(file_name,bucket,:secure=>true,:expires=>20*60)end产生这种类型的结果:...-1.amazonaws.com/file_path/file.zip.A
ruby-on-rails - Ruby on Rails - 为文本区域和图片生成列 - 2
我是Rails的新手，所以请原谅简单的问题。我正在为一家公司创建一个网站。那家公司想在网站上展示它的客户。我想让客户自己管理这个。我正在为“客户”生成一个表格，我想要的三列是:公司名称、公司描述和Logo。对于名称，我使用的是name:string但不确定如何在脚本/生成脚手架终端命令中最好地创建描述列(因为我打算将其设置为文本区域)和图片。我怀疑描述(我想成为一个文本区域)应该仍然是描述:字符串，然后以实际形式进行调整。不确定如何处理图片字段。那么……说来话长:我在脚手架命令中输入什么来生成描述和图片列？最佳答案对于“文本”数
ruby-on-rails - 如何生成传递一些自定义参数的 `link_to` URL？ - 2
我正在使用RubyonRails3.0.9，我想生成一个传递一些自定义参数的link_toURL。也就是说，有一个articles_path(www.my_web_site_name.com/articles)我想生成如下内容:link_to'Samplelinktitle',...#HereIshouldimplementthecode#=>'http://www.my_web_site_name.com/articles?param1=value1¶m2=value2&...我如何编写link_to语句“alàRubyonRailsWay”以实现该目的？如果我想通过传递一些
ruby-on-rails - 如何在 Rails 3 中创建自定义脚手架生成器？ - 2
有这些railscast。http://railscasts.com/episodes/218-making-generators-in-rails-3有了这个，你就会知道如何创建样式表和脚手架生成器。http://railscasts.com/episodes/216-generators-in-rails-3通过这个，您可以了解如何添加一些文件来修改脚手架View。我想把两者结合起来。我想创建一个生成器，它也可以创建脚手架View。有点像RyanBates漂亮的生成器或web_app_themegem(https://github.com/pilu/web-app-theme)。我
报告回顾丨模型进化狂飙，DetectGPT能否识别最新模型生成结果？ - 2
导读语言模型给我们的生产生活带来了极大便利，但同时不少人也利用他们从事作弊工作。如何规避这些难辨真伪的文字所产生的负面影响也成为一大难题。在3月9日智源Live第33期活动「DetectGPT：判断文本是否为机器生成的工具」中，主讲人Eric为我们讲解了DetectGPT工作背后的思路——一种基于概率曲率检测的用于检测模型生成文本的工具，它可以帮助我们更好地分辨文章的来源和可信度，对保护信息真实、防止欺诈等方面具有重要意义。本次报告主要围绕其功能，实现和效果等展开。（文末点击“阅读原文”，查看活动回放。）Ericmitchell斯坦福大学计算机系四年级博士生，由ChelseaFinn和Chri
亚特兰蒂斯的回声（中文版): chatGPT 的杰作 - 2
英文版英文链接关注公众号在“亚特兰蒂斯的回声”中踏上一段难忘的冒险之旅，深入未知的海洋深处。足智多谋的考古学家AriaSeaborne偶然发现了一件古代神器，揭示了一张通往失落之城亚特兰蒂斯的隐藏地图。在她神秘的导师内森·兰登教授的指导和勇敢的冒险家亚历克斯·默瑟的帮助下，阿丽亚开始了一段危险的旅程，以揭开这座传说中城市的真相。他们的冒险之旅带领他们穿越险恶的大海、神秘的岛屿和充满陷阱和谜语的致命迷宫。随着Aria潜在的魔法能力的觉醒，她被睿智勇敢的QueenNeria的幻象所指引，她让她为即将到来的挑战做好准备。三人组揭开亚特兰蒂斯令人惊叹的隐藏文明，并了解到邪恶的巫师马拉卡勋爵试图利用其古
python - 帮我找到合适的 ruby/python 解析器生成器 - 2
我使用的第一个解析器生成器是Parse::RecDescent，它的指南/教程很棒，但它最有用的功能是它的调试工具，特别是tracing功能(通过将$RD_TRACE设置为1来激活)。我正在寻找可以帮助您调试其规则的解析器生成器。问题是，它必须用python或ruby编写，并且具有详细模式/跟踪模式或非常有用的调试技术。有人知道这样的解析器生成器吗？编辑:当我说调试时，我并不是指调试python或ruby。我指的是调试解析器生成器，查看它在每一步都在做什么，查看它正在读取的每个字符，它试图匹配的规则。希望你明白这一点。赏金编辑:要赢得赏金，请展示一个解析器生成器框架，并说明它的
ruby - 如何为 pbcopy 生成富文本链接 - 2
我一直在玩一个脚本，它在Chrome中获取选定的文本并在Google中查找它，提供四个最佳选择，然后粘贴相关链接。它以不同的格式粘贴，具体取决于当前在Chrome中打开的页面-DokuWiki打开的DokuWiki格式，普通网站的HTML，我想要我的WordPress所见即所得编辑器的富文本。我尝试使用pbpaste-Preferrtf来查看没有其他样式的富文本链接在粘贴板上的样子，但它仍然输出纯文本。在文本编辑中保存文件并进行试验后，我想出了以下内容text=%q|{\rtf1{\field{\*\fldinst{HYPERLINK"URL"}}{\fldrsltTEXT}}}|te