草庐IT

ChatGPT vs. GPT-3 vs. GPT-4只是聊天机器人家族的内部斗争

Aleks 2023-03-28 原文
在解释SoMin公司的广告文案和横幅生成功能时,经常有人会问,是否用ChatGPT取代了GPT-3,或者是否仍然在运行过时的模式。“我们没有,也不打算这样做。”SoMin公司发言人给出这样的回答,尽管OpenAI公司推出的ChatGPT这款聊天机器人正在蓬勃发展。这往往会让客户大吃一惊,以下解释一下他为什么要给出这样的回答。

在人工智能模型中占有一席之地

GPT-2、GPT-3、ChatGPT以及最近推出的GPT-4都属于同一类人工智能模型——Transformer。这意味着,与上一代机器学习模型不同,它们被训练来完成更统一的任务,因此它们不需要为每个特定的任务重新训练来产生可行的结果。后者解释了它们的巨大规模(在GPT-3的例子中有1750亿个参数),而一个模型可能需要“记住整个互联网”,才能足够灵活地根据用户输入在不同的数据片段之间切换。然后,当用户输入查询的问题,描述任务和几个示例(就像你向图书管理员询问感兴趣的书籍一样)时,模型能够生成结果。这种方法被称为“小样本学习”(Few-Shot Learning),最近在为现代Transformer模型提供输入已成为一种趋势。

但是,为了完成当前的任务,是否总是需要掌握所有的互联网知识呢?当然不是——在很多情况下,就像ChatGPT一样,需要大量 (数以百万计)特定于任务的数据样本,这些样本将允许模型启动“从人类反馈中强化学习(RLHF)”过程。反过来,RLHF将衍生出人工智能和人类之间进行的协作训练过程,以进一步训练人工智能模型,以产生类似人类的对话。因此,ChatGPT不仅在聊天机器人场景中表现出色,而且还帮助人们编写短篇内容(例如诗歌或歌词)或长篇内容(例如论文);当人们需要快速获得答案时,可以采用简单的术语或深入的知识解释复杂的话题;提供头脑风暴、新的话题和想法,这在创作过程中是有帮助的,支持销售部门进行个性化沟通,例如生成电子邮件进行回复。

虽然从技术上来说,大型Transformer模型可以尝试完成这些任务,但不太可能由ChatGPT甚至GPT-4来完成——这是因为ChatGPT和其他OpenAI的Transformer对世界发生的事件了解非常有限,因为它们是预训练的模型,因此由于模型再训练的计算需求非常大,因此它们的数据更新不够频繁。这可能是迄今为止OpenAI(以及其他任何公司)所生成的所有预训练模型中最大的缺点。一个更大的问题是针对ChatGPT的:与GPT-3不同,它是在一个非常集中的对话数据集上进行训练的,因此,只有在对话任务中ChatGPT才能超越它的前辈,而在完成其他人类生产力任务时,它就不那么先进。

成长中的大型语言模型家族

人们现在知道ChatGPT只是GPT-3的一个更小、更具体的版本,但这是否意味着在不久的将来会有更多这样的模型出现:用于营销的MarGPT,用于数字广告的AdGPT,用于回答医疗问题的MedGPT?

这是有可能的,其原因如下:当SoMin公司提交一份申请以获得GPT-3 Beta的访问权限时,尽管填写了一份冗长的申请表,详细解释了将要构建的当前软件,但被要求同意提供关于每天如何使用模型以及所收到的结果的反馈。OpenAI公司这样做是有原因的,主要是因为这是一个研究项目,他们需要对模型的最佳应用进行商业洞察,他们通过众筹来换取参与这场伟大的人工智能革命的机会。聊天机器人应用程序似乎是最受欢迎的应用程序之一,所以ChatGPT首先出现。ChatGPT不仅规模更小(200亿个参数vs.1750亿个参数),而且比GPT-3更快,而且在解决会话任务时比GPT-3更准确——对于低成本/高质量的人工智能产品来说,这是一个完美的商业案例。

那么,对于生成式人工智能来说,规模越大越好吗?其答案是,要视情况而定。当人们正在构建一个能够完成许多任务的通用学习模型时,其答案是肯定的,其规模越大越好,GPT-3比GPT-2和其他前辈的优势证明了这一点。但是,当人们想要很好地完成一项特定的任务时,就像ChatGPT中的聊天机器人一样,那么与模型和数据大小相比,数据焦点和适当的训练过程要重要得多。这就是为什么在SoMin公司没有使用ChatGPT来生成文案和横幅的原因,而是利用特定的数字广告相关数据来指导GPT-3为尚未看到的新广告制作更好的内容。

那么,有人可能会问,生成式人工智能的未来将如何发展?多模态将是人们在即将到来的GPT-4中看到的不可避免的进步之一,正如OpenAI公司首席执行官Sam Altman在他的演讲中提到的那样。与此同时,Altman还打破了该模型拥有100万亿个参数的传言。因此,人们都知道,这种人工智能模型越大并不总是代表着越好。

有关ChatGPT vs. GPT-3 vs. GPT-4只是聊天机器人家族的内部斗争的更多相关文章

  1. ruby-on-rails - Railstutorial : db:populate vs. 工厂女孩 - 2

    在railstutorial中,作者为什么选择使用这个(代码list10.25):http://ruby.railstutorial.org/chapters/updating-showing-and-deleting-usersnamespace:dbdodesc"Filldatabasewithsampledata"task:populate=>:environmentdoRake::Task['db:reset'].invokeUser.create!(:name=>"ExampleUser",:email=>"example@railstutorial.org",:passwo

  2. ruby-on-rails - Cucumber 是否只是 rspec 的包装器以帮助将测试组织成功能? - 2

    只是想确保我理解了事情。据我目前收集到的信息,Cucumber只是一个“包装器”,或者是一种通过将事物分类为功能和步骤来组织测试的好方法,其中实际的单元测试处于步骤阶段。它允许您根据事物的工作方式组织您的测试。对吗? 最佳答案 有点。它是一种组织测试的方式,但不仅如此。它的行为就像最初的Rails集成测试一样,但更易于使用。这里最大的好处是您的session在整个Scenario中保持透明。关于Cucumber的另一件事是您(应该)从使用您的代码的浏览器或客户端的角度进行测试。如果您愿意,您可以使用步骤来构建对象和设置状态,但通常您

  3. arrays - Ruby 数组 += vs 推送 - 2

    我有一个数组数组,想将元素附加到子数组。+=做我想做的,但我想了解为什么push不做。我期望的行为(并与+=一起工作):b=Array.new(3,[])b[0]+=["apple"]b[1]+=["orange"]b[2]+=["frog"]b=>[["苹果"],["橙子"],["Frog"]]通过推送,我将推送的元素附加到每个子数组(为什么?):a=Array.new(3,[])a[0].push("apple")a[1].push("orange")a[2].push("frog")a=>[[“苹果”、“橙子”、“Frog”]、[“苹果”、“橙子”、“Frog”]、[“苹果”、“

  4. ruby - 是否可以从也在该模块中的类内部调用模块函数 - 2

    在这段Ruby代码中:ModuleMClassC当我尝试运行时出现“'M:Module'的未定义方法'helper'”错误c=M::C.new("world")c.work但直接从另一个类调用M::helper("world")工作正常。类不能调用在定义它们的同一模块中定义的模块函数吗?除了将类移出模块外,还有其他解决方法吗? 最佳答案 为了调用M::helper,你需要将它定义为defself.helper;结束为了进行比较,请查看以下修改后的代码段中的helper和helper2moduleMclassC

  5. Ruby#index 方法 VS 二进制搜索 - 2

    给定一个元素和一个数组,Ruby#index方法返回元素在数组中的位置。我使用二进制搜索实现了我自己的索引方法,期望我的方法会优于内置方法。令我惊讶的是,内置的在实验中的运行速度大约是我的三倍。有Rubyist知道原因吗? 最佳答案 内置#indexisnotabinarysearch,这只是一个简单的迭代搜索。但是,它是用C而不是Ruby实现的,因此自然可以快几个数量级。 关于Ruby#index方法VS二进制搜索,我们在StackOverflow上找到一个类似的问题:

  6. ruby - 无法安装 gem - make 未被识别为内部或外部命令可运行程序或批处理文件 - 2

    我想在Windows7上安装带有ruby​​1.9.3的rspec-railsgem。我收到一些错误消息,提示无法安装某些json库。所以,我使用下面的说明来解决它。来源=The'json'nativegemrequiresinstalledbuildtools从[rubyinstaller.org][3]下载[Ruby1.9.3][2]从[rubyinstaller.org][3]下载DevKit文件对于Ruby1.9.3,使用[DevKit-tdm-32-4.5.2-20110712-1620-sfx.exe][4]将DevKit解压到路径C:\Ruby193\DevKit运行cd

  7. ruby - 如何在 Ruby 中实现私有(private)内部类 - 2

    来自Java,我正在尝试在Ruby中实现LinkedList。我在Java中实现它的通常方法是有一个名为LinkedList的类和一个名为Node的私有(private)内部类,其中LinkedList的每个对象都作为Node对象。classLinkedListprivateclassNodeattr_accessor:val,:nextendend我不想将Node类暴露给外部世界。然而,通过Ruby中的这个设置,我可以使用这个访问LinkedList类之外的私有(private)Node类对象-node=LinkedList::Node.new我知道,在Ruby1.9中,我们可以使用

  8. ruby-on-rails - lovdbyless VS 社区引擎……哪个最好? - 2

    随着ruby​​被引入为新的编程救世主,我想知道是否有人基于易用性、运行所需的资源、可用性和易定制性而有偏好。两者有更好的吗? 最佳答案 好吧,任何基于Rails的社交网络应用程序的比较都应该包括insoshi(http://portal.insoshi.com/)。话虽这么说,这三个都非常相似,区别在于实现细节。Lovd和Insoshi都是完整的Rails应用程序;它旨在供您将它们用作入门工具包,并使用您自己的自定义功能对其进行扩展。另一方面,CommunityEngine是一个Rails插件。这意味着您可以更轻松地向现有Rail

  9. (附源码)vue3.0+.NET6实现聊天室(实时聊天SignalR) - 2

    参考文章搭建文章gitte源码在线体验可以注册两个号来测试演示图:一.整体介绍  介绍SignalR一种通讯模型Hub(中心模型,或者叫集线器模型),调用这个模型写好的方法,去发送消息。  内容有:    ①:Hub模型的方法介绍    ②:服务器端代码介绍    ③:前端vue3安装并调用后端方法    ④:聊天室样例整体流程:1、进入网站->调用连接SignalR的方法2、与好友发送消息->调用SignalR的自定义方法 前端通过,signalR内置方法.invoke()  去请求接口3、监听接受方法(渲染消息)通过new signalR.HubConnectionBuilder().on

  10. 智能客服 | 浅谈人工智能聊天机器人ChatGPT - 2

    2022年底,OpenAI的预训练模型ChatGPT给人工智能领域的爱好者和研究人员留下了深刻的印象和启发,他展现的惊人能力将人工智能的研究和应用热度推向高潮,网上也充斥着和ChatGPT的各种聊天,他可以作诗、写小说、写代码、讨论疫情问题等。下面就是一些他的神回复:人命关天的坑: 写歌,留给词作者的机会不多了。。。 回答人类怎么样面对人工智能: 什么是ChatGPT?借用网上的一段介绍,ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动

随机推荐