草庐IT

Yann LeCun:不在乎社会规范,ChatGPT离真正的人还差得远

机器学习 2023-03-28 原文
2022年底OpenAI推出ChatGPT,其爆火程度一直持续到今天,这个模型简直就是行走的流量,所到之处必将引起一番讨论狂潮。

各大科技公司、机构、甚至是个人,纷纷加紧研发类ChatGPT产品。与此同时,微软将ChatGPT接入必应,几乎前后脚,谷歌发布Bard为搜索引擎提供动力。英伟达 CEO 黄仁勋对ChatGPT给与了一个很高的评价,他表示,ChatGPT 是人工智能领域的 iPhone 时刻,也是计算领域有史以来最伟大的技术之一。

很多人对对话式AI已经到来深信不疑,但这类模型真的完美无缺吗?不见得,在它们身上总会出现一些荒诞的时刻(uncanny moments),例如随意发表不受约束的言论,或者喋喋不休地说出接管世界的计划等。

为了理解对话式AI这些荒诞时刻,由深度学习三巨头之一的Yann LeCun以及纽约大学计算机科学系博士后Jacob Browning等人联合撰写了一篇文章《AI Chatbots Don’t Care About Your Social Norms》,文中讨论了对话式AI的三个方面:聊天机器人、社会规范和人类期望。

文中谈到,人类非常善于避免口误,不让自己做出失误和失礼的言行。相比之下,聊天机器人却经常犯错。因此理解为什么人类擅长避免出错,可以更好的帮助我们理解目前聊天机器人为何不能被信任。

聊天机器人加入人类反馈,不让模型说错话

对于GPT-3来说,犯错的方式包括模型统计不准确。GPT-3比较依赖用户提示,它对语境、情境等的理解只关注从用户的提示中可以得到什么。ChatGPT也是如此,不过后者以一种新颖而有趣的方式稍作修改。除了统计学外,模型的反应也被人类评估员强化了。对于系统的输出,人类评估员会进行强化,使其输出好的反应。最终结果是,这个系统不仅会说一些貌似合理的东西,而且(理想情况下)还会说一些人类会判断为合适的东西——即便是模型说错了话,至少不会冒犯别人。

但这种方法给人的感觉太机械性。在人类对话中,有无数种方法可以说错话:我们可以说一些不恰当的、不诚实的、令人困惑的或者只是愚蠢的事情。我们甚至在说正确的事情时,由于说的语气或语调不对而受到指责。我们在与他人打交道的过程中,会穿越无数的「对话雷区」。控制自己不说错话不仅仅是对话的一个重要部分,它往往比对话本身更重要。有时,闭上嘴巴可能是唯一正确的行动方案。

这就引出两个问题:我们该如何驾驭模型这种不说错话的危险局面?以及为什么聊天机器人不能有效地控制自己不说错话?

对话该如何进行?

人类对话可以涉及任意话题,就像脚本化了一样:餐馆点餐,闲聊,为迟到道歉等等。不过这些不是文字脚本,中间充满了即兴创作,所以人类的这种对话模型才是更一般的模式,规则没有那么严格。

人类这种脚本化的言行不受文字制约。即使你不懂语言,同样的脚本也能发挥作用,比如打一个手势就知道对方想要什么。社会规范支配着这些脚本,帮助我们驾驭生活。这些规范规定了每个人在某些情况下的行为方式,为每个人分配了角色,并对如何行动给予了广泛的指导。遵循规范是有用的:它通过标准化和流程化来简化我们的交互,使彼此能更容易预测对方意图。

人类已经制定了惯例和规范来管理我们社会生活的每个方面,从使用什么叉子到在按喇叭之前应该等待多长时间。这对于在数十亿人的世界中生存至关重要,在这个世界上,我们遇到的大多数人都是完全陌生的人,他们的信仰可能与我们不一致。将这些共同的规范落实到位不仅可以使对话成为可能,而且会富有成果,列出我们应该谈论的内容——以及我们不应该谈论的所有事情。

规范的另一面

人类倾向于制裁那些违反规范的人,有时会公开,有时会秘密进行。社会规范使得评估一个陌生人变得非常简单,例如,在第一次约会时,通过对话以及提问等方式,双方会评估对方的行为,如果对方违反了其中一条规范——例如,如果他们表现得粗鲁或不恰当——我们通常会评判他们并拒绝第二次约会。

对人类来说,这些评判不仅是基于冷静的分析,更进一步的是基于我们对世界的情感反应。我们小时候接受的部分教育是情绪训练,以确保我们在对话中在正确的时间给出正确的情绪:当有人违反礼仪规范时感到愤怒,当有人说出冒犯性的话时感到厌恶,当我们说谎时感到羞耻。我们的道德良知使我们能够在对话中对任何不恰当的事情做出快速反应,并预测其他人将如何对我们的言论做出反应。

但不仅如此,一个违反了简单规范的人,他的整个性格都会遭到质疑。如果他在一件事情上撒了谎,那么会不会在其他事情上撒谎呢?因此,公开是为了让对方感到羞耻,并在此过程中迫使对方为自己的行为道歉(或至少为自身行为辩护)。规范也得到了加强。

简而言之,人类应该严格遵守社会规范,否则说出的话有很高的风险。我们要为自己所说的任何事情负责,所以要谨慎地选择说话,并希望周围的人也是如此。

不受约束的聊天机器人

人类对话的高风险揭示了什么让聊天机器人如此令人不安。通过仅仅预测对话如何进行,它们最终松散地遵守人类的规范,但它们不受这些规范的约束。当我们与聊天机器人随意交谈或测试它们解决语言难题的能力时,它们通常会给出一些似是而非的答案,并表现得像人类一样正常。有人甚至可能会将聊天机器人误认为是人。

但是,如果我们稍微更改prompt或者使用不同的脚本,聊天机器人会突然吐出阴谋论、种族主义长篇大论或胡说八道。这可能是因为它们接受了阴谋论者、喷子等在 Reddit和其他平台写的内容的训练。

我们中的任何人都有可能说出像喷子一样的话,但我们不应该说,因为喷子的话充斥着胡说八道、冒犯性言论、残忍和不诚实。我们中的大多数人不说这些话,也是因为自己不相信它们。体面的规范已经将冒犯性行为推向了社会边缘,所以我们中的大多数人也不敢这样的话。

相比之下,聊天机器人不会意识到有些话是它们不应该说的,无论这些话在统计学上的可能性有多大。它们意识不到定义了该说和不该说之间界限的社会规范,也察觉不到影响我们使用语言的深层社会压力。即使聊天机器人承认搞砸并道歉了,它们也不明白为什么。如果我们指出它们错了,聊天机器人甚至会道歉以得到正确的答案。

这阐明了更深层次的问题:我们希望人类说话者能够忠实于他们所说的话,并且要求他们对此负责。我们不需要检查他们的大脑或了解任何心理学来做到这一点,只需要知道他们一贯可靠、遵守规范和行为上尊重他人,则会相信他们。聊天机器人的问题不在于「黑盒子」或技术不熟悉,而是因为长期以来不可靠和令人反感,并且没有努力改进甚至没有意识到存在问题。

开发人员当然知道这些问题。他们以及希望自身AI技术被广泛应用的公司担心自己的聊天机器人的声誉,并花大量时间重组系统以避免对话困难或消除不当回答。虽然这有助于使聊天机器人更安全,但开发人员需要竭力走到试图破坏它们的人的前面。因此,开发人员的方法是被动的,并且总是落后:有太多的错误方式无法预测到。

聪明但不人性化

这不应该让我们自鸣得意人类有多聪明,聊天机器人有多笨。相反,它们无所不谈的能力展现出了对人类社会生活和整个世界的深刻(或肤浅)的了解。聊天机器人非常聪明,至少能在测试中取得好成绩或提供有用的信息参考。聊天机器人在教育工作者中引起的恐慌足以说明它们在书本知识学习上令人印象深刻。

但问题在于聊天机器人不在乎(care)。它们没有任何想要通过对话实现的内在目标,也不受他人想法或反应的激励。它们不会因说谎感到难过,它们的诚实也不会得到回报。它们在某种程度是无耻的,甚至川普都非常关心自己的声誉,至少声称自己是诚实的。

因此,聊天机器人的对话是无意义的。对于人类来说,对话是获得我们想要的东西的一种方式,比如建立联系、在项目上获得帮助、打发时间或者了解一些东西。对话要求我们对对话的人感兴趣,理想情况下应该要关心对方。

即使我们不关心对话的人,至少在乎对方对自己的看法。我们深深地认识到,生活中的成功(比如拥有亲密关系、做好工作等)取决于拥有好的声誉。如果我们的社会地位下降,就可能失去一切。对话塑造了他人对我们的看法,并且很多人通过内心独白来塑造对自己的认知。

但是聊天机器人没有自己的故事可以讲述,也没有声誉可以捍卫,它们不像我们一样能感受到负责任行动的吸引力。聊天机器人可以并且在很多高度脚本化的情况下发挥作用,从玩地下城主、撰写合理的副本或者帮助作者探索思路,等等。不过它们缺乏对自己或他人的了解,无法成为值得信赖的社会代理人,即我们大多数时候希望与之交谈的那类人。

如果不了解有关诚实和体面的规范,也不关心自己的声誉,那么聊天机器人的用处就会受限,依赖它们也会带来真正的危险。

怪诞的对话

因此,聊天机器人并不是以人类的方式对话,并且它们永远不可能仅通过统计学上似乎可信的谈话达到目的。如果缺少对社会世界的真正了解,这些AI系统就只是无聊的话痨罢了,无论表现得多么机智或雄辩。

这有助于阐明为什么这些AI系统只是非常有趣的工具以及为什么人类不应该将它们拟人化。人类不仅仅是冷静的思考者或演说者,在本质上还是遵守规范的生物,通过共同的、强制性的期望在情感上相互建立联系。人类的思维和言语源于自身的社会性。

单纯的对话脱离了广泛的世界参与,与人类没有什么共同之处。聊天机器人不是像我们一样使用语言,即使它们有时说的与我们完全相同。可归根到底,它们不懂我们为什么这样说话,这是显而易见的。

有关Yann LeCun:不在乎社会规范,ChatGPT离真正的人还差得远的更多相关文章

  1. ruby-on-rails - form_for 中不在模型中的自定义字段 - 2

    我想向我的Controller传递一个参数,它是一个简单的复选框,但我不知道如何在模型的form_for中引入它,这是我的观点:{:id=>'go_finance'}do|f|%>Transferirde:para:Entrada:"input",:placeholder=>"Quantofoiganho?"%>Saída:"output",:placeholder=>"Quantofoigasto?"%>Nota:我想做一个额外的复选框,但我该怎么做,模型中没有一个对象,而是一个要检查的对象,以便在Controller中创建一个ifelse,如果没有检查,请帮助我,非常感谢,谢谢

  2. ruby - 当使用::指定模块时,为什么 Ruby 不在更高范围内查找类? - 2

    我刚刚被困在这个问题上一段时间了。以这个基地为例:moduleTopclassTestendmoduleFooendend稍后,我可以通过这样做在Foo中定义扩展Test的类:moduleTopmoduleFooclassSomeTest但是,如果我尝试通过使用::指定模块来最小化缩进:moduleTop::FooclassFailure这失败了:NameError:uninitializedconstantTop::Foo::Test这是一个错误,还是仅仅是Ruby解析变量名的方式的逻辑结果? 最佳答案 Isthisabug,or

  3. 亚特兰蒂斯的回声(中文版): chatGPT 的杰作 - 2

    英文版英文链接关注公众号在“亚特兰蒂斯的回声”中踏上一段难忘的冒险之旅,深入未知的海洋深处。足智多谋的考古学家AriaSeaborne偶然发现了一件古代神器,揭示了一张通往失落之城亚特兰蒂斯的隐藏地图。在她神秘的导师内森·兰登教授的指导和勇敢的冒险家亚历克斯·默瑟的帮助下,阿丽亚开始了一段危险的旅程,以揭开这座传说中城市的真相。他们的冒险之旅带领他们穿越险恶的大海、神秘的岛屿和充满陷阱和谜语的致命迷宫。随着Aria潜在的魔法能力的觉醒,她被睿智勇敢的QueenNeria的幻象所指引,她让她为即将到来的挑战做好准备。三人组揭开亚特兰蒂斯令人惊叹的隐藏文明,并了解到邪恶的巫师马拉卡勋爵试图利用其古

  4. 智能客服 | 浅谈人工智能聊天机器人ChatGPT - 2

    2022年底,OpenAI的预训练模型ChatGPT给人工智能领域的爱好者和研究人员留下了深刻的印象和启发,他展现的惊人能力将人工智能的研究和应用热度推向高潮,网上也充斥着和ChatGPT的各种聊天,他可以作诗、写小说、写代码、讨论疫情问题等。下面就是一些他的神回复:人命关天的坑: 写歌,留给词作者的机会不多了。。。 回答人类怎么样面对人工智能: 什么是ChatGPT?借用网上的一段介绍,ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动

  5. 【ChatGPT】ChatGPT 的 N 种用法 - 2

    目录ChatGPT简介技术原理应用未来发展ChatGPT的10 种用法ChatGPT简介ChatGPT是一种基于深度学习的大型语言模型,由OpenAI公司开发。技术原理GPT是GenerativePre-trainedTransformer的缩写,意为生成式预训练变压器。它的技术原理是使用了一个基于注意力机制的变压器(Trans

  6. ruby-on-rails - 语言环境不在 Rails 4 中切换 - 2

    我的Rails应用程序在rails4.0.2上,我在使用locale变量和params[:locale]切换翻译时遇到问题官方railsguide.我在mysite有一个单页网站.我的国际化路线:scope"(:locale)",locale:/en|de/do#myrouteshereend我的应用程序Controllerbefore_filter:set_localedefset_localeI18n.locale=params[:locale]||I18n.default_locale#Rails.application.routes.default_url_options[:l

  7. ruby-on-rails - Phusion Passenger 不在 Apache 上工作 - 2

    更新:当输入“passenger-memory-stats”时,我显示:---Passengerprocesses---Processes:0我该如何解决这个问题?为什么即使我在httpd.conf中添加它并重新启动apache,passenger也不会启动?我无法让PhusionPassenger在服务器上运行RubyonRails。我已经按照Phusion网站上的所有说明安装了passenger并修改并创建了ApacheVirtualHost以指向新目录并验证所有.conf文件都已成功加载。还加载了httpd-Mpassenger_module。我还在本地主机上成功运行了Passe

  8. ruby-on-rails - `allow_any_instance_of` 模拟不在范围内工作 - 2

    我的mock只有在如下所示的beforeblock中时才有效。这只是我对我的问题的快速而肮脏的表述。从字面上看,当我将行从beforeblock移动到doesnotquack断言时,它停止模拟:(describe'Ducks',type::featuredobeforedo...allow_any_instance_of(Duck).toreceive(:quack).and_return('bark!')visitanimal_farm_pathendcontext'isanoddduck'it'doesnotquack'doexpect(Duck.new.quack).toeq('

  9. 「想体验ChatGPT中文聊天?」那快进来,你用不上算我输 - 2

    ♥️作者:白日参商🤵‍♂️个人主页:白日参商主页♥️坚持分析平时学习到的项目以及学习到的软件开发知识,和大家一起努力呀!!!🎈🎈加油!加油!加油!加油🎈欢迎评论💬点赞👍🏻收藏📂加关注+!「想体验ChatGPT中文聊天?」那快进来,你用不上算我输项目场景:项目条件一、那就开始吧1、安装ChatGPT-Desktop2、OpenAPI设置二、使用实例恭喜你!!!配置成功了!!!API和URL都是博主免费提供给大家的!!!恭喜你!!!配置成功了!!!API和URL都是博主免费提供给大家的!!!🎈🎈加油!加油!加油!加油🎈欢迎评论💬点赞👍🏻收藏📂加关注+!项目场景:近几个月可以说ChatGPT是火得一

  10. 半个月狂飙1000亿,ChatGPT概念股凭什么? - 2

    ChatGPT掀起了AI股历史上最疯狂的一轮市值狂飙。自春节后至今,ChatGPT概念股开始了暴走模式,短短半月时间,海天瑞声、开普云等ChatGPT概念股市值累计增加了近1400亿。如此的爆炸效应,得益于ChatGPT所展现出商业化落地的巨大潜力。要知道,在此之前,无论是十年AI投入超千亿的百度,还是困在硬件化里的AI四小龙,都在重复着AI商业化难落地的故事。ChatGPT的出现,让AI从生产力的赋能者直接成为一种创造生产力的工具。随着订阅模式的推出,ChatGPT已经成为第一个以AI技术为核心直接变现的消费者应用。本文持有以下核心观点:1、ChatGPT是AI技术迭代的受益者。过去受限技术

随机推荐