2022年11月30日,OpenAI公司(美国致力于人工智能研究的非营利机构)发布了由大型语言模型驱动的自然语言处理工具ChatGPT。该工具通过学习和理解人类语言,能够与用户进行高质量对话,甚至还能撰写邮件、视频脚本、文案、代码、论文和小说等。由于在同行中具有较卓越的性能,ChatGPT推出仅2个多月的时间即引爆全球。除了关注ChatGPT性能本身外,业内人士更关注该AI“梦之队”成员到底具有哪些特征,才促使他们在全球大型语言模型创新技术领域如此独领风骚。
根据OpenAI官网显示,为ChatGPT项目做出贡献的人员共87人。现就该团队成员职务构成、年龄分布、教育背景、人员流动、华人成员、成员贡献、性别分布等数据进行统计分析,并总结归纳其特征。
ChatGPT团队规模不足百人(共87人)。分析发现,其显著特征是“年纪很轻”、“背景豪华”、“聚焦技术”、“积累深厚”、“崇尚创业”和“华人抢眼”。
该团队平均年龄为32岁,“90后”是主力军。他们引领的这一波大型语言模型技术风潮,充分说明了那些经常被认为研发经验不足的年轻人,完全有可能在前沿科技领域取得重大突破。
团队成员绝大多数拥有名校学历,且具有全球知名企业工作经历。从成员毕业高校分布看,校友最多的前5大高校是斯坦福大学(14人)、加州大学伯克利分校(10人)、麻省理工学院(7人)、剑桥大学(5人)、哈佛大学(4人)和佐治亚理工学院(4人)。另外,该团队有3人是我国清华大学校友,即翁家翌、赵盛佳、袁启明,他们本科均在清华大学就读,目前均在团队担任研发工程师一职。ChatGPT不一味强调高学历,其成员并非“清一色”的研究生学历,而是本、硕、博人数相对均衡。
团队成员有10人从谷歌跳槽加入,其他成员也大多来自Facebook、Stripe、Uber、Quora、NVIDIA、Microsoft、Dropbox、DeepMind、Apple、Intel等顶尖或知名科技公司。另外,该团队有5人被评为2023年度“AI 2000 全球人工智能学者(全名单链接:https://www.aminer.cn/ai2000)”,其中2人为OpenAI联合创始人,2人分别被评为全球机器人和机器学习领域最具影响力学者。可见,技术型顶尖学者对创新型团队的引领作用至关重要。
从成员职位构成看,该团队成员近9成为技术人员,未配备技术与产品之外的职能人员(如公共关系、市场营销等人员),而是高度聚焦于技术研发。由此可见,在数字化传播时代,一款人工智能产品只要性能足够优异,即使未配置专人做推广营销,也能在短短的一两个月时间内在全球引爆。
ChatGPT是OpenAI在大型语言模型领域多年技术积累的结果。统计发现,在与ChatGPT相关的先前7大技术项目研发中,ChatGPT团队成员参与人数最多的是CodeX项目,共有22人参与过,占总团队人员总数的25%;其次是webGPT和instructGPT,共有9人参与过;第三是GPT3,共有6人参与过;第四是RLHF,共有3人参与过。由此可见,ChatGPT团队成员在生成式预训练语言模型领域有较深厚的技术积累,特别是1/4团队成员曾参与过同样基于GPT3的CodeX项目的研发经验,对后续成功研发ChatGPT打下了坚实的基础。

图 ChatGPT团队参与先前7大技术研发人数
分析发现,该团队成员不再把进入“大厂”作为首选,而是更倾向于选择更加创新潜力的创业机构。团队成员大多是从“大厂”跳槽,以及作为应届生加入,其次就是从相对“稳定”的科研机构和高校教职岗位离职后加入。即使从ChatGPT团队离职的4位成员,也仍然选择加入创业公司或机构。

图 ChatGPT团队成员流动示意图
ChatGPT团队中的华人表现抢眼。团队共有华人9人,占团队总人数10%。其中5人本科就读于中国内陆高校,3人大学教育经历均在美国高校完成。梳理毕业于中国内陆高校的ChatGPT华人成员成长路径发现,他们就读于中国内陆顶尖高校的学习阶段均为本科,之后赴美深造,获得硕士或博士学位,然后加入美国诸如Dropbox、OpenAI等创新型公司。
表 ChatGPT团队中的华人成员

华人学者欧阳龙参与了与ChatGPT相关的7大技术项目中的4大项目的研发,他是InstructGPT论文的第一作者,是RLHF论文的第二作者,可见他是这两个关键技术项目的核心人员。
根据以上分析所获相关启示,就国内人工智能前沿技术发展提出以下建议:
(一)注重科技兴趣和信仰培育,鼓励优秀年轻人投身于前沿技术创新浪潮
OpenAI是一家非营利的人工智能研究机构,其ChatGPT团队的显著特征是“年轻”和“优质”。一个平均年龄仅32岁的87人团队,就能够引爆全球新一轮人工智能技术浪潮,其背后是团队成员对人工智能技术的兴趣和信仰,以及对技术创新和研发的全心投入。国内不缺乏如OpenAI一样的年轻优秀人才,若能更加注重对其科技兴趣和信仰培育,鼓励其心无旁骛地投身于前沿技术创新,我们就能在全球科技竞争中处于不败之地。
(二)“大厂”前沿科技创新疲态显现,鼓励年轻人将目光投向创业公司
本次OpenAI不足百人的团队推出的大型语言模型ChatGPT,让谷歌、Meta包括国内的阿里、百度等“大厂”感到压力巨大,它们只好纷纷跟风上马类似项目。“大厂”因其创新机制、组织文化等相对固定,因而在本次大语音模型创新浪潮中疲态尽显。今后,正如ChatGPT一样,更多的突破性创新技术会来自创业公司。因此,鼓励国内有志投身前沿科技创业的年轻人,把目光投向更具创新潜力的创业公司。
(三)海外华人学者是全球科技创新的重要力量,鼓励加强对外学术交流
在全球人工智能前沿领域,华人学者是一支重要的科技创新力量。海外华人学者是中外学术交流的重要桥梁。本轮以ChatGPT为代表的基于大型语言模型的AIGC技术发展速度,令国内某些业界人士感到“惊讶”。对外学术交流的重要性在于,能够比较实时、准确感知和把握全球前沿技术发展的脉搏和趋势。在全球疫情走向尾声之际,鼓励国外顶尖学者走进来,国内学者走出去,对促进国内前沿科技创新发展具有重要意义
导读语言模型给我们的生产生活带来了极大便利,但同时不少人也利用他们从事作弊工作。如何规避这些难辨真伪的文字所产生的负面影响也成为一大难题。在3月9日智源Live第33期活动「DetectGPT:判断文本是否为机器生成的工具」中,主讲人Eric为我们讲解了DetectGPT工作背后的思路——一种基于概率曲率检测的用于检测模型生成文本的工具,它可以帮助我们更好地分辨文章的来源和可信度,对保护信息真实、防止欺诈等方面具有重要意义。本次报告主要围绕其功能,实现和效果等展开。(文末点击“阅读原文”,查看活动回放。)Ericmitchell斯坦福大学计算机系四年级博士生,由ChelseaFinn和Chri
英文版英文链接关注公众号在“亚特兰蒂斯的回声”中踏上一段难忘的冒险之旅,深入未知的海洋深处。足智多谋的考古学家AriaSeaborne偶然发现了一件古代神器,揭示了一张通往失落之城亚特兰蒂斯的隐藏地图。在她神秘的导师内森·兰登教授的指导和勇敢的冒险家亚历克斯·默瑟的帮助下,阿丽亚开始了一段危险的旅程,以揭开这座传说中城市的真相。他们的冒险之旅带领他们穿越险恶的大海、神秘的岛屿和充满陷阱和谜语的致命迷宫。随着Aria潜在的魔法能力的觉醒,她被睿智勇敢的QueenNeria的幻象所指引,她让她为即将到来的挑战做好准备。三人组揭开亚特兰蒂斯令人惊叹的隐藏文明,并了解到邪恶的巫师马拉卡勋爵试图利用其古
我最近与一位同事讨论了以下Ruby语法:value=ifa==0"foo"elsifa>42"bar"else"fizz"end我个人并没有看到太多这种逻辑,但我的同事指出,这实际上是一种相当普遍的Rubyism。我试着用谷歌搜索这个主题,但没有找到任何文章、页面或SO问题来讨论它,这让我相信这可能是一种非常实际的技术。然而,另一位同事发现语法令人困惑,而是将上面的逻辑写成这样:ifa==0value="foo"elsifa>42value="bar"elsevalue="fizz"end缺点是value=的重复声明和隐式elsenil的丢失,如果我们想使用它的话。这也感觉它与Ruby
2022年底,OpenAI的预训练模型ChatGPT给人工智能领域的爱好者和研究人员留下了深刻的印象和启发,他展现的惊人能力将人工智能的研究和应用热度推向高潮,网上也充斥着和ChatGPT的各种聊天,他可以作诗、写小说、写代码、讨论疫情问题等。下面就是一些他的神回复:人命关天的坑: 写歌,留给词作者的机会不多了。。。 回答人类怎么样面对人工智能: 什么是ChatGPT?借用网上的一段介绍,ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动
目录ChatGPT简介技术原理应用未来发展ChatGPT的10 种用法ChatGPT简介ChatGPT是一种基于深度学习的大型语言模型,由OpenAI公司开发。技术原理GPT是GenerativePre-trainedTransformer的缩写,意为生成式预训练变压器。它的技术原理是使用了一个基于注意力机制的变压器(Trans
在尝试构建Rubygem(使用Bundler)时,我倾向于使用Bundler提供的REPL测试代码——可通过bundleconsole访问。有什么方法可以重新加载整个项目吗?我最终再次加载单个(更改的)文件以测试新更改。 最佳答案 以下hack适用于我的一个相对简单的gem和Ruby2.2.2。我很想看看它是否适合你。它做出以下假设:您具有传统的文件夹结构:一个名为lib/my_gem_name.rb的文件和一个文件夹lib/my_gem_name/,其中包含任何文件/文件夹结构。您要重新加载的所有类都嵌套在您的顶级模块MyGemN
这个问题在这里已经有了答案:Nokogiri:SelectcontentbetweenelementAandB(3个答案)关闭2年前。我正在从url中抓取文本的div,并想删除具有backtotop类的段落下方的所有内容。我在stackoverflow上看到了一段遍历代码片段,看起来很有希望,但我不知道如何将它合并,所以@el只包含第一个p.backtotop之前的所有内容分区我的代码:@doc=Nokogiri::HTML(open(url))@el=@doc.css("div")[0]end遍历片段:doc=Nokogiri::HTML(code)stop_node=doc.css
今天我遇到了下面的正则表达式,想知道Ruby会用它做什么:>"#a"=~/^[\W].*+$/=>0>"1a"=~/^[\W].*+$/=>nil在这种情况下,Ruby似乎忽略了+字符。如果这是不正确的,我不确定它在做什么。我猜它没有被解释为量词,因为*没有转义并且被用作量词。在Perl/Ruby正则表达式中,有时当一个字符(例如,-)在不能被解释为特殊字符的上下文中使用时,它会被视为文字。但如果在这种情况下发生这种情况,我希望第一个匹配失败,因为左值字符串中没有+。这是对+字符的巧妙正确使用吗?以上行为是错误吗?我是否遗漏了一些明显的东西? 最佳答案
♥️作者:白日参商🤵♂️个人主页:白日参商主页♥️坚持分析平时学习到的项目以及学习到的软件开发知识,和大家一起努力呀!!!🎈🎈加油!加油!加油!加油🎈欢迎评论💬点赞👍🏻收藏📂加关注+!「想体验ChatGPT中文聊天?」那快进来,你用不上算我输项目场景:项目条件一、那就开始吧1、安装ChatGPT-Desktop2、OpenAPI设置二、使用实例恭喜你!!!配置成功了!!!API和URL都是博主免费提供给大家的!!!恭喜你!!!配置成功了!!!API和URL都是博主免费提供给大家的!!!🎈🎈加油!加油!加油!加油🎈欢迎评论💬点赞👍🏻收藏📂加关注+!项目场景:近几个月可以说ChatGPT是火得一
ChatGPT掀起了AI股历史上最疯狂的一轮市值狂飙。自春节后至今,ChatGPT概念股开始了暴走模式,短短半月时间,海天瑞声、开普云等ChatGPT概念股市值累计增加了近1400亿。如此的爆炸效应,得益于ChatGPT所展现出商业化落地的巨大潜力。要知道,在此之前,无论是十年AI投入超千亿的百度,还是困在硬件化里的AI四小龙,都在重复着AI商业化难落地的故事。ChatGPT的出现,让AI从生产力的赋能者直接成为一种创造生产力的工具。随着订阅模式的推出,ChatGPT已经成为第一个以AI技术为核心直接变现的消费者应用。本文持有以下核心观点:1、ChatGPT是AI技术迭代的受益者。过去受限技术