草庐IT

ChatGPT核心技术奠基者,在中国开放平台

资讯的视界 2023-12-22 原文

ChatGPT 横空出世,在全球科技圈掀起一场巨浪,随之而来的是无数蜂拥而至的“掘金者”。

而在全球为 ChatGPT“狂飙”的背后,是单样本学习 NLP 技术在质疑声中,超过 7 年的技术深耕。

一条饱受争议的创新之路

早在 2015 年,机器和语言的关系还相当陌生,相比于数字、声音、图片等其他数据类型,语言是计算机最不擅长理解的数据,它们的关系完全没有今天这般火热。计算机对语言的理解极度局限于非常狭窄的问题空间(如情感分析,语法分解等)。每一个具体的问题都需要大量的数据标注(俗称监督学习),以谷歌,Facebook 为代表的大量科技公司投身于大数据解决方案的行列。也造就了一批类似于Scale.ai的数据标注平台成为独角兽。

然而硅谷有一家公司,选择了完全相反的技术方向,他们相信计算机对语言理解的终极算法,应该是建立更高维度的语义代表(semantic representation),通过训练拥有高维度语义理解的神经网络模型,再通过零样本或单样本数据向低维空间投影以解决人类理解内的各类问题,达到触类旁通的效果。这家公司,就是Brain.ai。

2016 年,Brain 推出了美国工业界首个单样本学习的自然语言处理模型和世界上第一个可以执行多 App、多步任务的人工智能应用。并在业界和学术会议大量推广 SRL 技术和以它为代表的单样本学习方向。同年,Brain得到了乔布斯家族的投资,成为了乔布斯家族唯一投资的科技公司。

“简单地讲,监督学习类似于婴儿的学习方法(没有先验经验)而单样本学习类似于成人学习的过程(拥有先验经验)。”Jerry 给我们解释道 “婴儿在学习的过程中需要大量的标注数据,比如妈妈需要给孩子重复非常多遍‘这是一个门’,婴儿才可以学会这个词和它所对应的含义。而当一个成年人听到‘门没关’时,‘门’这个字则是对应到一个抽象的对应着之前见过的每一扇门的概念。这也就是为什么成人可以通过几句话和极少的数据得到快速的学习,甚至认知提升。我们在业界推出的拥有触类旁通能力的单样本学习 NLP,就是通过阅读几乎全人类数据并建立语义代表的方式让大模型获得先验经验的。”

早在 2016 年,Jerry 就在用同样他认为最简单的方式解释他们的技术方向,但在和很多机构投资人沟通的过程中,Jerry 在技术方向上得到了非常多的质疑声,VC 们问过最多的问题就是:“如果单样本学习是自然语言处理 NLP 正确的方向,为什么谷歌每年将数十亿美金投入在完全相反的科研方向?”直到2017-19 年的几个重大技术突破,Brain在业界率先在产品中先后使用 BERT 和 Transformer 作为语义代表,以及以单样本学习为基础的 GPT 模型在 2020 年的问世,行业和学界才逐渐转变态度,开始正视这项技术。截止 2022年 3 月,Brain 单样本学习 NLP 模型月访问量破千万,创造的单日收入首次突破 30万美金大关。

简化AI成为通用语言---通用AI赋能每个行业

然而作为 Jerry 在 23 岁创立的第三家公司,Brain 的目标不再是简单地成为 Jerry 创立的又一家独角兽。他相信简单易用的通用 AI 界面是一种每个人都应该享有的权利。它是未来的教育,是人和人类文明的连接,是一种全新的思考语言,也是加速人类进化的最有效的方式。

这个世界很不公平。在未来在以日为单位极速变革时代,未来世界的大部分价值将只被极少数人创造。目前世界上只有 0.33% 的人会写代码,其中不足 5% 的人是机器学习工程师(美国平均年薪 18 万美金)。而这万分之一的机器学习工程师中又只有极少数人深入理解自然语言模型或者单样本学习模型的前沿架构。

在 2019 年 Brain 推出第一代 Multimodal Interface Transformer-1 (多模态界面Transformer-1)之后,Jerry 意识到这个通用模型不仅仅会颠覆每一个行业,而且也许可以彻底改变这种不公平的局面。

因为代码是对机器友好的语言,而界面是对人类友好的语言。而多模态界面 Transformer包含了对二者的深度理解,在该模型通过使用自己的自我迭代和强化学习中,找到了人机交互的终极答案:使用即创造----MIT-2 诞生了。

2022 年,Brain.ai 推出了基于第二代多模态模型 Multimodal Interface Transformer-2 的 AI 交互界面及开发平台 Imagica。在该平台上使用即创造,不需要学习代码,不需要理解如何重训练或fine-tune模型,在你表达想法的同时,相应的界面就会被创造出来,如果界面中存在智慧功能,模型也会通过简单的应用描述自我 fine-tune 到特定的低维空间以支撑界面的智慧部分渲染。创造应用不再受限于结构化的数据和大量的 API 规则,想象即创造。

从此,每个人都可以通过极其简单的交互界面使用和创造任何 AI 为自己所用,甚至在无代码的情况下导出成可供他人使用的应用。至今为止,在内测用户中,已经有大量成功的案例,比如,有大律所的律师将公司法应用场景和专业流程快速导出成一个自我训练的高准确度“过去案例分析 AI”和“案件文档整理 AI”供客户和律所内部使用;也有金融行业基金经理创建的AI 通过分析新闻及股票走势创建仓位建议并自动生成投资界面供散户投资者直接使用;更有老师将课程内容和知识点上传后自动导出成“通用课程讲解 AI”以及“学习文档、学习视频生成 AI”供其学生使用等等。

目前开发者最小年龄为 14 岁,其花费 1 小时建立的游戏人物生成 AI SaaS 应用在两个月内日营业额过万;也有 16 岁的中学生在通过 Imagica 无缝使用 Alphafold 模型生成蛋白质折叠结构预测,使用和最前沿科学家同样的工具进行癌症研究。当 AI 的使用和学习成本降低至几乎为零,每个人都可以最大化发挥他们的潜力。

“我们儿时都会有很多天马行空的想象,希望通过这些想法可以产生对世界的价值,但大多数时候我们会被告知需要做好准备,才可以按部就班地影响世界。Imagica 就是对这个status quo(现状)以及成人世界的反抗,我最感动的事,是发布内测的第二周看到一个从小热爱物理的初中生通过 Imagica 一步步对人类最深层认知和自然科学的简化与剖析,他开始用 Imagica 的为他生成的模型计算多体量子基态波函数。”

“人类的所有财富都来自于从无到有的想象。当AI可以大量降低从一个想法到它产生真实世界价值的成本和阻力,我们也许会逐渐停止用陈旧的教育系统继续扼杀下一代的想象力;当每个人、甚至孩子都能站在人类最前沿的对自然科学、经济和社会的理解之上思考,想象力可以直接影响世界。”当谈到 Imagica 的价值时,Jerry 这样回答。

“我们可能已经忘记,人类也经历过 90% 都是农业生产者的时代,但当机器的出现可以不再需要每个人留在农田里也可以解决全人类温饱的时候,我们就不应该继续教育所有下一代如何种田;以 AI 今天的发展速度,5 年后很非常多行业和甚至最前沿的岗位和研究都会被 AI 取代,创建 Imagica,简化 AI 的使用,是我们对这种趋势的回答。”

在教育方向上,Imagica 已进入硅谷的十余所中小学开始试点,通过简化通用AI的界面,想象即创造会成为下一代人思考的语言。“未来的教育,应该是培养孩子提问的能力;最好的人机共存发展模式,AI根据人类提出的问题和假想,通过模拟实验超越时间的维度,在 10 分钟做 100 年的实验,验证想法的可行与否并用自然语言解释给人类原因。这样我们才可以克服自己的时间瓶颈,让每个人都可以创造正和价值。说起来有点难以想象,但一分钟一个诺贝尔的时代不远了。”

2023 年,Brain.ai 将在全球正式上线 Imagica,可以确认的是,Brain 已计划在中国寻找合作伙伴,开放其开发平台,并招募 100 位希望颠覆行业的高影响力人群,通过 AI 的力量赋能千行百业。

通过 Imagica 创建的测试版应用“Imagine OS”也已于 2 月登陆中国 iOS 商店并开放下载。

「两分钟快到了」

关于自己正在做的事情,Jerry 曾有一个浪漫的描述:

我们就像一群站在很高的楼上亲眼目睹日出的人。因为地球倾角的原因,我们会比地面上的人提前几分钟看到日出。如果你有幸成为那第一批看到日出的人,你可以尝试快速下楼,去告诉地面上的人太阳长什么样子。虽然他们还没有看到,但你给他们证明的最好方式,就是再等两分钟。

有关ChatGPT核心技术奠基者,在中国开放平台的更多相关文章

  1. 亚特兰蒂斯的回声(中文版): chatGPT 的杰作 - 2

    英文版英文链接关注公众号在“亚特兰蒂斯的回声”中踏上一段难忘的冒险之旅,深入未知的海洋深处。足智多谋的考古学家AriaSeaborne偶然发现了一件古代神器,揭示了一张通往失落之城亚特兰蒂斯的隐藏地图。在她神秘的导师内森·兰登教授的指导和勇敢的冒险家亚历克斯·默瑟的帮助下,阿丽亚开始了一段危险的旅程,以揭开这座传说中城市的真相。他们的冒险之旅带领他们穿越险恶的大海、神秘的岛屿和充满陷阱和谜语的致命迷宫。随着Aria潜在的魔法能力的觉醒,她被睿智勇敢的QueenNeria的幻象所指引,她让她为即将到来的挑战做好准备。三人组揭开亚特兰蒂斯令人惊叹的隐藏文明,并了解到邪恶的巫师马拉卡勋爵试图利用其古

  2. Unity 热更新技术 | (三) Lua语言基本介绍及下载安装 - 2

    ?博客主页:https://xiaoy.blog.csdn.net?本文由呆呆敲代码的小Y原创,首发于CSDN??学习专栏推荐:Unity系统学习专栏?游戏制作专栏推荐:游戏制作?Unity实战100例专栏推荐:Unity实战100例教程?欢迎点赞?收藏⭐留言?如有错误敬请指正!?未来很长,值得我们全力奔赴更美好的生活✨------------------❤️分割线❤️-------------------------

  3. MIMO-OFDM无线通信技术及MATLAB实现(1)无线信道:传播和衰落 - 2

     MIMO技术的优缺点优点通过下面三个增益来总体概括:阵列增益。阵列增益是指由于接收机通过对接收信号的相干合并而活得的平均SNR的提高。在发射机不知道信道信息的情况下,MIMO系统可以获得的阵列增益与接收天线数成正比复用增益。在采用空间复用方案的MIMO系统中,可以获得复用增益,即信道容量成倍增加。信道容量的增加与min(Nt,Nr)成正比分集增益。在采用空间分集方案的MIMO系统中,可以获得分集增益,即可靠性性能的改善。分集增益用独立衰落支路数来描述,即分集指数。在使用了空时编码的MIMO系统中,由于接收天线或发射天线之间的间距较远,可认为它们各自的大尺度衰落是相互独立的,因此分布式MIMO

  4. ruby-on-rails - 用于门户的 Ruby 技术 - 2

    我刚刚看到whitehouse.gov正在使用drupal作为CMS和门户技术。drupal的优点之一似乎是很容易添加插件,而且编程最少,即重新发明轮子最少。这实际上正是Ruby-on-Rails的DRY理念。所以:drupal的缺点是什么?Rails或其他基于Ruby的技术有哪些不符合whitehouse.org(或其他CMS门户)门户技术的资格? 最佳答案 Whatarethedrawbacksofdrupal?对于Ruby和Rails,这确实是一个相当主观的问题。Drupal是一个可靠的内容管理选项,非常适合面向社区的站点。它

  5. iNFTnews | 周杰伦18年前未发布的作品Demo,藏在了区块链技术里 - 2

    当音乐碰上区块链技术,会擦出怎样的火花?或许周杰伦已经给了我们答案。8月29日下午,B站独家首发周杰伦限定珍藏Demo独家访谈VCR,周杰伦在VCR里分享了《晴天》《青花瓷》《搁浅》《爱在西元前》四首经典歌曲Demo背后的创作故事,并首次公布18年前未发布的神秘作品《纽约地铁》的Demo。在VCR中,方文山和杰威尔音乐提及到“多亏了区块链技术,现在我们可以将这些Demos,变成独一无二具有收藏价值的艺术品,这些Demos可以在薄盒(国内数藏平台)上听到。”如何将音乐与区块链技术相结合,薄盒方面称:“薄盒作为区块链技术服务方,打破传统对于区块链技术只能作为数字收藏的理解。聚焦于区块链技术赋能,在

  6. 智能客服 | 浅谈人工智能聊天机器人ChatGPT - 2

    2022年底,OpenAI的预训练模型ChatGPT给人工智能领域的爱好者和研究人员留下了深刻的印象和启发,他展现的惊人能力将人工智能的研究和应用热度推向高潮,网上也充斥着和ChatGPT的各种聊天,他可以作诗、写小说、写代码、讨论疫情问题等。下面就是一些他的神回复:人命关天的坑: 写歌,留给词作者的机会不多了。。。 回答人类怎么样面对人工智能: 什么是ChatGPT?借用网上的一段介绍,ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动

  7. 【ChatGPT】ChatGPT 的 N 种用法 - 2

    目录ChatGPT简介技术原理应用未来发展ChatGPT的10 种用法ChatGPT简介ChatGPT是一种基于深度学习的大型语言模型,由OpenAI公司开发。技术原理GPT是GenerativePre-trainedTransformer的缩写,意为生成式预训练变压器。它的技术原理是使用了一个基于注意力机制的变压器(Trans

  8. ruby - 如何让 ruby​​-prof 忽略 Ruby 核心/标准库/gem 方法? - 2

    我是Ruby分析的新手,看起来像ruby-prof是一个受欢迎的选择。我刚刚安装了gem并调用了我的程序:ruby-prof./my-prog.rb但是,输出非常冗长,因为包含所有Ruby核心和标准库方法以及其他gem的分析数据。例如,前三行是:8.790.0110.0100.0000.0013343*String#%7.280.0780.0090.0000.0692068*Array#each4.930.0380.0060.0000.0321098*Array#map这对我来说不是什么有用的信息,因为我已经知道我的程序经常处理字符串和数组,并且大概已经对这些类进行了优化。我只关心我代

  9. ruby - 使用哪种群发消息技术? - 2

    我感到有点困惑——大约24小时以来,我一直在考虑在我的项目中使用哪种组播技术。基本上,我需要的是:创建组(通过一些后端进程)任意客户端广播消息(1:N,N:N)(可能)直接消息(1:1)(重要)使用我自己的后端(例如,通过某种HTTPAPI)对客户端进行身份验证/授权能够通过后端进程(或服务器插件)踢出特定的客户端这是我要的:Ruby或Haxe中的后端相关流程JS+Haxe(Flash9)中的前端—在浏览器中,因此理想情况下通过80/443进行通信,但不一定。因此,这项技术必须能够在HaxeforFlash中轻松访问,最好是Ruby。我一直在考虑:RabbitMQ(或OpenAMQ)、

  10. [面试直通版]操作系统核心之进程、线程与协程(下) - 2

    点击->操作系统复习的文章集目录操作系统线程线程是什么进程与线程的关系用户态/内核态操作系统资源管理内核态用户态内核态/用户态切换程序运行类型分析计算密集型IO密集型结合进程,线程来理解程序运行类型分析协程基础上下文切换协程协程为什么叫协作式线程?协程的优缺点操作系统线程典型问题:简述进程和线程的区别以下内容带您一步步了解线程是什么比进程更小的独立运行的基本单位-线程(Threads)线程的提出主要是为了提高系统内程序并发执行的程度,从而进一步提升系统的吞吐量,充分发挥多核CPU的优越性而设计的引入进程是为了操作系统更加方便地管理程序,使得多个程序能并发管理和执行而线程则是为了减少程序在并发执

随机推荐