几天前,DeepMind推出了AlphaDev,直接把排序算法提速70%。这一全新AI系统,便是基于下棋高手AlphaGo打造。而这项研究恰恰激起了前谷歌研究人员JustineTunney的兴趣。她表示,作为一名C语言库的作者,我一直在寻找机会来策划最好的东西。一起看看Justine如何详解DeepMind排序算法。DeepMind排序算法DeepMind的这一发现赢得了当之无愧的关注,但不幸的是,他们本可以更好地解释AlphaDev。接下来,从DeepMind发布的汇编代码开始,该代码将一个有三个项目的数组进行排序,从伪汇编翻译成汇编:我将这个函数命名为move37(),是因为DeepMin
据称,这个算法可以创造出比人类编写的算法快3倍的排序算法。消息刚出的时候,很多网友都认为这是机器学习领域的重大突破。但经过一段时间的发酵之后,部分网友对AlphaDev取得的成就的评价似乎出现了分歧。先是一位推特网友表示,用GPT-4也成功地发现了和AlphaDev发现的几乎一样的算法。然后不少网友也在讨论,觉得AlphaDev取得的实际成果和他们自己吹的「历史性突破」差距过大。网友的这些讨论甚至把马库斯也引来围观看热闹了。此外,马院士也回复了用GPT-4发现算法的网友,「推特老板到此一游」GPT-4也能「发现」同样的算法现在我们来看看这位用GPT-4发现和AlphaDev几乎一样算法的网友到
目录:FastersortingalgorithmsdiscoveredusingdeepreinforcementlearningVideo-LLaMA:AnInstruction-tunedAudio-VisualLanguageModelforVideoUnderstandingPatch-based3DNaturalSceneGenerationfromaSingleExampleSpatio-temporalDiffusionPointProcessesSpQR:ASparse-QuantizedRepresentationforNear-LosslessLLMWeightCompr
点击参加51CTO网站内容调查问卷编译|王瑞平、言征AlphaGo又有“小弟”加入了!谷歌DeepMind把Alpha系列“卷”到了排序算法上,重磅推出AlphaDev。它好比一种“开发秘法”,通过使用强化学习AI发现排序算法和散列算法,强行把人类程序员设计的算法分别提速约70%和30%。研究成果一经推出,瞬间点燃软件圈!一下子,全球数以百万计的软件运行速度飙升,直接超越了科学家和工程师几十年来的成果,十年未更新的LLVM标准C++库都更新了。(来源:Nature)这也是继谷歌两AI部门合体后推出的颠覆性技术。论文以《使用深度强化学习模型发现更快排序算法》(Fastersortingalgor
分享一篇对话,LinkedIn联合创始人ReidHoffman和DeepMind联合创始人MustafaSuleyman的对话。他们在2022年联合创办了AI初创公司InflectionAI(转折点),主打toc业务,近期发布了第一款产品Pi,已于日前开放体验。Pi是一个对话式个人助理,这是两位创始人对未来AI技术应用想象的初期产品,它具备极强的上下文能力,连小孩子都乐意使用。使用计算机越来越像是在对话HeatherMack:ReidHoffman和 MustafaSuleyman 是消费级AI公司Inflection的共同创始人。该公司去年成立,并在Greylock孵化。现在,Inflect
5月31日消息,DeepMind、普林斯顿大学和斯坦福大学的研究人员近日提出了一项名为LATM(LLMsAsToolMakers)的创新框架,该框架可以将像GPT-4这样的大型语言模型转变为工具制造者(IT之家注:即让模型自己生成软件工具来处理新任务)。▲图源ArxivLATM的创新之处在于它为语言模型引入了工具制造和使用的概念,使得模型能够自主创建适用于不同任务的工具。这一框架不仅能够提高模型的灵活性和适应性,还能够为生成式AI提供更加高效和经济的解决方案。该框架主要包含以下两个关键部分:工具制造:作为工具制造者,LLM专门为特定任务设计软件工具,这些工具以Python函数的形式实现。工具使
4月7日,上海人工智能实验室联合中国科学技术大学、上海交通大学、南京信息工程大学、中国科学院大气物理研究所及上海中心气象台发布全球中期天气预报大模型“风乌”。基于多模态和多任务深度学习方法构建,AI大模型“风乌”首次实现在高分辨率上对核心大气变量进行超过10天的有效预报,并在80%的评估指标上超越DeepMind发布的模型GraphCast[1]。此外,“风乌”仅需30秒即可生成未来10天全球高精度预报结果,在效率上大幅优于传统模型。实验室领军科学家欧阳万里表示,“‘风乌’取名自秦汉时期的‘相风铜乌’,是世界上最早的测风设备。天气预报大模型‘风乌’不仅承载了中国古人的智慧,也寓意实验室致力于在
前三章都围绕指令微调,这一章来唠唠RLHF。何为优秀的人工智能?抽象说是可以帮助人类解决问题的AI,也可以简化成3H原则:Helpful+Honesty+Harmless。面向以上1个或多个原则,RLHF只是其中一种对齐方案,把模型输出和人类偏好进行对齐。大体分成3个步骤人类偏好数据的标注基于标注数据训练奖励模型基于奖励模型使用RL微调语言模型以OpenAI为基础,本章会对比DeepMind,Anthropic在以上3个步骤上的异同,并尝试回答以下几个问题RLHF究竟做了什么偏好对齐用RL和SFT有什么差异什么模型适合作为RL的起点考虑篇幅已经超出了我自己的阅读耐心,RL算法和其他偏好对齐方案
通用人工智能,十年内就会实现?近日,谷歌DeepMindCEODemisHassabis在一场演讲中,抛出这个惊人的说法。与Hassabis的自信满满不同,Hinton用从谷歌辞职的举动,表明了自己对于AI发展的深切忧思。而LeCun则一如既往地表示:认为AI会终结人类文明的想法,纯属胡说八道。Hassabis乐观预言通用人工智能(AGI)的其中一种定义是,与人类的认知能力相匹配的AI。Hassabis表示,未来几年内非常可能会出现与人脑一样强大的人工智能。「过去几年里,AI研究取得的进步令人难以置信。我看不出任何进展会放缓的理由。我认为它甚至可能会加速。所以我认为我们可能只需要几年时间,也许
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。马斯克入局AIGC大战,紧急抢购约1万张GPU!什么概念?特斯拉最强超算Dojo也不趁这么多。Dojo在2022年升级后公布的数据是7360块A100,虽然这次买的什么型号还不清楚,但光从数量来说也足够恐怖。据BusinessInsider消息,这1万显卡是买给推特的。爆料者称,推特版GPT已在准备中,而且推特本身就拥有海量数据,存在一定优势。等一下?马斯克不是前一阵还签署公开信,呼吁比GPT-4强大的AI模型暂停6个月的吗?真就应了网友说的“你们停停,等我追上”呗?对于马斯克这次的大动作,也有网友认为囤GPU本身就是