草庐IT

UC伯克利教授惊人预测:2030年GPT可执行人类180万年工作,一天学2500年知识

现在是GPT-4,时间是2023年。7年之后,2030年,那时的GPT会是什么样子?UC伯克利的一位机器学习教授JacobSteinhard发表长文,对2030年的GPT(以下简称为GPT2030)作了预测。为了更好地进行预测,Jacob查询了各种来源的信息,包括经验缩放定律、对未来计算和数据可用性的预测、特定基准的改进速度、当前系统的经验推理速度,以及未来可能的并行性改进。概括来看,Jacob认为,GPT2030会在以下几个方面超过人类工作者。1.编程、黑客任务、数学、蛋白质设计。2.工作和思考的速度:预计GPT2030每分钟处理的单词是人类的5倍,而每FLOP都多5倍的话,总共就是125倍

用语言建模世界:UC伯克利多模态世界模型利用语言预测未来

当前,人与智能体(比如机器人)的交互是非常直接的,你告诉它「拿一块蓝色的积木」,它就会帮你拿过来。但现实世界的很多信息并非那么直接,比如「扳手可以用来拧紧螺母」、「我们的牛奶喝完了」。这些信息不能直接拿来当成指令,但却蕴含着丰富的世界信息。智能体很难了解这些语言在世界上的含义。图源:谷歌机器人团队论文「InteractiveLanguage:TalkingtoRobotsinRealTime」。UC伯克利Dynalang研究的关键思想是,我们可以将语言看作是帮助我们更好地对世界进行预测的工具,比如「我们的牛奶喝完了」→打开冰箱时没有牛奶;「扳手可以用来拧紧螺母」→使用工具时螺母会旋转。Dyna

Llama 2宇宙大爆炸!伯克利实测排第8,iPhone本地可跑,一大波应用免费玩,LeCun狂转

昨天,Meta发布了免费可商用版本Llama2,再一次给开源社区做出了惊人贡献。Meta联手微软高调开源的Llama2,一共有70亿、130亿和700亿三个参数的版本。Llama2在2万亿个token上训练的,上下文长度达到了4k,是Llama1的2倍。而微调模型已在超100万个人类标注中进行了训练。比起很多其他开源语言模型,Llama2都实现了秒杀,在推理、编码、能力和知识测试上取得了SOTA。Meta首席科学家LeCun也在今天狂转了一大波Llama2的实现。图片图片图片图片图片那么,Llama2的表现究竟如何呢?UC伯克利最新测评就在刚刚,权威的UC伯克利聊天机器人竞技场,已经火速出了L

GPT-4耗尽全宇宙数据!OpenAI接连吃官司,竟因数据太缺了,UC伯克利教授发出警告

穷尽「全网」,生成式AI很快无数据可用。近日,著名UC伯克利计算机科学家StuartRussell称,ChatGPT和其他AI工具的训练可能很快耗尽「全宇宙的文本」。换句话说,训练像ChatGPT这样的AI,将因数据量不够而受阻。图片这可能会影响生成式AI开发人员,在未来几年收集数据,以及训练人工智能的方式。同时,Russell认为人工智能将在「语言输入,语言输出」的工作中取代人类。数据不够,拿什么凑?Russell近来的预测引起了大家重点关注。OpenAI和其他生成式AI开发人员,为训练大型语言模型,开始进行数据收集。然而,ChatGPT和其他聊天机器人不可或缺的数据收集实践,正面临着越来越

ChatGPT上下文碾压64K开源模型!UC伯克利:开源模型能力严重「虚标」|最新硬核评测曝光

早先发布Vicuna模型和大语言模型排位赛的LMSYSOrg(UC伯克利主导)的研究人员又开始搞事情了。这次,他们开发出了一个支持长上下文的开源大模型家族LongChat-7B和LongChat-13B,支持高达16K token的上下文长度。但是吧,其实市面上早已出现支持65K(MPT-7B-storyteller)和32K(CHatGLM2-6B)token的选手了。图片抱着一边向他们虚心学习一边质疑的研究者心态,他们设计一个专门评估大语言模型处理长上下文任务的性能的工具,测了测一众号称支持长上下文的模型们性能到底怎么样。不测不知道,一测发现之前宣称能支持长上下的开源模型几乎水平都不怎么样

比HuggingFace快24倍!伯克利神级LLM推理系统开源,碾压SOTA,让GPU砍半

过去2个月,来自UC伯克利的研究人员给大语言模型们安排了一个擂台——ChatbotArena。GPT-4等大语言模型玩家打起了「排位赛」,通过随机battle,根据Elo得分来排名。这一过程中,每当一个用户访问并使用网站,就需要同时让两个不同的模型跑起来。他们是如何做到的?这不,就在今天,UC伯克利重磅开源了世界最快LLM推理和服务系统vLLM。简之,vLLM是一个开源的LLM推理和服务引擎。它利用了全新的注意力算法「PagedAttention」,有效地管理注意力键和值。配备全新算法的vLLM,重新定义了LLM服务的最新技术水平:与HuggingFaceTransformers相比,它提供高

小羊驼背后的英雄,伯克利开源LLM推理与服务库:GPU减半、吞吐数十倍猛增

随着大语言模型(LLM)的不断发展,这些模型在很大程度上改变了人类使用AI的方式。然而,实际上为这些模型提供服务仍然存在挑战,即使在昂贵的硬件上也可能慢得惊人。现在这种限制正在被打破。最近,来自加州大学伯克利分校的研究者开源了一个项目vLLM,该项目主要用于快速LLM推理和服务。vLLM的核心是PagedAttention,这是一种新颖的注意力算法,它将在操作系统的虚拟内存中分页的经典思想引入到LLM服务中。配备了PagedAttention的vLLM将LLM服务状态重新定义:它比HuggingFaceTransformers提供高达24倍的吞吐量,而无需任何模型架构更改。项目地址:https

AI绘画发展史(伪):从免费到吃屎;YSDA·自然语言处理课程8K Star;伯克利CS285·深度强化学习课程;前沿论文 | ShowMeAI资讯日报

👀日报合辑|📆电子月刊|🔔公众号下载资料|🍩@韩信子📢AI绘画发展史(伪):不能提升生产力的创新,都是伪创新微博博主@西仔LittileC绘制了一份AI绘画发展史,展示了从业者的担忧——并非抗拒技术进步带来的竞争和压力,而是担心已有行业的种种乱象在绘画行业重演,最终导致所有用户被动『吃屎』。大平台免费致使从业人数减少、平台收取低价使用费用、用户必须购买会员/按月订阅/按年订阅才能使用、内容趋同千人一面···这个发展历程,我们太熟悉了···工具&框架🚧『Monocraft』Minecraft前端字体https://github.com/IdreesInc/Monocrafthttps://idr

果断收藏!AI绘图文字设计指南;将文本创建为漂亮时间线;伯克利·全栈深度学习训练营课程;CMU·数据库系统系列课程;前沿论文 | ShowMeAI资讯日报

👀日报合辑|📆电子月刊|🔔公众号下载资料|🍩@韩信子📢『ABeginner’sGuidetoPromptDesignforText-to-ImageGenerativeModels』从文本到图像,生成模型的提示设计·入门指南https://towardsdatascience.com/a-beginners-guide-to-prompt-design-for-text-to-image-generative-models-8242e1361580随着StableDiffusion、Midjourney和DALL·E2的发布,使用文字提示生成图像成为新的潮流。如何使用尽可能少的提示文字来获得喜

首个大规模使用工具的大模型来了:伯克利发布Gorilla

大型语言模型性能强大,但为了更好地用于解决实际问题,各式各样的API是必不可少的。近日,加利福尼亚大学伯克利分校和微软研究院造出了一只「大猩猩」Gorilla,该模型能根据用户输入的自然语言为用户选择合适的API来执行对应任务。理论上讲,这个模型可以根据用户需求调用其它各种AI模型,因此Gorilla有望成为一个统御其它AI的AI模型。该项目的代码、模型、数据和演示都已发布。网站:gorilla.cs.berkeley.edu论文:arxiv.org/abs/2305.15334GitHub:https://github.com/ShishirPatil/gorilla/GorillaSpot