草庐IT

克利斯

全部标签

Llama 2宇宙大爆炸!伯克利实测排第8,iPhone本地可跑,一大波应用免费玩,LeCun狂转

昨天,Meta发布了免费可商用版本Llama2,再一次给开源社区做出了惊人贡献。Meta联手微软高调开源的Llama2,一共有70亿、130亿和700亿三个参数的版本。Llama2在2万亿个token上训练的,上下文长度达到了4k,是Llama1的2倍。而微调模型已在超100万个人类标注中进行了训练。比起很多其他开源语言模型,Llama2都实现了秒杀,在推理、编码、能力和知识测试上取得了SOTA。Meta首席科学家LeCun也在今天狂转了一大波Llama2的实现。图片图片图片图片图片那么,Llama2的表现究竟如何呢?UC伯克利最新测评就在刚刚,权威的UC伯克利聊天机器人竞技场,已经火速出了L

GPT-4耗尽全宇宙数据!OpenAI接连吃官司,竟因数据太缺了,UC伯克利教授发出警告

穷尽「全网」,生成式AI很快无数据可用。近日,著名UC伯克利计算机科学家StuartRussell称,ChatGPT和其他AI工具的训练可能很快耗尽「全宇宙的文本」。换句话说,训练像ChatGPT这样的AI,将因数据量不够而受阻。图片这可能会影响生成式AI开发人员,在未来几年收集数据,以及训练人工智能的方式。同时,Russell认为人工智能将在「语言输入,语言输出」的工作中取代人类。数据不够,拿什么凑?Russell近来的预测引起了大家重点关注。OpenAI和其他生成式AI开发人员,为训练大型语言模型,开始进行数据收集。然而,ChatGPT和其他聊天机器人不可或缺的数据收集实践,正面临着越来越

ChatGPT上下文碾压64K开源模型!UC伯克利:开源模型能力严重「虚标」|最新硬核评测曝光

早先发布Vicuna模型和大语言模型排位赛的LMSYSOrg(UC伯克利主导)的研究人员又开始搞事情了。这次,他们开发出了一个支持长上下文的开源大模型家族LongChat-7B和LongChat-13B,支持高达16K token的上下文长度。但是吧,其实市面上早已出现支持65K(MPT-7B-storyteller)和32K(CHatGLM2-6B)token的选手了。图片抱着一边向他们虚心学习一边质疑的研究者心态,他们设计一个专门评估大语言模型处理长上下文任务的性能的工具,测了测一众号称支持长上下文的模型们性能到底怎么样。不测不知道,一测发现之前宣称能支持长上下的开源模型几乎水平都不怎么样

比HuggingFace快24倍!伯克利神级LLM推理系统开源,碾压SOTA,让GPU砍半

过去2个月,来自UC伯克利的研究人员给大语言模型们安排了一个擂台——ChatbotArena。GPT-4等大语言模型玩家打起了「排位赛」,通过随机battle,根据Elo得分来排名。这一过程中,每当一个用户访问并使用网站,就需要同时让两个不同的模型跑起来。他们是如何做到的?这不,就在今天,UC伯克利重磅开源了世界最快LLM推理和服务系统vLLM。简之,vLLM是一个开源的LLM推理和服务引擎。它利用了全新的注意力算法「PagedAttention」,有效地管理注意力键和值。配备全新算法的vLLM,重新定义了LLM服务的最新技术水平:与HuggingFaceTransformers相比,它提供高

小羊驼背后的英雄,伯克利开源LLM推理与服务库:GPU减半、吞吐数十倍猛增

随着大语言模型(LLM)的不断发展,这些模型在很大程度上改变了人类使用AI的方式。然而,实际上为这些模型提供服务仍然存在挑战,即使在昂贵的硬件上也可能慢得惊人。现在这种限制正在被打破。最近,来自加州大学伯克利分校的研究者开源了一个项目vLLM,该项目主要用于快速LLM推理和服务。vLLM的核心是PagedAttention,这是一种新颖的注意力算法,它将在操作系统的虚拟内存中分页的经典思想引入到LLM服务中。配备了PagedAttention的vLLM将LLM服务状态重新定义:它比HuggingFaceTransformers提供高达24倍的吞吐量,而无需任何模型架构更改。项目地址:https

AI绘画发展史(伪):从免费到吃屎;YSDA·自然语言处理课程8K Star;伯克利CS285·深度强化学习课程;前沿论文 | ShowMeAI资讯日报

👀日报合辑|📆电子月刊|🔔公众号下载资料|🍩@韩信子📢AI绘画发展史(伪):不能提升生产力的创新,都是伪创新微博博主@西仔LittileC绘制了一份AI绘画发展史,展示了从业者的担忧——并非抗拒技术进步带来的竞争和压力,而是担心已有行业的种种乱象在绘画行业重演,最终导致所有用户被动『吃屎』。大平台免费致使从业人数减少、平台收取低价使用费用、用户必须购买会员/按月订阅/按年订阅才能使用、内容趋同千人一面···这个发展历程,我们太熟悉了···工具&框架🚧『Monocraft』Minecraft前端字体https://github.com/IdreesInc/Monocrafthttps://idr

果断收藏!AI绘图文字设计指南;将文本创建为漂亮时间线;伯克利·全栈深度学习训练营课程;CMU·数据库系统系列课程;前沿论文 | ShowMeAI资讯日报

👀日报合辑|📆电子月刊|🔔公众号下载资料|🍩@韩信子📢『ABeginner’sGuidetoPromptDesignforText-to-ImageGenerativeModels』从文本到图像,生成模型的提示设计·入门指南https://towardsdatascience.com/a-beginners-guide-to-prompt-design-for-text-to-image-generative-models-8242e1361580随着StableDiffusion、Midjourney和DALL·E2的发布,使用文字提示生成图像成为新的潮流。如何使用尽可能少的提示文字来获得喜

首个大规模使用工具的大模型来了:伯克利发布Gorilla

大型语言模型性能强大,但为了更好地用于解决实际问题,各式各样的API是必不可少的。近日,加利福尼亚大学伯克利分校和微软研究院造出了一只「大猩猩」Gorilla,该模型能根据用户输入的自然语言为用户选择合适的API来执行对应任务。理论上讲,这个模型可以根据用户需求调用其它各种AI模型,因此Gorilla有望成为一个统御其它AI的AI模型。该项目的代码、模型、数据和演示都已发布。网站:gorilla.cs.berkeley.edu论文:arxiv.org/abs/2305.15334GitHub:https://github.com/ShishirPatil/gorilla/GorillaSpot

顺序决策与基础模型如何交叉互惠?谷歌、伯克利等探讨更多可能

在广泛数据集上基于自监督学习的预训练基础模型,已经展现出将知识迁移到不同下游任务的优秀能力。因此,这些模型也被应用到长期推理、控制、搜索和规划等更复杂的问题,或者被部署在对话、自动驾驶、医疗保健和机器人等应用中。未来它们也会提供接口给外部实体和智能体,例如在对话应用中,语言模型与人进行多轮交流;在机器人领域,感知控制模型在真实环境中执行动作。这些场景为基础模型提出了新的挑战,包括:1)如何从外部实体(如人对对话质量的评价)的反馈中学习,2)如何适应大规模语言或视觉数据集中不常见的模态(如机器人动作),3)如何在未来进行长期的推理和规划。 这些问题一直是传统意义上顺序决策的核心,涵盖了强化学习、

UC伯克利LLM准中文排行榜来了!GPT-4稳居第一,国人开源RNN模型冲进前六

前段时间,来自LMSYSOrg(UC伯克利主导)的研究人员搞了个大新闻——大语言模型版排位赛!这次,团队不仅带来了4位新玩家,而且还有一个(准)中文排行榜。OpenAIGPT-4OpenAIGPT-3.5-turboAnthropicClaude-v1RWKV-4-Raven-14B(开源)毫无疑问,只要GPT-4参战,必定是稳居第一。不过,出乎意料的是,Claude不仅超过了把OpenAI带上神坛的GPT-3.5位列第二,而且只比GPT-4差了50分。相比之下,排名第三的GPT-3.5只比130亿参数的最强开源模型Vicuna高了72分。而140亿参数的「纯RNN模型」RWKV-4-Rave