克利斯_草庐IT

Llama 2宇宙大爆炸！伯克利实测排第8，iPhone本地可跑，一大波应用免费玩，LeCun狂转

昨天，Meta发布了免费可商用版本Llama2，再一次给开源社区做出了惊人贡献。Meta联手微软高调开源的Llama2，一共有70亿、130亿和700亿三个参数的版本。Llama2在2万亿个token上训练的，上下文长度达到了4k，是Llama1的2倍。而微调模型已在超100万个人类标注中进行了训练。比起很多其他开源语言模型，Llama2都实现了秒杀，在推理、编码、能力和知识测试上取得了SOTA。Meta首席科学家LeCun也在今天狂转了一大波Llama2的实现。图片图片图片图片图片那么，Llama2的表现究竟如何呢？UC伯克利最新测评就在刚刚，权威的UC伯克利聊天机器人竞技场，已经火速出了L

GPT-4耗尽全宇宙数据！OpenAI接连吃官司，竟因数据太缺了，UC伯克利教授发出警告

穷尽「全网」，生成式AI很快无数据可用。近日，著名UC伯克利计算机科学家StuartRussell称，ChatGPT和其他AI工具的训练可能很快耗尽「全宇宙的文本」。换句话说，训练像ChatGPT这样的AI，将因数据量不够而受阻。图片这可能会影响生成式AI开发人员，在未来几年收集数据，以及训练人工智能的方式。同时，Russell认为人工智能将在「语言输入，语言输出」的工作中取代人类。数据不够，拿什么凑？Russell近来的预测引起了大家重点关注。OpenAI和其他生成式AI开发人员，为训练大型语言模型，开始进行数据收集。然而，ChatGPT和其他聊天机器人不可或缺的数据收集实践，正面临着越来越

ChatGPT上下文碾压64K开源模型！UC伯克利：开源模型能力严重「虚标」｜最新硬核评测曝光

早先发布Vicuna模型和大语言模型排位赛的LMSYSOrg（UC伯克利主导）的研究人员又开始搞事情了。这次，他们开发出了一个支持长上下文的开源大模型家族LongChat-7B和LongChat-13B，支持高达16K token的上下文长度。但是吧，其实市面上早已出现支持65K（MPT-7B-storyteller）和32K（CHatGLM2-6B）token的选手了。图片抱着一边向他们虚心学习一边质疑的研究者心态，他们设计一个专门评估大语言模型处理长上下文任务的性能的工具，测了测一众号称支持长上下文的模型们性能到底怎么样。不测不知道，一测发现之前宣称能支持长上下的开源模型几乎水平都不怎么样

比HuggingFace快24倍！伯克利神级LLM推理系统开源，碾压SOTA，让GPU砍半

过去2个月，来自UC伯克利的研究人员给大语言模型们安排了一个擂台——ChatbotArena。GPT-4等大语言模型玩家打起了「排位赛」，通过随机battle，根据Elo得分来排名。这一过程中，每当一个用户访问并使用网站，就需要同时让两个不同的模型跑起来。他们是如何做到的？这不，就在今天，UC伯克利重磅开源了世界最快LLM推理和服务系统vLLM。简之，vLLM是一个开源的LLM推理和服务引擎。它利用了全新的注意力算法「PagedAttention」，有效地管理注意力键和值。配备全新算法的vLLM，重新定义了LLM服务的最新技术水平：与HuggingFaceTransformers相比，它提供高

小羊驼背后的英雄，伯克利开源LLM推理与服务库：GPU减半、吞吐数十倍猛增

随着大语言模型（LLM）的不断发展，这些模型在很大程度上改变了人类使用AI的方式。然而，实际上为这些模型提供服务仍然存在挑战，即使在昂贵的硬件上也可能慢得惊人。现在这种限制正在被打破。最近，来自加州大学伯克利分校的研究者开源了一个项目vLLM，该项目主要用于快速LLM推理和服务。vLLM的核心是PagedAttention，这是一种新颖的注意力算法，它将在操作系统的虚拟内存中分页的经典思想引入到LLM服务中。配备了PagedAttention的vLLM将LLM服务状态重新定义：它比HuggingFaceTransformers提供高达24倍的吞吐量，而无需任何模型架构更改。项目地址：https

AI绘画发展史(伪)：从免费到吃屎；YSDA·自然语言处理课程8K Star；伯克利CS285·深度强化学习课程；前沿论文 | ShowMeAI资讯日报

👀日报合辑|📆电子月刊|🔔公众号下载资料|🍩@韩信子📢AI绘画发展史(伪)：不能提升生产力的创新，都是伪创新微博博主@西仔LittileC绘制了一份AI绘画发展史，展示了从业者的担忧——并非抗拒技术进步带来的竞争和压力，而是担心已有行业的种种乱象在绘画行业重演，最终导致所有用户被动『吃屎』。大平台免费致使从业人数减少、平台收取低价使用费用、用户必须购买会员/按月订阅/按年订阅才能使用、内容趋同千人一面···这个发展历程，我们太熟悉了···工具&框架🚧『Monocraft』Minecraft前端字体https://github.com/IdreesInc/Monocrafthttps://idr

果断收藏！AI绘图文字设计指南；将文本创建为漂亮时间线；伯克利·全栈深度学习训练营课程；CMU·数据库系统系列课程；前沿论文 | ShowMeAI资讯日报

👀日报合辑|📆电子月刊|🔔公众号下载资料|🍩@韩信子📢『ABeginner’sGuidetoPromptDesignforText-to-ImageGenerativeModels』从文本到图像，生成模型的提示设计·入门指南https://towardsdatascience.com/a-beginners-guide-to-prompt-design-for-text-to-image-generative-models-8242e1361580随着StableDiffusion、Midjourney和DALL·E2的发布，使用文字提示生成图像成为新的潮流。如何使用尽可能少的提示文字来获得喜

首个大规模使用工具的大模型来了：伯克利发布Gorilla

大型语言模型性能强大，但为了更好地用于解决实际问题，各式各样的API是必不可少的。近日，加利福尼亚大学伯克利分校和微软研究院造出了一只「大猩猩」Gorilla，该模型能根据用户输入的自然语言为用户选择合适的API来执行对应任务。理论上讲，这个模型可以根据用户需求调用其它各种AI模型，因此Gorilla有望成为一个统御其它AI的AI模型。该项目的代码、模型、数据和演示都已发布。网站：gorilla.cs.berkeley.edu论文：arxiv.org/abs/2305.15334GitHub：https://github.com/ShishirPatil/gorilla/GorillaSpot

顺序决策与基础模型如何交叉互惠？谷歌、伯克利等探讨更多可能

在广泛数据集上基于自监督学习的预训练基础模型，已经展现出将知识迁移到不同下游任务的优秀能力。因此，这些模型也被应用到长期推理、控制、搜索和规划等更复杂的问题，或者被部署在对话、自动驾驶、医疗保健和机器人等应用中。未来它们也会提供接口给外部实体和智能体，例如在对话应用中，语言模型与人进行多轮交流；在机器人领域，感知控制模型在真实环境中执行动作。这些场景为基础模型提出了新的挑战，包括：1)如何从外部实体（如人对对话质量的评价）的反馈中学习，2)如何适应大规模语言或视觉数据集中不常见的模态（如机器人动作），3)如何在未来进行长期的推理和规划。这些问题一直是传统意义上顺序决策的核心，涵盖了强化学习、

前段时间，来自LMSYSOrg（UC伯克利主导）的研究人员搞了个大新闻——大语言模型版排位赛！这次，团队不仅带来了4位新玩家，而且还有一个（准）中文排行榜。OpenAIGPT-4OpenAIGPT-3.5-turboAnthropicClaude-v1RWKV-4-Raven-14B（开源）毫无疑问，只要GPT-4参战，必定是稳居第一。不过，出乎意料的是，Claude不仅超过了把OpenAI带上神坛的GPT-3.5位列第二，而且只比GPT-4差了50分。相比之下，排名第三的GPT-3.5只比130亿参数的最强开源模型Vicuna高了72分。而140亿参数的「纯RNN模型」RWKV-4-Rave