伯克_草庐IT

顺序决策与基础模型如何交叉互惠？谷歌、伯克利等探讨更多可能

在广泛数据集上基于自监督学习的预训练基础模型，已经展现出将知识迁移到不同下游任务的优秀能力。因此，这些模型也被应用到长期推理、控制、搜索和规划等更复杂的问题，或者被部署在对话、自动驾驶、医疗保健和机器人等应用中。未来它们也会提供接口给外部实体和智能体，例如在对话应用中，语言模型与人进行多轮交流；在机器人领域，感知控制模型在真实环境中执行动作。这些场景为基础模型提出了新的挑战，包括：1)如何从外部实体（如人对对话质量的评价）的反馈中学习，2)如何适应大规模语言或视觉数据集中不常见的模态（如机器人动作），3)如何在未来进行长期的推理和规划。这些问题一直是传统意义上顺序决策的核心，涵盖了强化学习、

伯克伯克利 style 模型 text-align 人工智能新闻论文

UC伯克利LLM准中文排行榜来了！GPT-4稳居第一，国人开源RNN模型冲进前六

前段时间，来自LMSYSOrg（UC伯克利主导）的研究人员搞了个大新闻——大语言模型版排位赛！这次，团队不仅带来了4位新玩家，而且还有一个（准）中文排行榜。OpenAIGPT-4OpenAIGPT-3.5-turboAnthropicClaude-v1RWKV-4-Raven-14B（开源）毫无疑问，只要GPT-4参战，必定是稳居第一。不过，出乎意料的是，Claude不仅超过了把OpenAI带上神坛的GPT-3.5位列第二，而且只比GPT-4差了50分。相比之下，排名第三的GPT-3.5只比130亿参数的最强开源模型Vicuna高了72分。而140亿参数的「纯RNN模型」RWKV-4-Rave

伯克伯克利 style span text-align 人工智能新闻模型排行

UC伯克利发布大语言模型排行榜！Vicuna夺冠，清华ChatGLM进前5

最近，来自LMSYSOrg（UC伯克利主导）的研究人员又搞了个大新闻——大语言模型版排位赛！顾名思义，「LLM排位赛」就是让一群大语言模型随机进行battle，并根据它们的Elo得分进行排名。然后，我们就能一眼看出，某个聊天机器人到底是「嘴强王者」还是「最强王者」。划重点：团队还计划把国内和国外的这些「闭源」模型都搞进来，是骡子是马溜溜就知道了！（GPT-3.5现在就已经在匿名竞技场里了）匿名聊天机器人竞技场长下面这样：很明显，模型B回答正确，拿下这局；而模型A连题都没读懂……项目地址：https://arena.lmsys.org/在当前的排行榜中，130亿参数的Vicuna以1169分稳居

单个GPU就能跑！UC伯克利领头，130亿参数「小羊驼」权重公布

3月31日，UC伯克利联手CMU、斯坦福、UCSD和MBZUAI，推出了130亿参数的Vicuna，俗称「小羊驼」（骆马），仅需300美元就能实现ChatGPT90%的性能。今天，团队正式发布了Vicuna的权重——只需单个GPU就能跑！项目地址：https://github.com/lm-sys/FastChat/#fine-tuning130亿参数，90%匹敌ChatGPTVicuna是通过在ShareGPT收集的用户共享对话上对LLaMA进行微调训练而来，训练成本近300美元。研究人员设计了8个问题类别，包括数学、写作、编码，对Vicuna-13B与其他四个模型进行了性能测试。测试过程

GPU 130 style span data-id 商务办公 CMU 开源

单个GPU就能跑！UC伯克利领头，130亿参数「小羊驼」权重公布

3月31日，UC伯克利联手CMU、斯坦福、UCSD和MBZUAI，推出了130亿参数的Vicuna，俗称「小羊驼」（骆马），仅需300美元就能实现ChatGPT90%的性能。今天，团队正式发布了Vicuna的权重——只需单个GPU就能跑！项目地址：https://github.com/lm-sys/FastChat/#fine-tuning130亿参数，90%匹敌ChatGPTVicuna是通过在ShareGPT收集的用户共享对话上对LLaMA进行微调训练而来，训练成本近300美元。研究人员设计了8个问题类别，包括数学、写作、编码，对Vicuna-13B与其他四个模型进行了性能测试。测试过程

GPU 130 style span data-id 商务办公 CMU 开源

130亿参数，8个A100训练，UC伯克利发布对话模型Koala

自从Meta发布并开源了LLaMA系列模型，来自斯坦福大学、UC伯克利等机构的研究者们纷纷在LLaMA的基础上进行「二创」，先后推出了Alpaca、Vicuna等多个「羊驼」大模型。羊驼已然成为开源社区的新晋顶流。由于「二创」过于丰富，生物学羊驼属的英文单词都快不够用了，但是用其他动物的名字给大模型命名也是可以的。最近，UC伯克利的伯克利人工智能研究院（BAIR）发布了一个可以在消费级GPU上运行的对话模型Koala（直译为考拉）。Koala使用从网络收集的对话数据对LLaMA模型进行微调。项目地址：https://bair.berkeley.edu/blog/2023/04/03/koal

训练 Koala style span data-id 人工智能新闻模型

130亿参数，8个A100训练，UC伯克利发布对话模型Koala

自从Meta发布并开源了LLaMA系列模型，来自斯坦福大学、UC伯克利等机构的研究者们纷纷在LLaMA的基础上进行「二创」，先后推出了Alpaca、Vicuna等多个「羊驼」大模型。羊驼已然成为开源社区的新晋顶流。由于「二创」过于丰富，生物学羊驼属的英文单词都快不够用了，但是用其他动物的名字给大模型命名也是可以的。最近，UC伯克利的伯克利人工智能研究院（BAIR）发布了一个可以在消费级GPU上运行的对话模型Koala（直译为考拉）。Koala使用从网络收集的对话数据对LLaMA模型进行微调。项目地址：https://bair.berkeley.edu/blog/2023/04/03/koal

训练 Koala style span data-id 人工智能新闻模型

ChatGPT平替「小羊驼」Mac可跑！2行代码单GPU，UC伯克利再发70亿参数开源模型

自从Meta发布「开源版ChatGPT」LLaMA之后，学界可谓是一片狂欢。先是斯坦福提出了70亿参数Alpaca，紧接着又是UC伯克利联手CMU、斯坦福、UCSD和MBZUAI发布的130亿参数Vicuna，在超过90%的情况下实现了与ChatGPT和Bard相匹敌的能力。今天，「卷王」UC伯克利LMSysorg又发布了70亿参数的Vicuna——不仅体积小、效率高、能力强，而且只需两行命令就能在M1/M2芯片的Mac上运行，还能开启GPU加速！项目地址：https://github.com/lm-sys/FastChat/#fine-tuning恰在今天，HuggingFace的研究人员也

ChatGPT Mac span style text-align 人工智能新闻模型 AI

ChatGPT平替「小羊驼」Mac可跑！2行代码单GPU，UC伯克利再发70亿参数开源模型

自从Meta发布「开源版ChatGPT」LLaMA之后，学界可谓是一片狂欢。先是斯坦福提出了70亿参数Alpaca，紧接着又是UC伯克利联手CMU、斯坦福、UCSD和MBZUAI发布的130亿参数Vicuna，在超过90%的情况下实现了与ChatGPT和Bard相匹敌的能力。今天，「卷王」UC伯克利LMSysorg又发布了70亿参数的Vicuna——不仅体积小、效率高、能力强，而且只需两行命令就能在M1/M2芯片的Mac上运行，还能开启GPU加速！项目地址：https://github.com/lm-sys/FastChat/#fine-tuning恰在今天，HuggingFace的研究人员也

ChatGPT Mac span style text-align 人工智能新闻模型 AI

Python 伯克利 DB/Sqlite

Python Sqlite section code berkeley-db