deepmind_草庐IT

智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

视频游戏是AI系统的重要试验场。与现实世界一样，游戏也是丰富的学习环境，具有反应灵敏的实时设置和不断变化的目标。从早期与雅达利游戏的合作，到人类大师级水平的《星际争霸II》系统AlphaStar，谷歌DeepMind在人工智能和游戏领域陆续推出过不少影响力研究。刚刚，谷歌宣布了又一项里程碑式研究：SIMA（ScalableInstructableMultiworldAgent），一种适用于3D虚拟环境的通用AI智能体。加州大学欧文分校助理教授RoyFox表示，SIMA让我们离自主智能体的「ChatGPT时刻」又近了一步。谷歌DeepMind研究工程师TimHarley表示：「想象有一天，我们可

40%算力训练效果比肩GPT-4，实测DeepMind联创大模型创业新成果

大模型竞赛，又杀出一匹黑马——Inflection-2.5，由DeepMind联创MustafaSuleyman的大模型初创公司打造。只用40%的计算资源训练，表现就超过了GPT-4的九成，尤其擅长代码和数学。而早期的Inflection模型，训练时只消耗了4%的计算资源，就达到了GPT-4表现的72%。以Inflection模型为基础，该公司还推出了网页端对话机器人Pi，主打“高情商”和“个性化”，还支持中文。自诞生以来，Pi的最高日活达到了100万，累计产生了40亿条消息，平均对话时长来到了33分钟。而随着这次基础模型的升级，Pi也迎来了它的新版本。图片那么，Inflection，或者说P

十年内出现AGI？下一代Gemini能感知环境？DeepMind CEO哈萨比斯畅谈AI

「如果我们在未来十年内拥有类似AGI的系统，我不会感到惊讶。」GoogleDeepMind联合创始人和CEODemisHassabis近日在人工智能播客节目DwarkeshPodcast上如是说。在长达一个小时的节目中，Hassabis分享了自己对智能本质、强化学习、规模扩展和对齐、AGI、多模态等主题的看法。机器之心选择性地整理了其中的主要内容并进行了适当编辑以便阅读。智能的本质DwarkeshPatel：第一个问题：您有神经科学背景，那么您是怎么看待智能的？DemisHassabis：这个问题很有趣。智能非常宽泛，可普遍用于各种用途。我认为这说明对于大脑处理我们周围世界的方式，必然存在某种

大视频模型是世界模型？DeepMind/UC伯克利华人一作：预测下一帧就能改变世界

没人怀疑，OpenAI开年推出的史诗巨作Sora，将改变视频相关领域的内容生态。但GoogleDeepMind、UC伯克利和MIT的研究人员更进一步，在他们眼里，「大视频模型」也许能够像世界模型一样，真正的做到理解我们身处的这个世界。论文地址：https://arxiv.org/abs/2402.17139在作者看来，视频生成将彻底改变物理世界的决策，就像语言模型如何改变数字世界一样。研究人员认为，与文本类似，视频可以作为一个统一的接口，吸收互联网知识并表征不同的任务。例如，经典的计算机视觉任务可以被视为下一代帧生成任务（next-framegenerationtask）。模型可以通过生成操作

DeepMind携Mamba华人作者推Transformer革命之作！性能暴涨媲美Llama 2，推理能效大幅碾压

Transformer又又又被挑战了！这次的挑战者来自大名鼎鼎的谷歌DeepMind，并且一口气推出了两种新架构，——Hawk和Griffin。论文地址：https://arxiv.org/abs/2402.19427这种将门控线性RNN与局部注意力混合在一起的模型新架构的表现相当亮眼。首先，同为线性RNN架构的Griffin，凭借着1/2的训练数据，在所有评测中全面优于之前大火的Mamba。更重要的是，Griffin将模型成功扩展到了14B，做到了Mamba想做却没能做的事。其次，面对基于Transformer架构的模型，Griffin则凭借着1/6的训练数据，打平甚至超越了同等参数量的Ll

DeepMind CEO：LLM+树搜索就是AGI技术线路，AI科研依赖工程能力，闭源模型就是比开源安全

谷歌在2月之后突然切换到了996模式，不到一个月的时间抛出了5个模型。而DeepMindCEOHassabis本人也是四处为自家的产品站台，曝出了很多幕后的开发内幕。在他看来，虽然还需要技术突破，但是现在人类通往AGI之路已经出现。而DeepMind和谷歌Brain的合并，标志着AI技术发展已经进入了新的时代。问：DeepMind一直站在技术的前沿。比如像AlphaZero这样系统，内部的智能体能够经过一系列思考，达成最终目标。这是否意味着大型语言模型（LLM）也能够加入这种研究的行列呢？Hassabis：我个人认为，这是一个非常有潜力的方向。我们需要继续完善这些大型模型，让它们成为更精确的世

谷歌DeepMind团队深夜发布新AI开源模型Gemma；技术大神Karpathy离职OpenAI后发布教学视频

🦉AI新闻🚀谷歌DeepMind团队深夜发布新AI开源模型Gemma摘要：谷歌DeepMind团队于今日发布了一款名为Gemma的新型AI模型，该模型启发自Gemini，提供两个版本：Gemma2B和Gemma7B。这款模型支持Keras3.0和PyTorch等工具进行微调，可在性能较低的设备上运行，且性能超越竞品MetaLlama-2模型。为确保模型的安全性和可靠性，研究团队采用自动化技术过滤敏感数据，并通过大量微调及“强化学习”等手段提高模型的行为一致性。此外，对模型进行了“红队测试”和“自动对抗测试”以评估其能力，确保模型具有“负责任的特性”。Kaggle地址：https://www.k

DeepMind CEO专访：AI还没到拼算力的时候，谷歌优势在研发，智能体是下一个爆点

虽然谷歌的Gemini在开年的AI产品大战中没有获得太多的关注，但是GoogleDeepMind作为人类最前沿的AI机构，依然在抵达通用人工智能的道路上紧追OpenAI。最近，WIRED对DeepMind的负责人Hassabis进行了专访，聊了很多关于最近发布的产品，以及未来人工智能发展技术道路的问题，干货满满。在他看来，未来人工智能技术的发展，远远没有到只比拼算力和规模的程度，在基础构架，Agent等方面还有很多的想象空间。谷歌的优势在新技术的研发问：GeminiPro1.5能够处理的数据量远超前代产品。得益于一种叫做「MoE」的架构，它在同等规模下的能力也得到了增强。这些进步为什么重要？D

GPT-4、Gemini同时被曝重大缺陷，逻辑推理大翻车！DeepMind上交校友团队发现LLM严重降智

最近，谷歌DeepMind和斯坦福的研究人员发现：大模型在处理逻辑推理任务时，问题中信息呈现的顺序对模型的表现有着决定性的影响。论文地址：https://arxiv.org/abs/2402.08939具体来说，当信息按照逻辑上的自然顺序排列时，模型的表现会更好。这一发现不仅适用于一般的逻辑推理问题，对于数学问题也同样有效。比如，如果某个证明任务的条件是：1.如果A，那么B；2.如果B，那么C；3.A为真。要求大模型证明C为真，如果条件按照1，2，3的顺序呈现，那么大模型的成功率会比2，1，3的条件呈现顺序高出很多。所以，以后用大模型，言简意赅，符合逻辑地提出问题能让它性能更强。上图展示了一个

每日一看大模型新闻（2023.12.15-12.17）3D、视频直接扔进对话框，大模型掌握跨模态推理；PaLM 2数学性能暴涨6%！DeepMind新作力证「合成数据」是通往AGI关键；OpenAI：

1.产品发布1.1雅意2.0国产大模型发布发布时间：2023-12-15雅意2.0国产大模型发布支持多款国产算力硬件兼容_凤凰网主要内容：中科闻歌发布了雅意2.0，并公布了开源技术报告。雅意2.0的模型架构和代码都是自主研发的，可用于行业应用场景的自主训练和微调，并支持多款国产算力硬件兼容。雅意2.0拥有数据、模型、应用的全自主知识产权，基于240TB多源基础数据和2.65万亿Tokens高质量训练数据。此外，雅意2.0还升级了多项技能，包括多轮对话角色扮演、超长上下文输入、多模态能力、内容安全风控以及智能插件等。1.2视频重绘工具DomoAI不用SD视频一键就能转动漫发布时间：2023-12