RK3588+AI_草庐IT

十年内出现AGI？下一代Gemini能感知环境？DeepMind CEO哈萨比斯畅谈AI

「如果我们在未来十年内拥有类似AGI的系统，我不会感到惊讶。」GoogleDeepMind联合创始人和CEODemisHassabis近日在人工智能播客节目DwarkeshPodcast上如是说。在长达一个小时的节目中，Hassabis分享了自己对智能本质、强化学习、规模扩展和对齐、AGI、多模态等主题的看法。机器之心选择性地整理了其中的主要内容并进行了适当编辑以便阅读。智能的本质DwarkeshPatel：第一个问题：您有神经科学背景，那么您是怎么看待智能的？DemisHassabis：这个问题很有趣。智能非常宽泛，可普遍用于各种用途。我认为这说明对于大脑处理我们周围世界的方式，必然存在某种

微软 Windows 11 AI 助手 Copilot 获多项技能升级：支持插件、修改设置、自定义语音命令

3月2日消息，微软日前发布博客，宣布Windows11的AI助手 Copilot将获得多项技能提升。据介绍，这些新功能建立在Windows11PC键盘Copilot按键的基础上。微软更新了任务栏上的Copilot图标，以及带来停靠、取消停靠和调整Copilot窗口大小的功能。新插件借助Windows中的Copilot，用户将可以使用插件访问一些应用程序。比如Copilot搭配OpenTable插件，只需提示Copilot“创建一个健康的 8人晚宴菜单”。当用户准备采购时，Copilot的Instacart插件就可以帮助用户来购物。在接下来的一个月里，除了OpenTable和Instacart插

由于AI的爆火，黑客攻击将严重影响美国选举

美国联邦调查局（FBI）局长克里斯托弗·雷2月29日表示，由于人工智能和其他技术的进步，美国预计今年的选举将面临复杂多变的威胁。雷特意强调人工智能，认为“无论是复杂程度高低的外国黑客都更容易利用它来对选举产生恶意影响”。他指出，美国政府正不断担忧那些难以察觉且能塑造公众舆论的攻击，且这种行为正在加剧。但目前美国并未拿出外国政府直接影响选举结果的成功案例，雷建议FBI在今年分享有关其发现的威胁信息，他声称”作为情报专业人员，我们必须以具体的、基于证据的方式强调威胁，以便我们有效地武装我们的合作伙伴——特别是公众，抵御他们可能面临的各种外国影响行动。“2016年，美国指控俄罗斯特工试图通过窃取和泄

AI 网络蠕虫被曝光：能不断繁殖，发送垃圾邮件并窃取数据

3月3日消息，国际网络安全团队近日研发了新型AI蠕虫病毒，能够在生成式人工智能服务之间独立传播、窃取数据并通过电子邮件发送垃圾邮件。伴随着OpenAIChatGPT和GoogleGemini等生成式AI系统的快速发展，AI开始被应用于解决某个特定问题或者任务，例如创建日历项、订购某件物品等等。网络安全技术研究人员表明生成式AI存在漏洞，并将其命名为“MorrisII”。IT之家在这里简要介绍下这个名称的背景，Morris被认为是人类发现的第一个计算机蠕虫病毒，于1988年被发现，感染了超过6200台计算机，占当时连接到互联网的所有计算机的10%。“MorrisII”可以基于生成式AI，绕过了C

报告称“AI 威胁工作论”被夸大：因部署维护成本高，影响不会那么快、那么广

3月3日消息，MIT计算机科学与人工智能实验室（MITCSAIL）近日发布研究报告，表示现阶段人类并不需要担心AI会抢走其饭碗，两者之间并不存在严重冲突和影响。报告指出在媒体的广泛报道、用户的深入交流下，夸大了“AI威胁论”，实际上由于企业实施成本过高，在短期内并不会威胁到大部分工作。这项研究的共同作者、MITCSAIL研究员尼尔・汤普森（NeilThompson）表示：与近期很多相关研究一样，我们也发现人工智能在自动化任务方面具有巨大的潜力。但充足的证据表明，没有足够的动力和吸引力推动企业部署自动化，以替代现有人类工作岗位。也就是说“AI要抢人类饭碗”是一种夸大的说法，即便真的开始替代，整个

AI 替代人工编辑首战失败，维基百科不再视 CNET 媒体为可靠信源

3月2日消息，数秒内生成新闻文章，对于媒体行业来说固然是非常诱人的部署方案，但科技媒体CNET率先施行后并未赢得掌声，反而损害其声誉。维基百科有一个名为“可靠来源/常用来源”（ReliableSources/PerennialSources）的页面，其中列出了可信和可靠的新闻来源。CNET于2022年开始使用AI来生成部分文章，但因为文章中存在大量语法错误，且存在严重的抄袭行为，大幅损害了其声誉。面对负面评价和外界压力，CNET随后叫停了AI项目，并纠正了大量文章中的错误。维基百科的编辑们经过调查、投票判定，在2022年11月至2023年1月期间发表在CNET上的任何内容都应被视为“普遍不可靠

两张图2秒钟3D重建！这款AI工具火爆GitHub，网友：忘掉Sora

只需2张图片，无需测量任何额外数据——当当，一个完整的3D小熊就有了：这个名为DUSt3R的新工具，火得一塌糊涂，才上线没多久就登上GitHub热榜第二。有网友实测，拍两张照片，真的就重建出了他家的厨房，整个过程耗时不到2秒钟！（除了3D图，深度图、置信度图和点云图它都能一并给出）惊得这位朋友直呼：大伙先忘掉sora吧，这才是我们真正看得见摸得着的东西。实验显示，DUSt3R在单目/多视图深度估计以及相对位姿估计三个任务上，均取得SOTA。作者团队（来自芬兰阿尔托大学+NAVERLABS人工智能研究所欧洲分所）的“宣语”也是气势满满：我们就是要让天下没有难搞的3D视觉任务。所以，它是如何做到？

DeepMind CEO：LLM+树搜索就是AGI技术线路，AI科研依赖工程能力，闭源模型就是比开源安全

谷歌在2月之后突然切换到了996模式，不到一个月的时间抛出了5个模型。而DeepMindCEOHassabis本人也是四处为自家的产品站台，曝出了很多幕后的开发内幕。在他看来，虽然还需要技术突破，但是现在人类通往AGI之路已经出现。而DeepMind和谷歌Brain的合并，标志着AI技术发展已经进入了新的时代。问：DeepMind一直站在技术的前沿。比如像AlphaZero这样系统，内部的智能体能够经过一系列思考，达成最终目标。这是否意味着大型语言模型（LLM）也能够加入这种研究的行列呢？Hassabis：我个人认为，这是一个非常有潜力的方向。我们需要继续完善这些大型模型，让它们成为更精确的世

每个人想要的大模型，是真·智能的那种......这不，谷歌团队就做出来了一个强大的「读屏」AI。研究人员将其称为ScreenAI，是一种理解用户界面和信息图表的全新视觉语言模型。论文地址：https://arxiv.org/pdf/2402.04615.pdfScreenAI的核心是一种新的屏幕截图文本表示方法，可以识别UI元素的类型和位置。值得一提的是，研究人员使用谷歌语言模型PaLM2-S生成了合成训练数据，以训练模型回答关屏幕信息、屏幕导航和屏幕内容摘要的问题。举个栗子，比如打开一音乐APP页面，可以询问「有几首歌时长少于30秒」？ScreenAI便给出了简单的答案：1。再比如命令Scr

OpenAI、微软、英伟达…AI巨头牵手养育的Figure，是一家怎样的公司？

撰稿|伊风出品|51CTO技术栈（微信号：blog51cto）就在昨天，一家名不见经传的初创公司在OpenAI的官宣之下迅速走红。推出Sora之后，OpenAI的动作让业界变得越发敏感。图片万万没想到，这家“名不见经传”的初创公司竟然是Figure。Figure成立于25个月前，目前仅有80名员工，然而让大家大为吃惊的是“金主爸爸”们却占据着AI界的半壁江山。图片作为一家人工智能机器人公司，Figure致力于开发自主通用仿人机器人。2022年公司成立之时，Figure提出了一个雄心勃勃的目标，即在一年内制造出可以行走的双足机器人。对于人形机器人来说，流畅行走和实现简单的家务劳动一直是未能攻克的