AI_草庐IT

AI 替代人工编辑首战失败，维基百科不再视 CNET 媒体为可靠信源

3月2日消息，数秒内生成新闻文章，对于媒体行业来说固然是非常诱人的部署方案，但科技媒体CNET率先施行后并未赢得掌声，反而损害其声誉。维基百科有一个名为“可靠来源/常用来源”（ReliableSources/PerennialSources）的页面，其中列出了可信和可靠的新闻来源。CNET于2022年开始使用AI来生成部分文章，但因为文章中存在大量语法错误，且存在严重的抄袭行为，大幅损害了其声誉。面对负面评价和外界压力，CNET随后叫停了AI项目，并纠正了大量文章中的错误。维基百科的编辑们经过调查、投票判定，在2022年11月至2023年1月期间发表在CNET上的任何内容都应被视为“普遍不可靠

两张图2秒钟3D重建！这款AI工具火爆GitHub，网友：忘掉Sora

只需2张图片，无需测量任何额外数据——当当，一个完整的3D小熊就有了：这个名为DUSt3R的新工具，火得一塌糊涂，才上线没多久就登上GitHub热榜第二。有网友实测，拍两张照片，真的就重建出了他家的厨房，整个过程耗时不到2秒钟！（除了3D图，深度图、置信度图和点云图它都能一并给出）惊得这位朋友直呼：大伙先忘掉sora吧，这才是我们真正看得见摸得着的东西。实验显示，DUSt3R在单目/多视图深度估计以及相对位姿估计三个任务上，均取得SOTA。作者团队（来自芬兰阿尔托大学+NAVERLABS人工智能研究所欧洲分所）的“宣语”也是气势满满：我们就是要让天下没有难搞的3D视觉任务。所以，它是如何做到？

DeepMind CEO：LLM+树搜索就是AGI技术线路，AI科研依赖工程能力，闭源模型就是比开源安全

谷歌在2月之后突然切换到了996模式，不到一个月的时间抛出了5个模型。而DeepMindCEOHassabis本人也是四处为自家的产品站台，曝出了很多幕后的开发内幕。在他看来，虽然还需要技术突破，但是现在人类通往AGI之路已经出现。而DeepMind和谷歌Brain的合并，标志着AI技术发展已经进入了新的时代。问：DeepMind一直站在技术的前沿。比如像AlphaZero这样系统，内部的智能体能够经过一系列思考，达成最终目标。这是否意味着大型语言模型（LLM）也能够加入这种研究的行列呢？Hassabis：我个人认为，这是一个非常有潜力的方向。我们需要继续完善这些大型模型，让它们成为更精确的世

每个人想要的大模型，是真·智能的那种......这不，谷歌团队就做出来了一个强大的「读屏」AI。研究人员将其称为ScreenAI，是一种理解用户界面和信息图表的全新视觉语言模型。论文地址：https://arxiv.org/pdf/2402.04615.pdfScreenAI的核心是一种新的屏幕截图文本表示方法，可以识别UI元素的类型和位置。值得一提的是，研究人员使用谷歌语言模型PaLM2-S生成了合成训练数据，以训练模型回答关屏幕信息、屏幕导航和屏幕内容摘要的问题。举个栗子，比如打开一音乐APP页面，可以询问「有几首歌时长少于30秒」？ScreenAI便给出了简单的答案：1。再比如命令Scr

OpenAI、微软、英伟达…AI巨头牵手养育的Figure，是一家怎样的公司？

撰稿|伊风出品|51CTO技术栈（微信号：blog51cto）就在昨天，一家名不见经传的初创公司在OpenAI的官宣之下迅速走红。推出Sora之后，OpenAI的动作让业界变得越发敏感。图片万万没想到，这家“名不见经传”的初创公司竟然是Figure。Figure成立于25个月前，目前仅有80名员工，然而让大家大为吃惊的是“金主爸爸”们却占据着AI界的半壁江山。图片作为一家人工智能机器人公司，Figure致力于开发自主通用仿人机器人。2022年公司成立之时，Figure提出了一个雄心勃勃的目标，即在一年内制造出可以行走的双足机器人。对于人形机器人来说，流畅行走和实现简单的家务劳动一直是未能攻克的

怒斥Sora之后，LeCun放出「视觉世界模型」论文，揭示AI学习物理世界的关键

Sora的发布让整个AI领域为之狂欢，但LeCun是个例外。面对OpenAI源源不断放出的Sora生成视频，LeCun热衷于寻找其中的失误：归根结底，LeCun针对的不是Sora，而是OpenAI从ChatGPT到Sora一致采用的自回归生成式路线。LeCun一直认为，GPT系列LLM模型所依赖的自回归学习范式对世界的理解非常肤浅，远远比不上真正的「世界模型」。所以，一遇到「Sora是世界模型」的说法，LeCun就有些坐不住：「仅仅根据prompt生成逼真视频并不能代表一个模型理解了物理世界，生成视频的过程与基于世界模型的因果预测完全不同。」那么，面对视觉任务，世界模型如何获得自回归模型一般的

0.5秒，无需GPU，Stability AI与华人团队VAST开源单图生成3D模型TripoSR

最近，文生视频模型Sora掀起了新一轮生成式AI模型浪潮，模型的多模态能力引起广泛关注。现在，AI模型在3D内容生成方面又有了新突破。专长于视觉内容生成的 StabilityAI继图片生成（StableDifussion3上线）、视频生成（StableVideo上线）后紧接在3D领域发力，今天宣布携手华人团队VAST开源单图生成3D模型TripoSR。TripoSR能够在0.5s的时间内由单张图片生成高质量的3D模型，甚至无需GPU即可运行。TripoSR模型代码：https://github.com/VAST-AI-Research/TripoSRTripoSR模型权重：https://hu

生成式AI即将进入交通运输行业，你准备好了吗？

交通运输业是一个多式联运的全球人员与货物运输网络体系，总价值高达10万亿美元。但现如今，该行业正面临一系列外部与自身内部挑战：补贴、网络碎片化、运输方式竞争，以及日益严重的拥堵、排放、安全等等。过时的政府政策导致效率低下，传统的技术方法虽在特定地区取得了渐进式发展，但仍未实现广泛转变。这在一定程度上源自交通运输行业的固有局限，同时在很大程度上也受到公众观点及行为模式转变带来的冲击。整个交通运输行业当前可谓是一团乱麻——从兴奋到沮丧，再由便捷到成本，竟让人不知该如何下手。因此，引导政策变化与技术进步已经构成严峻挑战，要求决策者和从业企业在努力缓解公众交通成本负担的同时(事实证明，交通成本往往在家

Gen AI对下一代交通领域的影响

下一代交通依赖于电子、可持续性和体验作为其设计的核心，GenAI对设想的下一代交通生态系统的每种模式都有影响。市场有五个特定的重点领域：EV(电动汽车)、AV(自动驾驶汽车)、Micromobility(第一英里连接)、Hyperloops(超高速公共交通)和UAM(城市空中交通)。有许多演变和变化，例如eVOLT(电动垂直起飞和着陆)或用于交通控制管理的集成信号。有许多领域正在不断发展，例如多式联运集成(无缝路线集成)、可持续性(车辆设计)、连接性和自动化(交通管理、替代方案)、共享移动性(资源共享和减少车辆足迹)。交通运输领域的转型为GenAI作为原生技术的重要组成部分提供了无限的机会。G

2024 年 AI 辅助研发趋势：从研发数字化到 AI + 开发工具 2.0，不止于 Copilot

在上一年里，已经有不少的企业在工具链上落地了生成式AI，结合我们对于这些企业的分析，以及最近在国内的一些“新技术”趋势，诸如于鸿蒙原生应用的初步兴起。从这些案例与趋势中，我们也看到了一些新的可能方向。结合我们在LLMas-Copilot，LLMas-Integrator，LLMas-Facilitator的三阶段框架，以及我们内部的分析材料，我大体将其总结为6个趋势：从单角色辅助到端到端辅助。辅助决策的知识管理。AI应用的DevOps设施。线上故障定位和问题解决。AI辅助UI设计的涌向。代码翻译与系统间翻译。其中的部分知识几乎是我们先前达到一致的，所以让我们反过来来讲述这个故事。0.生成式AI