草庐IT

RK3588+AI

全部标签

怒斥Sora之后,LeCun放出「视觉世界模型」论文,揭示AI学习物理世界的关键​

Sora的发布让整个AI领域为之狂欢,但LeCun是个例外。面对OpenAI源源不断放出的Sora生成视频,LeCun热衷于寻找其中的失误:归根结底,LeCun针对的不是Sora,而是OpenAI从ChatGPT到Sora一致采用的自回归生成式路线。LeCun一直认为,GPT系列LLM模型所依赖的自回归学习范式对世界的理解非常肤浅,远远比不上真正的「世界模型」。所以,一遇到「Sora是世界模型」的说法,LeCun就有些坐不住:「仅仅根据prompt生成逼真视频并不能代表一个模型理解了物理世界,生成视频的过程与基于世界模型的因果预测完全不同。」那么,面对视觉任务,世界模型如何获得自回归模型一般的

0.5秒,无需GPU,Stability AI与华人团队VAST开源单图生成3D模型TripoSR

最近,文生视频模型Sora掀起了新一轮生成式AI模型浪潮,模型的多模态能力引起广泛关注。现在,AI模型在3D内容生成方面又有了新突破。专长于视觉内容生成的 StabilityAI继图片生成(StableDifussion3上线)、视频生成(StableVideo上线)后紧接在3D领域发力,今天宣布携手华人团队VAST开源单图生成3D模型TripoSR。TripoSR能够在0.5s的时间内由单张图片生成高质量的3D模型,甚至无需GPU即可运行。TripoSR模型代码:https://github.com/VAST-AI-Research/TripoSRTripoSR模型权重:https://hu

生成式AI即将进入交通运输行业,你准备好了吗?

交通运输业是一个多式联运的全球人员与货物运输网络体系,总价值高达10万亿美元。但现如今,该行业正面临一系列外部与自身内部挑战:补贴、网络碎片化、运输方式竞争,以及日益严重的拥堵、排放、安全等等。过时的政府政策导致效率低下,传统的技术方法虽在特定地区取得了渐进式发展,但仍未实现广泛转变。这在一定程度上源自交通运输行业的固有局限,同时在很大程度上也受到公众观点及行为模式转变带来的冲击。整个交通运输行业当前可谓是一团乱麻——从兴奋到沮丧,再由便捷到成本,竟让人不知该如何下手。因此,引导政策变化与技术进步已经构成严峻挑战,要求决策者和从业企业在努力缓解公众交通成本负担的同时(事实证明,交通成本往往在家

Gen AI对下一代交通领域的影响

下一代交通依赖于电子、可持续性和体验作为其设计的核心,GenAI对设想的下一代交通生态系统的每种模式都有影响。市场有五个特定的重点领域:EV(电动汽车)、AV(自动驾驶汽车)、Micromobility(第一英里连接)、Hyperloops(超高速公共交通)和UAM(城市空中交通)。有许多演变和变化,例如eVOLT(电动垂直起飞和着陆)或用于交通控制管理的集成信号。有许多领域正在不断发展,例如多式联运集成(无缝路线集成)、可持续性(车辆设计)、连接性和自动化(交通管理、替代方案)、共享移动性(资源共享和减少车辆足迹)。交通运输领域的转型为GenAI作为原生技术的重要组成部分提供了无限的机会。G

2024 年 AI 辅助研发趋势:从研发数字化到 AI + 开发工具 2.0,不止于 Copilot

在上一年里,已经有不少的企业在工具链上落地了生成式AI,结合我们对于这些企业的分析,以及最近在国内的一些“新技术”趋势,诸如于鸿蒙原生应用的初步兴起。从这些案例与趋势中,我们也看到了一些新的可能方向。结合我们在LLMas-Copilot,LLMas-Integrator,LLMas-Facilitator的三阶段框架,以及我们内部的分析材料,我大体将其总结为6个趋势:从单角色辅助到端到端辅助。辅助决策的知识管理。AI应用的DevOps设施。线上故障定位和问题解决。AI辅助UI设计的涌向。代码翻译与系统间翻译。其中的部分知识几乎是我们先前达到一致的,所以让我们反过来来讲述这个故事。0.生成式AI

大数据AI人工智能的挑战与解决:如何应对技术限制

1.背景介绍大数据和人工智能(AI)是当今最热门的技术趋势之一,它们在各个领域都取得了显著的成果。然而,这些技术也面临着一系列挑战,这篇文章将探讨这些挑战以及如何应对它们。大数据是指由于互联网、移动互联网、物联网等技术的发展,产生的数据量巨大、多样性高、速度极快的数据。这些数据可以帮助企业和组织更好地了解客户需求、优化业务流程、提高效率、降低成本等。然而,大数据的挑战在于数据的存储、处理、分析和安全等方面,需要大量的计算资源和专业知识来解决。人工智能则是指通过模拟人类智能的方式,使计算机能够进行自主决策和学习等能力。人工智能的主要技术包括机器学习、深度学习、自然语言处理、计算机视觉等。然而,人

考研保研提问助手-AI辅助面试复习

功能说明对用户提供的整理好的简历信息,进行多层次、难度梯度明显、递进式提问对话流程是用户友好型,接近选择题模式。快速提出上百个问题,帮助考研保研人复习时发散思维充分利用大语言模型的特点,适用于所有专业直达智能体提问展示计算机在使用社交媒体平台时,如何应用数据结构和算法来优化用户信息的搜索和推荐功能?考虑到操作系统的资源管理,如何在多任务环境下保证系统的高效运行和稳定性?在网络安全领域,如何利用计算机网络的知识来设计和实施有效的防御策略,以防止网络攻击和数据泄露?在电子商务平台中,数据库系统如何支持大规模数据的存储、查询和管理?软件工程的方法论如何应用于大型软件项目的开发,以确保软件质量和项目进

使用搭载骁龙 8 Gen 3 的安卓手机运行 AI 大模型

本篇文章聊聊,在Android手机上简单运行AI大模型的方法,来体验英文语言模型(Llama27B、Mistral7B、RedPajama3B、GoogleGemma2B、MicrosoftPHI2B);中文语言模型(面壁MiniCPM、多模态模型);StableDiffusion。写在前面从去年下半年开始,各种手机和芯片厂商都开始宣称自己的产品能够本地运行大模型。但是直到前几天,高通才正式在HuggingFace上传了“高通版本”的StableDiffusion。而目前一众厂商,有一个是一个,都还在“内测或内测审核”,给本来清清楚楚简简单单的模型运行,遮上了一层厚厚的纱。不过,这里有一点限制

【大厂AI课学习笔记】1.5 AI技术领域(2)语音识别

今天来梳理语音识别相关的关键技术和发展脉络。语音识别:定义、关键技术、技术发展、应用场景与商业化成功一、语音识别的定义语音识别,也称为自动语音识别(ASR),是指将人类的语音转换为机器可读的文本或命令的技术。它是人机交互的重要组成部分,旨在让计算机能够理解并执行人类的语音指令。语音识别技术涉及到信号处理、模式识别、自然语言处理等多个领域的知识。二、关键技术信号处理和特征提取:语音信号是一种复杂的时变信号,包含丰富的信息。信号处理的目标是从原始语音信号中提取出有用的特征,如梅尔频率倒谱系数(MFCC)等,以便后续的分类和识别。声学模型:声学模型是语音识别中的关键部分,它描述了语音信号与文本之间的

AI写作软件哪个好用:这6款你一定要知道

AI写作软件哪个好用:这6款你一定要知道这些工具不仅可以快速生成高质量的文本内容,还可以根据用户的需求进行个性化定制。它们可以帮助我们节省大量的时间和精力,让我们更加专注于创意和细节的打磨。本文将为大家详细介绍几个AI写作工具,让你在写作领域更上一层楼。1.红桃写作这是一个微信公众号面向专业写作领域的ai写作工具,写作助手包括,ai论文,ai开题报告、ai公文写作、ai商业计划书、文献综述、ai生成、ai文献推荐、AI论文摘要,帮助用户在线快速生成。写作主打简单、易操作,200+写作模板,小白也能快速上手。只要输入简单的要求和描述,就能自动生成各种高质量文稿内容。写作功能特色:多场景写作模板,