SORA_草庐IT

世界模拟器才是AGI终局，12态势预测！首席专家万字长文专业解读Sora里程碑

这几天反复看Sora的技术报告，以及各方对Sora的技术分析。基本三个角度：惊呼强大功能，分析Sora（实现）大法，评估巨大冲击。冲击方面，主要关注点在于对影视、短视频、娱乐等领域的影响。但是，Sora改变AI认知方式，开启走向「世界模拟器」的史诗级的漫漫征途，才是未来暴风眼，真正的重点。而世界模拟器，是远比AGI、具身智能、元宇宙更炸裂的智能未来。Sora技术报告最有价值、最语焉不详、最容易产生不同理解的一句话是：「通过扩大视频生成模型的规模，我们有望构建出能够模拟物理世界的通用模拟器，这无疑是一条极具前景的发展道路」。而本文所述世界模拟器，与Sora目前自述以及业内理解，可能不太一样。很显

Sora为何出自OpenAI？一线员工作息时间线揭秘：我们疯狂地卷

为什么是OpenAI率先打造出了Sora？现在全世界不论研究员、工程师还是投资人都在问这个问题。最近几天，人们对于视频大模型Sora的讨论热度持续升高，信息早已破了圈，相关的投资热点都已经出现了两轮。Sora生成的「Flowertiger」视频。试问这种生成能力会催生多少新脑洞？在一篇文章中，加州大学伯克利分校计算机科学博士、知乎作者@SIY.Z分析了OpenAI成功的一些原因，包括：目标和商业模式明确：目标就是allinAGI，一切研究围绕着探索通往AGI的路径；商业模式就是SaaS，直接给API。方法论明确：包括Thebitterlesson（源自RichSutton的经典文章《苦涩的教训

出圈的Sora带火DiT，连登GitHub热榜，已进化出新版本SiT

虽然已经发布近一周时间，OpenAI视频生成大模型Sora的影响仍在继续！其中，Sora研发负责人之一BillPeebles与纽约大学助理教授谢赛宁撰写的DiT（扩散Transformer）论文《ScalableDiffusionModelswithTransformers》被认为是此次Sora背后的重要技术基础之一。该论文被ICCV2023接收。论文地址：https://arxiv.org/pdf/2212.09748v2.pdfGitHub地址：https://github.com/facebookresearch/DiT这两天，DiT论文和GitHub项目的热度水涨船高，重新收获大量关注

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

谷歌の“反击”来了！Gemini被Sora抢走的风头，现在有抢回来的势头了。在最新实测中，Gemini1.5能分析Sora视频是否AI生成。是直接给出当中关键因素的那种。比如这个经典的猫猫视频，Gemini1.5直言：它的眼睛和毛都看起来都不像是真的。还有像这段生成视频，Gemini1.5都能说出个一二三造假细节来~都说魔法打败魔法，结果Sora发布这才没几天，就火速被Gemini1.5“抓出现行”。对于Gemini1.5第一波实测结果，网友直呼：that’sscarygood，并称其为“游戏规则的改变者”。Gemini1.5第一波实测来了Gemini1.5版本突然发布，结果被对面Sora的光

被字节辟谣的中文版Sora，究竟厉害在哪里？

撰稿 |云昭出品|51CTO技术栈（微信号：blog51cto）近日，市场有消息称，在Sora引爆文生视频赛道之前，国内的字节跳动也推出了一款新型视频模型Boximator，与Gen-2、Pink1.0等既有模型相比，Boximator的独特之处在于，它能够通过文本输入精确地控制视频中人物或物体的运动。有媒体称将之称为中国版的Sora，对此，字节跳动相关人士回复称，Boximator是视频生成领域控制对象运动的技术方法研究项目，目前还无法作为完善的产品落地，距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。1、为何会被误解读成中文版Sora解析模型的厉害之处 Boxi

关于 OpenAI Sora，你所应该了解的

Hellofolks，我是Luga，今天我们继续来聊一下人工智能(AI)生态领域相关的技术-OpenAISora，本文将继续聚焦在针对OpenAISora的技术进行剖析，使得大家能够了解OpenAISora实现机制以便更好地对利用其进行应用及市场开发。在人工智能、大数据和云计算等技术迅猛发展的时代，虚拟现实、增强现实和元宇宙等新兴技术不断涌现。在这个背景下，OpenAI推出了名为"Sora"的创新力作，旨在重新定义内容创作、故事讲述以及信息共享的方式。通过基于文本到视频和视频到视频合成功能，OpenAI的Sora模型能够将文本描述转化为逼真的视频，并且能够编辑和修改现有的视频内容，生成全新的视

AI视频大模型Sora新视角：从介绍到商业价值，全面解读优势

关于作者还是大剑师兰特：曾是美国某知名大学计算机专业研究生，现为航空航海领域高级前端工程师；CSDN知名博主，GIS领域优质创作者，深耕openlayers、leaflet、mapbox、cesium，canvas，webgl，echarts等技术开发，欢迎加底部微信，一起交流。热门推荐内容链接1openlayers从基础到精通，300+代码示例2leaflet热门分解学习教程，150+图文示例3cesium从0到1学习指南，200+代码示例4mapboxGL从入门到实战，150+图文示例5canvas示例应用100+，揭密底层细节6javascript从基础到高级，示例展示200+7vue2

[OpenAI]继ChatGPT后发布的Sora模型原理与体验通道

前言前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家：https://www.captainbed.cn/zChatGPT体验地址文章目录前言OpenAI体验通道SpacetimeLatentPatches潜变量时空碎片,建构视觉语言系统扩散模型与DiffusionTransformer,组合成强大的信息提取器DiT应用于潜变量时空碎片，学习获得海量视频中时空碎片的动态关联Sora或Lumiere视频学习与生成的技术背后蕴含的原理分析SSM整体思维模型：sora最新关键词效果预览最快更新体验通道自媒体运营从入门到精通OpenAI体验通道ChatGPT体验地址Op

更乱了！已经有真人视频冒充Sora了，威尔·史密斯吃意大利面玩梗

今天，一个有关「威尔・史密斯吃意大利面」的视频正在社交媒体疯传。视频画面分为上下两段：上半段显示是「一年以前的AI视频」，下半段则显示「现在的AI视频」。众所周知，对于AI来说，生成「威尔・史密斯吃意大利面」的视频并不容易，人物的手、面条以及面条入口后的形变对于之前的AI来说都是很大的挑战，所以这一问题被很多人戏称为「视频生成界的图灵测试」。Runway、Pika等著名的视频生成AI都在这个问题上贡献了很多鬼畜素材。在OpenAI发布了Sora之后，也有人向「在线接单」的SamAltman发起了这一挑战，但Altman没有应战。但几天之后，一个疑似用Sora生成的「威尔・史密斯吃意大利面」视频

在Sora引爆视频生成时，Meta开始用Agent自动剪视频了，华人作者主导

这几天，AI视频领域异常地热闹，其中OpenAI推出的视频生成大模型Sora更是火出了圈。而在视频剪辑领域，AI尤其是大模型赋能的Agent也开始大显身手。随着自然语言被用来处理与视频剪辑相关的任务，用户可以直接传达自己的意图，从而不需要手动操作。但目前来看，大多数视频剪辑工具仍然严重依赖手动操作，并且往往缺乏定制化的上下文帮助。因此，用户只能自己处理复杂的视频剪辑问题。关键在于如何设计一个可以充当协作者、并在剪辑过程中不断协助用户的视频剪辑工具？在本文中，来自多伦多大学、Meta（RealityLabsResearch）、加州大学圣迭戈分校的研究者提出利用大语言模型（LLM）的多功能语言能力