OpenAI-gym_草庐IT

OpenAI今天刷屏的Sora视频模型，对未来影响几何？

从OpenAI在官网展示的Sora生成视频的效果来看，在生成视频质量、分辨率、文本语义还原、视频动作一致性、可控性、细节、色彩等方面非常好！特别是可以生成最长1分钟的视频！生成的画面可以很好的展现场景中的光影关系、各个物体间的物理遮挡、碰撞关系，并且镜头丝滑可变。超过Gen-2、SVD-XT、Pika等主流产品，一出手就是王炸。Sora简单介绍目前，文生视频领域因为帧间依赖处理、训练数据、算力资源、过拟合等原因，一直无法生成高质量的长视频。而Sora最大技术突破是，可以在保持质量的前提下，生成1分钟的视频，在业内非常罕见。这也再次展示了OpenAI在大模型领域超强的技术研发能力。Sora是一种

【中英双语】OpenAI Sora文本转视频模型的技术分析！全新的AI视频叙事时代即将到来！

大家好，我是木易，一个持续关注AI领域的互联网技术产品经理，国内Top2本科，美国Top10CS研究生，MBA。我坚信AI是普通人变强的“外挂”，所以创建了“AI信息Gap”这个公众号，专注于分享AI全维度知识，包括但不限于AI科普，AI工具测评，AI效率提升，AI行业洞察。关注我，AI之路不迷路，2024谷歌一起变强。一些结论统一的视觉数据表示：Sora模型将各种类型的视觉数据（包括不同持续时间、分辨率和宽高比的视频和图像）转换成统一的表示形式，即时空补丁，便于大规模训练。视频压缩网络：通过降低视觉数据的维度，Sora将原始视频转换为压缩的潜在表示，然后利用这一表示进行高效的视频生成。扩展变

每日一看大模型新闻（2023.12.15-12.17）3D、视频直接扔进对话框，大模型掌握跨模态推理；PaLM 2数学性能暴涨6%！DeepMind新作力证「合成数据」是通往AGI关键；OpenAI：

1.产品发布1.1雅意2.0国产大模型发布发布时间：2023-12-15雅意2.0国产大模型发布支持多款国产算力硬件兼容_凤凰网主要内容：中科闻歌发布了雅意2.0，并公布了开源技术报告。雅意2.0的模型架构和代码都是自主研发的，可用于行业应用场景的自主训练和微调，并支持多款国产算力硬件兼容。雅意2.0拥有数据、模型、应用的全自主知识产权，基于240TB多源基础数据和2.65万亿Tokens高质量训练数据。此外，雅意2.0还升级了多项技能，包括多轮对话角色扮演、超长上下文输入、多模态能力、内容安全风控以及智能插件等。1.2视频重绘工具DomoAI不用SD视频一键就能转动漫发布时间：2023-12

OpenAI工程师必备经典《苦涩的教训》，原来20多年前就有了原型

OpenAI推出视频生成模型Sora已经一周的时间了，热度不减，作者团队还在持续放出让人眼前一亮的视频。比如「一群爱冒险的小狗探索天空废墟的电影预告片」，Sora一次生成并自己完成剪辑。当然，一个个生动、逼真的AI视频让人们好奇为什么是OpenAI率先打造出了Sora并能够跑通所有AGI技术栈呢？这一问题在社交媒体上引发了热烈的讨论。其中，在一篇知乎文章中，加州大学伯克利分校计算机科学博士、作者@SIY.Z分析了OpenAI成功的一些方法论，他认为OpenAI的方法论就是通往AGI的方法论，并且该方法论构建在几个重要的「公理」之上，包括了Thebitterlesson、ScalingLaw和E

ChatGPT突然疯了，意外输出震惊网友！OpenAI官方回应：token预测是根源

ChatGPT突然疯了！失去理智！精神错乱！——一大批ChatGPT用户炸了锅。周二，「ChatGPT发疯」各种讨论话题纷纷刷榜Reddit，HN等各大社交平台。网友表示，「我收到了ChatGPT有史以来最诡异的回复」。随后，OpenAI官方确认了ChatGPT最新的bug，并已将其修复。ChatGPT疯了！！！ChatGPT究竟有多疯？回复幻觉垃圾，根本停不下来。显然GPT-4，已经出现了故障。还有人在线求助Altman。ChatGPT变疯，当然少不了马库斯的口水。他专门写了一篇文章来讲这件事。Reddit上r/ChatGPT板块下面，用户开始讨论ChatGPT的意外输出，「中风、精神错乱、

Sora创建病毒式视频全网疯转，OpenAI密谋推出TikTok竞品？专家猜测：这是计划的一部分

OpenAI，到底想用TikTok做什么？最近，大家都被TikTok上这堆Sora的视频闪到了。AI视频，已经天衣无缝地混入了人类世界。如果不特意说明，很难拿看出AI视频和真实视频的区别！图片才入驻TikTok几天，OpenAI的账号就已经涨粉13万。图片网友惊呼：创意行业中的每个人都被煮了！图片开始，OpenAI放出的视频，还是静音的。这段希腊海边的建筑，简直浑然天成，肉眼难以分辨是否是自然界的场景。图片看这栩栩如生的海底世界的珊瑚、鱼、海龟、海马……虽然还带着一股粗糙的折纸风，但已经自成一个体系了。所以，以后做视频还有人类什么事儿？图片在留言区里，有读者表示激烈反对：你这是在扼杀艺术。不过

OpenAI推出文本到视频AI生成器Sora

OpenAI推出了Sora，加入了文本到视频的人工智能内容生成竞赛。Sora可以根据用户的提示生成长达一分钟的视频。该公司展示了几段用Sora制作的令人印象深刻的视频，包括一名女子走在东京的街道上，以及淘金热时代加利福尼亚的历史镜头。目前推出的是面向公众的Sora预览版，但也可供特定群体使用，比如安全专家和创作者。该公司允许某些个人接触，以获得关于如何推进该模型以对创意专业人士最有帮助的反馈。总体发布日期尚未公布。该公司表示:“我们正在与‘红队’合作，‘红队’是错误信息、仇恨内容和偏见等领域的专家，他们将对该模型进行对抗性测试。”“我们还在开发一些工具来帮助检测误导性内容，比如检测分类器，它可

Karpathy离职OpenAI，首发2小时AI大课！从头开始构建GPT分词器

离职OpenAI的技术大神karpathy，终于上线了2小时的AI大课。——「让我们构建GPTTokenizer（分词器）」。其实，早在新课推出两天前，karpathy在更新的GitHub项目中，就预告了这件事。这个项目是minbpe——专为LLM分词中常用的BPE（字节对编码）算法创建最少、干净以及教育性的代码。目前，GitHub已经狂揽6.1k星，442个fork。项目地址：https://github.com/karpathy/minbpe网友：2小时课程含金量，相当于大学4年不得不说，karpathy新课发布依然吸引了业内一大波学者的关注。他总是可以把相当复杂的LLM概念，用非常好理解

Sora为何出自OpenAI？一线员工作息时间线揭秘：我们疯狂地卷

为什么是OpenAI率先打造出了Sora？现在全世界不论研究员、工程师还是投资人都在问这个问题。最近几天，人们对于视频大模型Sora的讨论热度持续升高，信息早已破了圈，相关的投资热点都已经出现了两轮。Sora生成的「Flowertiger」视频。试问这种生成能力会催生多少新脑洞？在一篇文章中，加州大学伯克利分校计算机科学博士、知乎作者@SIY.Z分析了OpenAI成功的一些原因，包括：目标和商业模式明确：目标就是allinAGI，一切研究围绕着探索通往AGI的路径；商业模式就是SaaS，直接给API。方法论明确：包括Thebitterlesson（源自RichSutton的经典文章《苦涩的教训

OpenAI员工自曝996作息表，网友：真正的卷不需要强迫

OpenAI也996，实锤了（doge）。思维链作者、从谷歌跳槽OpenAI的JasonWei刚刚分享了自己在OpenAI的一天：[9:00am] 起床[9:30am] 搭乘Waymo前往MissionSF，途中在Tartine买个牛油果吐司[9:45am] 背诵OpenAI范儿。向优化之神致敬。学习《TheBitterLession》（强化学习之父RichSutton著）[10:00am] 在GoogleMeet上开会，讨论如何在更多数据上训练更大的模型[11:00am] 敲代码，在更多数据上训练更大的模型。搭档是HyungWonChung[12:00pm] 去食堂吃午饭（纯素且无麸质）[1