草庐IT

OpenAI-gym

全部标签

OpenAI今天刷屏的Sora视频模型,对未来影响几何?

从OpenAI在官网展示的Sora生成视频的效果来看,在生成视频质量、分辨率、文本语义还原、视频动作一致性、可控性、细节、色彩等方面非常好!特别是可以生成最长1分钟的视频!生成的画面可以很好的展现场景中的光影关系、各个物体间的物理遮挡、碰撞关系,并且镜头丝滑可变。超过Gen-2、SVD-XT、Pika等主流产品,一出手就是王炸。Sora简单介绍目前,文生视频领域因为帧间依赖处理、训练数据、算力资源、过拟合等原因,一直无法生成高质量的长视频。而Sora最大技术突破是,可以在保持质量的前提下,生成1分钟的视频,在业内非常罕见。这也再次展示了OpenAI在大模型领域超强的技术研发能力。Sora是一种

【中英双语】OpenAI Sora文本转视频模型的技术分析!全新的AI视频叙事时代即将到来!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2024谷歌一起变强。一些结论统一的视觉数据表示:Sora模型将各种类型的视觉数据(包括不同持续时间、分辨率和宽高比的视频和图像)转换成统一的表示形式,即时空补丁,便于大规模训练。视频压缩网络:通过降低视觉数据的维度,Sora将原始视频转换为压缩的潜在表示,然后利用这一表示进行高效的视频生成。扩展变

每日一看大模型新闻(2023.12.15-12.17)3D、视频直接扔进对话框,大模型掌握跨模态推理;PaLM 2数学性能暴涨6%!DeepMind新作力证「合成数据」是通往AGI关键;OpenAI:

1.产品发布1.1雅意2.0国产大模型发布发布时间:2023-12-15雅意2.0国产大模型发布支持多款国产算力硬件兼容_凤凰网主要内容:中科闻歌发布了雅意2.0,并公布了开源技术报告。雅意2.0的模型架构和代码都是自主研发的,可用于行业应用场景的自主训练和微调,并支持多款国产算力硬件兼容。雅意2.0拥有数据、模型、应用的全自主知识产权,基于240TB多源基础数据和2.65万亿Tokens高质量训练数据。此外,雅意2.0还升级了多项技能,包括多轮对话角色扮演、超长上下文输入、多模态能力、内容安全风控以及智能插件等。1.2视频重绘工具DomoAI不用SD视频一键就能转动漫发布时间:2023-12

OpenAI工程师必备经典《苦涩的教训》,原来20多年前就有了原型

OpenAI推出视频生成模型Sora已经一周的时间了,热度不减,作者团队还在持续放出让人眼前一亮的视频。比如「一群爱冒险的小狗探索天空废墟的电影预告片」,Sora一次生成并自己完成剪辑。当然,一个个生动、逼真的AI视频让人们好奇为什么是OpenAI率先打造出了Sora并能够跑通所有AGI技术栈呢?这一问题在社交媒体上引发了热烈的讨论。其中,在一篇知乎文章中,加州大学伯克利分校计算机科学博士、作者@SIY.Z分析了OpenAI成功的一些方法论,他认为OpenAI的方法论就是通往AGI的方法论,并且该方法论构建在几个重要的「公理」之上,包括了Thebitterlesson、ScalingLaw和E

ChatGPT突然疯了,意外输出震惊网友!OpenAI官方回应:token预测是根源​

ChatGPT突然疯了!失去理智!精神错乱!——一大批ChatGPT用户炸了锅。周二,「ChatGPT发疯」各种讨论话题纷纷刷榜Reddit,HN等各大社交平台。网友表示,「我收到了ChatGPT有史以来最诡异的回复」。随后,OpenAI官方确认了ChatGPT最新的bug,并已将其修复。ChatGPT疯了!!!ChatGPT究竟有多疯?回复幻觉垃圾,根本停不下来。显然GPT-4,已经出现了故障。还有人在线求助Altman。ChatGPT变疯,当然少不了马库斯的口水。他专门写了一篇文章来讲这件事。Reddit上r/ChatGPT板块下面,用户开始讨论ChatGPT的意外输出,「中风、精神错乱、

Sora创建病毒式视频全网疯转,OpenAI密谋推出TikTok竞品?专家猜测:这是计划的一部分

OpenAI,到底想用TikTok做什么?最近,大家都被TikTok上这堆Sora的视频闪到了。AI视频,已经天衣无缝地混入了人类世界。如果不特意说明,很难拿看出AI视频和真实视频的区别!图片才入驻TikTok几天,OpenAI的账号就已经涨粉13万。图片网友惊呼:创意行业中的每个人都被煮了!图片开始,OpenAI放出的视频,还是静音的。这段希腊海边的建筑,简直浑然天成,肉眼难以分辨是否是自然界的场景。图片看这栩栩如生的海底世界的珊瑚、鱼、海龟、海马……虽然还带着一股粗糙的折纸风,但已经自成一个体系了。所以,以后做视频还有人类什么事儿?图片在留言区里,有读者表示激烈反对:你这是在扼杀艺术。不过

OpenAI推出文本到视频AI生成器Sora

OpenAI推出了Sora,加入了文本到视频的人工智能内容生成竞赛。Sora可以根据用户的提示生成长达一分钟的视频。该公司展示了几段用Sora制作的令人印象深刻的视频,包括一名女子走在东京的街道上,以及淘金热时代加利福尼亚的历史镜头。目前推出的是面向公众的Sora预览版,但也可供特定群体使用,比如安全专家和创作者。该公司允许某些个人接触,以获得关于如何推进该模型以对创意专业人士最有帮助的反馈。总体发布日期尚未公布。该公司表示:“我们正在与‘红队’合作,‘红队’是错误信息、仇恨内容和偏见等领域的专家,他们将对该模型进行对抗性测试。”“我们还在开发一些工具来帮助检测误导性内容,比如检测分类器,它可

Karpathy离职OpenAI,首发2小时AI大课!从头开始构建GPT分词器

离职OpenAI的技术大神karpathy,终于上线了2小时的AI大课。——「让我们构建GPTTokenizer(分词器)」。其实,早在新课推出两天前,karpathy在更新的GitHub项目中,就预告了这件事。这个项目是minbpe——专为LLM分词中常用的BPE(字节对编码)算法创建最少、干净以及教育性的代码。目前,GitHub已经狂揽6.1k星,442个fork。项目地址:https://github.com/karpathy/minbpe网友:2小时课程含金量,相当于大学4年不得不说,karpathy新课发布依然吸引了业内一大波学者的关注。他总是可以把相当复杂的LLM概念,用非常好理解

Sora为何出自OpenAI?一线员工作息时间线揭秘:我们疯狂地卷

为什么是OpenAI率先打造出了Sora?现在全世界不论研究员、工程师还是投资人都在问这个问题。最近几天,人们对于视频大模型Sora的讨论热度持续升高,信息早已破了圈,相关的投资热点都已经出现了两轮。Sora生成的「Flowertiger」视频。试问这种生成能力会催生多少新脑洞?在一篇文章中,加州大学伯克利分校计算机科学博士、知乎作者@SIY.Z分析了OpenAI成功的一些原因,包括:目标和商业模式明确:目标就是allinAGI,一切研究围绕着探索通往AGI的路径;商业模式就是SaaS,直接给API。方法论明确:包括Thebitterlesson(源自RichSutton的经典文章《苦涩的教训

OpenAI员工自曝996作息表,网友:真正的卷不需要强迫

OpenAI也996,实锤了(doge)。思维链作者、从谷歌跳槽OpenAI的JasonWei刚刚分享了自己在OpenAI的一天:[9:00am] 起床[9:30am] 搭乘Waymo前往MissionSF,途中在Tartine买个牛油果吐司[9:45am] 背诵OpenAI范儿。向优化之神致敬。学习《TheBitterLession》(强化学习之父RichSutton著)[10:00am] 在GoogleMeet上开会,讨论如何在更多数据上训练更大的模型[11:00am] 敲代码,在更多数据上训练更大的模型。搭档是HyungWonChung[12:00pm] 去食堂吃午饭(纯素且无麸质)[1