草庐IT

谷歌发布AI视频生成器Lumiere,在生成可爱动物视频方面表现出色

1月26日消息,据外媒报道,谷歌公布了一款名为Lumiere的人工智能视频生成器,并在相关的预印本论文中称其为“逼真视频生成的时空扩散模型”。Lumiere在制作可爱动物在荒谬场景中的视频方面做得很好,比如穿旱冰鞋、开车或弹钢琴。根据谷歌的说法,Lumiere利用独特的架构一次生成视频的整个时间持续时间。或者,正如该公司所说,“我们引入了一种时空U-Net架构,通过模型中的一次传递,可以立即生成视频的整个时间持续时间。”这与现有的视频模型形成对比,现有的视频模型合成远距离关键帧,然后是时间超分辨率,这种方法本质上使全局时间一致性难以实现。”通俗地说,谷歌的技术旨在同时处理空间(视频中物体的位置

VS Code 1.86版本亮点介绍:强化窗口缩放自由度,引入AI语音助手与多文件差异编辑器"

微软于2月2日发布了VisualStudioCode(VSCode)1.86版本,此次更新带来了多项重要功能升级和改进,旨在提升开发者的使用体验与工作效率。一、窗口缩放功能优化与个性化设置微软在VisualStudioCode(VSCode)1.86版本中对窗口缩放功能进行了重大升级。此次更新引入了一个名为“window.zoomPerWindow”的全新默认设置选项,使得用户能够独立且灵活地调整每个活动窗口的缩放级别。这项改进赋予了开发者前所未有的自由度,可以根据自身需求和视觉舒适度,实现对不同窗口进行放大、缩小或重置缩放比例的操作,从而有效提升了编码环境的可定制性和用户体验。二、语音交互与

音频秒生全身虚拟人像,AI完美驱动面部肢体动作!UC伯克利Meta提出Audio2Photoreal

就在最近,Meta和UC伯克利联合提出了一种全新的虚拟人物形象生成的方法——直接根据音频生成全身人像,效果不仅逼真,还能模拟出原音频中包含的细节,比如手势、表情、情绪等等。图片论文地址:https://arxiv.org/abs/2401.01885话不多说,直接上图。图片可以看到,人像刷地一下就出来了,十分逼真。而且从上面的文字对话可以看到,就是在讲可以用音频生成虚拟人像这件事。讲者的手势动作真的像是在做讲解。音频到Avatar,一步!这个系统不光可以生成全身逼真的形象,人像还会根据二人互动的对话动态做出手势。给定语音音频后,音频会为一个人输出多种可能的手势动作,包括面部、身体和双手等部位。

美国博士小哥打败女友的AI男友!7页论文让LLM降智,训出「负分男友」成功挽回

女友爱上AI了,怎么破?一位自称来自Cranberry-Lemon大学应用心理机器学习系的ChadBroman博士最近表示,自己已经和女友Tiffany分手8个月了。虽然很享受单身的自由,但身边没有女友的日子,连玩快艇都少了很多滋味。他一直想找机会和女友复合,然而女友那里却有了自己的完美替代品——Chad-GPT。这个AI男友更聪明、更体贴,轻易赢得了Tiffany的芳心,看起来小哥没戏了。但是,决心用魔法打败魔法的小哥,开发出一种策略,通过错误标记正向和负向男友行为数据,战胜了AI聊天机器人。他把自己的情敌训练成了一个不及时回消息、多疑善妒的坏男友,让Tiffany和「他」的关系破裂了!这位

香港最大AI诈骗案!Deepfake换脸「英国CFO」,直接骗走公司2亿港币

这几天,古老的AI应用——「AI换脸」多次破圈,屡屡登上热搜。先是网上充斥的大量泰勒斯威夫特的「AI艳照」,逼得X(原推特)只能直接屏蔽了所有有关「TylorSwift」的搜索。而今天香港警方向社会公布了一起更离谱的诈骗案件:一家英国跨国企业的中国香港分公司,被骗子用伪造的「AI换脸」和AI音频合成的视频内容,冒充总公司的CFO,直接骗走了2亿港币!最高级的骗局,往往只需要最朴素的AI技术据称,这位香港分公司的员工收到了一封英国总部CFO的邮件,称总部正在计划一个「秘密交易」,需要将公司资金转到几个香港本地的账户中待用。而这个员工一开始并没有相信这封邮件的内容,认为是钓鱼诈骗邮件。但是骗子不断

智能代码:生成式 AI 在软件开发中的革命性角色

想象一下,在智能手机革命性地改变了我们的生活之后,现在轮到了生成式AI在软件开发领域掀起风暴。你知道吗,如果代码能自己编写自己,这将是多么惊人的一步?这就好比我们现在能轻松地用手机应用管理日常生活一样,生成式AI使软件开发变得前所未有的便捷。想象一下,你只需要向你的电脑描述你需要什么,然后坐看它为你变魔术似的编写出完美的代码。这不仅是对技术的一次飞跃,更是对我们创造和实现想法方式的彻底革命。自动化代码生成自动化代码生成就好比你有了一个隐形的编程助手。你只需告诉它你的想法,比如“我需要一个可以自动排序的程序”,然后坐等它把整段代码巧妙地呈现在你面前。这不仅大大加快了开发速度,还打破了传统编程的界

智能体AI Agent的极速入门:从ReAct、AutoGPT到AutoGen、QwenAgent、XAgent、MetaGPT

前言如这两天在微博上所说,除了已经在七月官网上线的AIGC模特生成系统外,我正在并行带多个项目组第二项目组,论文审稿GPT第2版的效果已经超过了GPT4,详见《七月论文审稿GPT第2版:用一万多条paper-review数据集微调LLaMA2最终反超GPT4》,预计今年4月份对外发布,且还在推进第2.5版第三项目组,RAG知识库问答,春节之前第一版即OK第四项目组,大模型机器人项目,目前正在推进对斯坦福mobilealoha的复现第五项目组,便是本文要涉及的Agent项目,目前先做一系列技术调研(故而有的本文),3月份会公布我们的产品形态这些项目只要不断推进可以做的很大,且最终大家能做出结果,

从互联网到云计算再到 AI 原生,百度智能云数据库的演进

1  数据库行业发展概述如果说今年科技圈什么最火,我估计大家会毫不犹豫选择ChatGPT。ChatGPT是2022年11月30日由OpenAI发布的聊天应用。它创造了有史以来用户增长最快的纪录:自11月30日发布起,5天就拥有了100万活跃用户,两个月就达到了一亿用户。对比其他热门应用,同样达到一亿用户量级,TikTok花了九个月,而像Instagram,Whatsapp等应用则超过了两年时间。ChatGPT的爆火,瞬间点燃了整个AIGC赛道。最关键的原因在于,它让大家看到了弱人工智能向强人工智能的跨越式发展。英伟达CEO黄仁勋对此评价:ChatGPT相当于AI界的iPhone时刻。现在业界统

2024年数学建模美赛能用chatGPT之类的AI吗?官方给了明确规定!

这两年chatGPT等大语言模型火了,能对话,自然也能回答数学建模方面的问题。那美赛能不能用这些AI呢?2024年美赛官方对chatGPT等的使用做出了明确的规定(其中的VI.ContestInstructions部分):https://www.contest.comap.com/undergraduate/contests/mcm/instructions.php官方说明是全英文的,其中针对AI使用的规定,在这帮大家总结翻译一下:参加比赛时可以用AI,如果用了的话,需要在论文末尾添加一个名为“ReportonUseofAI”的新部分。这个新部分没有页数限制,不会被计算在25页的论文页数限制中

新型生成式 AI 助手 Amazon Q(预览版)上线

今天,我们宣布推出AmazonQ,这是一种新型的生成式人工智能助手,专门用于满足办公场景需要,可以根据客户业务进行定制。客户可以使用AmazonQ进行对话、解决问题、生成内容、获取见解并采取行动,所有这些都基于客户自身的信息存储库、代码、数据和企业系统。AmazonQ为员工提供即时、相关的信息和建议,帮助他们简化任务、加速决策和解决问题,并帮助激发工作中的创造力和创新能力。AmazonQ为用户提供定制化方案,用户可以根据产品使用方式定制功能、定价和选项。AmazonQ可以根据企业既有的人员、角色和权限对每位用户交互进行个性化定制。亚马逊云科技绝不会使用客户内容来训练底层模型。也就是说,亚马逊云