近年来,人工智能在科研中的应用持续向纵深发展,同时也在不断扩张应用领域的广度,从蛋白质折叠到新材料发现,从疾病预测到预后诊疗,从天文探索到自然灾害分析……AIforScience多点开花的背后,一方面是国内外AI企业面向科学研究领域的研发,降低了AI工具的使用门槛;另一方面也是科研人员在接纳「AI帮手」的过程中,与其磨合出了高效的协作模式。Nature的一项分析显示,在Scopus数据库中,在标题或摘要中提到人工智能或人工智能相关关键词的论文比例,从十年前的2%上升到了现在的8%。然而,纵观以谷歌DeepMind为代表的科技大厂所发布的大模型等工具,以及海内外高校研究团队发表的相关研究成果,大
一周纵览本周硅谷大厂最值得关注的,是各家的大模型均有不少上新。OpenAI宣布了多项模型更新,同时发布了GPT-4Turbo预览模型,提升了代码生成能力。Google发布文本生成视频模型Lumiere,生成视频在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI的依赖。AdeptAI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和GeminiUltra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外,第四批国产AI大模型备案获批,14款大模型及产
你能找出哪个物体是假的么?项目demo效果非常惊艳,仔细看了之后又发现工作量很大,Pipeline很复杂,即使SupplementaryMaterial中补充了很多信息,但具体细节估计需要详细看代码才能清楚了。看文章的排版和挂到arxiv的时间,应该是投CVPR2024了,可以期待一下完整代码。摘要:实际视频模拟在从虚拟现实到电影制作的多样化应用中显示出巨大的潜力,特别是在现实世界环境中拍摄视频不切实际或成本过高的情况下。现有的视频模拟方法常常无法准确地模拟光照环境、表现物体几何形状或达到高水平的照片级真实感。在这篇论文中,提出了一个名为“任何物体在任何场景”(AnythinginAnySce
最近几年,基于Transformer的架构在多种任务上都表现卓越,吸引了世界的瞩目。使用这类架构搭配大量数据,得到的大型语言模型(LLM)等模型可以很好地泛化用于真实世界用例。尽管有如此成功,但基于Transformer的架构和LLM依然难以处理规划和推理任务。之前已有研究证明LLM难以应对多步规划任务或高阶推理任务。为了提升Transformer的推理和规划性能,近些年研究社区也提出了一些方法。一种最常见且有效的方法是模拟人类的思考过程:先生成中间「思维」,然后再输出响应。比如思维链(CoT)提示法就是鼓励模型预测中间步骤,进行按步骤的「思考」。思维树(ToT)则使用了分支策略和评判方法,让
扩散模型,迎来了一项重大新应用——像Sora生成视频一样,给神经网络生成参数,直接打入了AI的底层!这就是新加坡国立大学尤洋教授团队联合UCB、MetaAI实验室等机构最新开源的研究成果。具体来说,研究团队提出了一种用于生成神经网络参数的扩散模型p(arameter)-diff。用它来生成网络参数,速度比直接训练最多提高44倍,而且表现毫不逊色。这一模型一经发布,就迅速在AI社区引发强烈讨论,圈内人士对此的惊叹,毫不亚于普通人看到Sora时的反应。甚至有人直接惊呼,这基本上相当于AI在创造新的AI了。就连AI巨头LeCun看了之后,也点赞了这一成果,表示这真的是个cuteidea。而实质上,p
如果你有被Sora生成的视频震撼到,那你就已经见识过扩散模型在视觉生成方面的巨大潜力。当然,扩散模型的潜力并不止步于此,它在许多其它不同领域也有着让人期待的应用前景,更多案例可参阅机器之心不久前的报道《爆火Sora背后的技术,一文综述扩散模型的最新发展方向》。近日,来自新加坡国立大学的尤洋团队、加州大学伯克利分校、MetaAIResearch的一项新研究找到了扩散模型的一个新应用方向:用来生成神经网络的模型参数!论文地址:https://arxiv.org/pdf/2402.13144.pdf项目地址:https://github.com/NUS-HPC-AI-Lab/Neural-Netwo
最近,谷歌DeepMind和斯坦福的研究人员发现:大模型在处理逻辑推理任务时,问题中信息呈现的顺序对模型的表现有着决定性的影响。论文地址:https://arxiv.org/abs/2402.08939具体来说,当信息按照逻辑上的自然顺序排列时,模型的表现会更好。这一发现不仅适用于一般的逻辑推理问题,对于数学问题也同样有效。比如,如果某个证明任务的条件是:1.如果A,那么B;2.如果B,那么C;3.A为真。要求大模型证明C为真,如果条件按照1,2,3的顺序呈现,那么大模型的成功率会比2,1,3的条件呈现顺序高出很多。所以,以后用大模型,言简意赅,符合逻辑地提出问题能让它性能更强。上图展示了一个
2023年年底,很多人都预测,未来一年将是视频生成快速发展的一年。但出人意料的是,农历春节刚过,OpenAI就扔出了一个重磅炸弹——能生成1分钟流畅、逼真视频的Sora。它的出现让很多研究者担心:国内外AI技术的差距是不是又拉大了?根据OpenAI披露的技术报告,Sora的核心技术点之一是将视觉数据转化为patch的统一表示形式,并通过Transformer和扩散模型结合,展现了卓越的scale特性。无独有偶,最近发布的 StableDiffusion3 也采用了同样的架构。其实,这两项工作都是基于Sora核心研发成员WilliamPeebles和纽约大学计算机科学助理教授谢赛宁合著的一篇论文
标题:日志分析技能的匮乏——如何解决网络安全团队的难题引言随着网络攻击手段的日益多样化以及网络设备的复杂化,安全团队面临着越来越大的压力去理解和应对这些威胁.遗憾的是,许多组织的安全团队成员发现他们的技能和知识不足以有效地处理大量的网络数据:日志文件就是其中之一.本文将探讨日志分析所面临的问题、影响以及如何提高这方面的能力来解决这些问题.---目录1.为什么日志分析很重要?*1.1日志记录和收集的重要性*1.2日志分析的必要性*1.3日志分析为安全带来的好处2.常见的安全挑战及原因*2.1分析工具和方法的不成熟或缺乏准确性*2.2安全人员的时间和资源限制导致分析能力的下降*2.3对新出现恶意软
当你来到一个项目不规范的技术团队,你会怎么处理呢? 问题 Testing 流程不规范 没有需求评审和设计评审,需求经常是业务或者项目经理直接跟开发提,有时候开发自己都不明白需求,糊里糊涂地就要开发,也没有设计评审,开发想怎么设计就怎么设计,代码质量差。 有时候下游或者上游开发并没有接到需求,然后这边开发完给到测试,测试也一脸懵逼。 没有计划 上线时间不是根据开发和测试同学排期和评估来定,而是业务和项目经理说了算。 开发完了就跟测试同学说一声,有这么个需求,这个需求今晚/这周上线,你测一下,好像测试是个很随意的工作,并且每个任务给过来都说是紧急需求,测试时间也是不够的,导致测