草庐IT

何恺明团队12页论文新作剑指AIGC!“新CLIP”只需一个trick,训练速度快3.7倍!性能不降反升...

杨净艳艳发自凹非寺量子位|公众号QbitAI何恺明团队又上新了。这次,他们的成果围绕当下最火的AIGC背后的CLIP展开。——只在该模型的极简结构上,施加了一个简单的mask,就让新模型的速度快了3.7倍。同时,性能还可以做到不降反升。团队表示,希望他们的工作能帮助未来视觉语言模型实现规模化。这波,让大家直呼:不愧是何恺明,还是熟悉的味道啊~是的,还是“大道至简”的feel。就连论文也一如既往,短短12页,一行公式也没有。一起来拜读吧。引入类似MAE的mask本文提出了一个用来训练CLIP的快速、简单且有效的方法FLIP。FastLanguage-ImagePre-training(快速文本-

c - TCP 套接字缓冲区大小也应该是连接 MSS 的偶数倍

《unix网络编程》中有一段话是这样说的:Toavoidwastingpotentialbufferspace,theTCPsocketbuffersizesshouldalsobeanevenmultipleoftheMSSfortheconnection.Someimplementationshandlethisdetailfortheapplication,roundingupthesocketbuffersizeaftertheconnectionisestablished(p.902ofTCPv2).Thisisanotherreasontosetthesetwosocket

GPT-4终结人工标注!AI标注比人类标注效率高100倍,成本仅1/7

大模型满天飞的时代,AI行业最缺的是什么?毫无疑问一定是算(xian)力(ka)。老黄作为AI掘金者唯一的「铲子供应商」,早已赚得盆满钵满。除了GPU,还有什么是训练一个高效的大模型必不可少且同样难以获取的资源?高质量的数据。OpenAI正是借助基于人类标注的数据,才一举从众多大模型企业中脱颖而出,让ChatGPT成为了大模型竞争中阶段性的胜利者。但同时,OpenAI也因为使用非洲廉价的人工进行数据标注,被各种媒体口诛笔伐。时代周刊报道OpenAI雇佣肯尼亚廉价劳动力标注而那些参与数据标注的工人们,也因为长期暴露在有毒内容中,受到了不可逆的心理创伤。卫报报道肯尼亚劳工指责数据标注工作给自己带来

大模型生成提速2倍!单GPU几小时搞定微调,北大数院校友共同一作丨开源

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。只需给大模型“加点小零件”,推理速度立刻提升2倍!不需要额外训练一个模型,也不需要对计算硬件做优化,单张A100最快几小时就能微调完成。这项新研究名叫Medusa(美杜莎),来自普林斯顿、UIUC、CMU和康涅狄格大学,FlashAttention作者TriDao也在其中。目前,它已经成功部署到伯克利70亿参数的“骆马”Vicuna中,后续还会支持其他大模型,已经登上GitHub热榜:但其实,在这种方法推出之前,业界并非没有大模型推理加速方法,主流的就是DeepMind推出的投机采样(speculativedecodi

C#使用FFMpeg.Autogen进行rtsp视频倍速播放

1.在你的C#项目中,使用NuGet包管理器安装FFMpeg.Autogen。可以在VisualStudio中打开NuGet包管理器控制台,并运行以下命令来安装它:Install-PackageFFMpeg.Autogen2.在代码引入命名空间:usingFFMpeg.AutoGen;3.创建一个FFmpeg的上下文(AVFormatContext)对象,并打开rtsp视频流:AVFormatContext*formatContext=ffmpeg.avformat_alloc_context();//打开rtsp视频流stringrtspUrl="your_rtsp_url";AVDicti

传谷歌开始小范围测试Gemini:比训练GPT-4算力大5倍,多模态能力大提升

今年5月的谷歌I/O大会上,皮查伊宣布了对标GPT-4的大模型PaLM2,但同时也提到谷歌的研究重心正在转向Gemini,后者是一种多模态和高效的机器学习工具。为了更快地开发Gemini,谷歌在今年4月份合并了内部的两个人工智能实验室:谷歌大脑(GoogleBrain)和DeepMind,Gemini这项联合计划就由来自两个实验室的研究人员组成的团队牵头。接下来几个月,Gemini的神秘面纱一点点被揭开:我们大概知道该模型是在GoogleBrain和DeepMind合并之后开始研发的,将具有像GPT-4一样的万亿参数;Gemini在训练中已经展示出了以往模型中从未见过的多模态能力;一旦经过微调

60亿参数AI模型测试:Intel 2.4倍领先!唯一可替代NVIDIA

MLCommons官方公布针对60亿参数大语言模型及计算机视觉与自然语言处理模型GPT-J的MLPerf推理v3.1的性能基准测试结果,IntelCPU处理器、AI加速器表现亮眼,在AI推理方面相当有竞争力。此前6月份披露的MLCommonsAI训练结果、HuggingFace性能基准测试成绩表明,IntelGaudi2AI加速器在先进的视觉语言模型上,表现完全可以超越NVIDIAH100股加速器,堪称可唯一替代NVIDIAH100/A100的可行方案,最新结果再次验证了这一点。GPT-J模型上,IntelGaudi2加速器的GPT-J-99、GPT-J-99.9服务器查询和离线样本的推理性能

推理飙升2倍!普林斯顿北大校友祭出多头「美杜莎」,33B模型与13B一样快

由于LLM架构固有的内存限制,使得生成又慢又贵。对此,很多大佬都在寻找一种挽救的方法。Karpathy曾多次提出,大模型「投机采样」对于推理时间优化是一个出色的方案。但是,尽管投机解码能够加速生成速度,但因其太过复杂,并没有被许多开发者采用。今天,来自普林斯顿、UIUC等机构的华人团队提出了全新的简单框架:Medusa(美杜莎)。没有额外的草稿模型,研究人员只是引入了几个额外的解码头,微调出「美杜莎头」,能够在单个A100-8GGPU,一天时间内完成训练。结果发现,Medusa直接让模型推理加速约2倍。Vicuna-7b与Medusa为什么LLM生成效率低?从系统角度来看,LLM生成遵循一种「

Meta被曝明年发布「开源版GPT-4级」全新大模型!参数量比Llama 2大数倍,可免费商用

根据外媒《华尔街日报》消息,Meta正在加紧开发新的大语言模型,能力将完全对标GPT-4,预计将于明年推出。消息还特别强调了,Meta新的大语言模型将比Llama2大数倍,而且大概率还是会开源,支持免费商用。自从年初Meta将LlaMA「不小心」泄露出来之后,到7月份Llama2的开源发布,Meta渐渐找到了自己在这次AI浪潮中的独特位置——AI开源社区的旗帜。人员震荡不断,模型能力有硬伤,靠开源坐回主桌年初,在OpenAI用GPT-4引爆了科技行业之后,谷歌,微软也相继推出了自己的AI产品。在5月份的时候,美国监管层就邀请了当时他们认为AI行业相关的头部企业CEO,开了一个圆桌会议,讨论AI

【python-docx】文本操作(段落、run、标题、首行缩进、段前段后、多倍行距、对齐方式)

1.概念块级元素(block-level)是指作为一个整体的元素,典型的是段落(paragraph)。行内元素(inline),你可以把它理解为一部分块级元素,即一个块级元素包含一个或多个行内元素,典型的是run对象(我也不知道run应该翻译成什么)。举个例子,你在Word回车换行开始输入文本,即自成一个段落,如果你选中其中的几个文字,那这些文字即为run对象2.段落段落(paragraph)是最主要的块级元素,比如说我们要往文档里添加文字,其实就添加段落,add_paragraph()可以添加一个段落,返回一个Paragraph对象2.1插入段落fromdocximportDocumentf