倍_草庐IT

何恺明团队12页论文新作剑指AIGC！“新CLIP”只需一个trick，训练速度快3.7倍！性能不降反升...

杨净艳艳发自凹非寺量子位|公众号QbitAI何恺明团队又上新了。这次，他们的成果围绕当下最火的AIGC背后的CLIP展开。——只在该模型的极简结构上，施加了一个简单的mask，就让新模型的速度快了3.7倍。同时，性能还可以做到不降反升。团队表示，希望他们的工作能帮助未来视觉语言模型实现规模化。这波，让大家直呼：不愧是何恺明，还是熟悉的味道啊～是的，还是“大道至简”的feel。就连论文也一如既往，短短12页，一行公式也没有。一起来拜读吧。引入类似MAE的mask本文提出了一个用来训练CLIP的快速、简单且有效的方法FLIP。FastLanguage-ImagePre-training（快速文本-

c - TCP 套接字缓冲区大小也应该是连接 MSS 的偶数倍

《unix网络编程》中有一段话是这样说的:Toavoidwastingpotentialbufferspace,theTCPsocketbuffersizesshouldalsobeanevenmultipleoftheMSSfortheconnection.Someimplementationshandlethisdetailfortheapplication,roundingupthesocketbuffersizeaftertheconnectionisestablished(p.902ofTCPv2).Thisisanotherreasontosetthesetwosocket

GPT-4终结人工标注！AI标注比人类标注效率高100倍，成本仅1/7

大模型满天飞的时代，AI行业最缺的是什么？毫无疑问一定是算（xian）力（ka）。老黄作为AI掘金者唯一的「铲子供应商」，早已赚得盆满钵满。除了GPU，还有什么是训练一个高效的大模型必不可少且同样难以获取的资源？高质量的数据。OpenAI正是借助基于人类标注的数据，才一举从众多大模型企业中脱颖而出，让ChatGPT成为了大模型竞争中阶段性的胜利者。但同时，OpenAI也因为使用非洲廉价的人工进行数据标注，被各种媒体口诛笔伐。时代周刊报道OpenAI雇佣肯尼亚廉价劳动力标注而那些参与数据标注的工人们，也因为长期暴露在有毒内容中，受到了不可逆的心理创伤。卫报报道肯尼亚劳工指责数据标注工作给自己带来

大模型生成提速2倍！单GPU几小时搞定微调，北大数院校友共同一作丨开源

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。只需给大模型“加点小零件”，推理速度立刻提升2倍！不需要额外训练一个模型，也不需要对计算硬件做优化，单张A100最快几小时就能微调完成。这项新研究名叫Medusa（美杜莎），来自普林斯顿、UIUC、CMU和康涅狄格大学，FlashAttention作者TriDao也在其中。目前，它已经成功部署到伯克利70亿参数的“骆马”Vicuna中，后续还会支持其他大模型，已经登上GitHub热榜：但其实，在这种方法推出之前，业界并非没有大模型推理加速方法，主流的就是DeepMind推出的投机采样（speculativedecodi

C#使用FFMpeg.Autogen进行rtsp视频倍速播放

1.在你的C#项目中，使用NuGet包管理器安装FFMpeg.Autogen。可以在VisualStudio中打开NuGet包管理器控制台，并运行以下命令来安装它：Install-PackageFFMpeg.Autogen2.在代码引入命名空间：usingFFMpeg.AutoGen;3.创建一个FFmpeg的上下文（AVFormatContext）对象，并打开rtsp视频流：AVFormatContext*formatContext=ffmpeg.avformat_alloc_context();//打开rtsp视频流stringrtspUrl="your_rtsp_url";AVDicti

传谷歌开始小范围测试Gemini：比训练GPT-4算力大5倍，多模态能力大提升

今年5月的谷歌I/O大会上，皮查伊宣布了对标GPT-4的大模型PaLM2，但同时也提到谷歌的研究重心正在转向Gemini，后者是一种多模态和高效的机器学习工具。为了更快地开发Gemini，谷歌在今年4月份合并了内部的两个人工智能实验室：谷歌大脑（GoogleBrain）和DeepMind，Gemini这项联合计划就由来自两个实验室的研究人员组成的团队牵头。接下来几个月，Gemini的神秘面纱一点点被揭开：我们大概知道该模型是在GoogleBrain和DeepMind合并之后开始研发的，将具有像GPT-4一样的万亿参数；Gemini在训练中已经展示出了以往模型中从未见过的多模态能力；一旦经过微调

60亿参数AI模型测试：Intel 2.4倍领先！唯一可替代NVIDIA

MLCommons官方公布针对60亿参数大语言模型及计算机视觉与自然语言处理模型GPT-J的MLPerf推理v3.1的性能基准测试结果，IntelCPU处理器、AI加速器表现亮眼，在AI推理方面相当有竞争力。此前6月份披露的MLCommonsAI训练结果、HuggingFace性能基准测试成绩表明，IntelGaudi2AI加速器在先进的视觉语言模型上，表现完全可以超越NVIDIAH100股加速器，堪称可唯一替代NVIDIAH100/A100的可行方案，最新结果再次验证了这一点。GPT-J模型上，IntelGaudi2加速器的GPT-J-99、GPT-J-99.9服务器查询和离线样本的推理性能

推理飙升2倍！普林斯顿北大校友祭出多头「美杜莎」，33B模型与13B一样快

由于LLM架构固有的内存限制，使得生成又慢又贵。对此，很多大佬都在寻找一种挽救的方法。Karpathy曾多次提出，大模型「投机采样」对于推理时间优化是一个出色的方案。但是，尽管投机解码能够加速生成速度，但因其太过复杂，并没有被许多开发者采用。今天，来自普林斯顿、UIUC等机构的华人团队提出了全新的简单框架：Medusa（美杜莎）。没有额外的草稿模型，研究人员只是引入了几个额外的解码头，微调出「美杜莎头」，能够在单个A100-8GGPU，一天时间内完成训练。结果发现，Medusa直接让模型推理加速约2倍。Vicuna-7b与Medusa为什么LLM生成效率低？从系统角度来看，LLM生成遵循一种「

Meta被曝明年发布「开源版GPT-4级」全新大模型！参数量比Llama 2大数倍，可免费商用

根据外媒《华尔街日报》消息，Meta正在加紧开发新的大语言模型，能力将完全对标GPT-4，预计将于明年推出。消息还特别强调了，Meta新的大语言模型将比Llama2大数倍，而且大概率还是会开源，支持免费商用。自从年初Meta将LlaMA「不小心」泄露出来之后，到7月份Llama2的开源发布，Meta渐渐找到了自己在这次AI浪潮中的独特位置——AI开源社区的旗帜。人员震荡不断，模型能力有硬伤，靠开源坐回主桌年初，在OpenAI用GPT-4引爆了科技行业之后，谷歌，微软也相继推出了自己的AI产品。在5月份的时候，美国监管层就邀请了当时他们认为AI行业相关的头部企业CEO，开了一个圆桌会议，讨论AI

【python-docx】文本操作（段落、run、标题、首行缩进、段前段后、多倍行距、对齐方式）

1.概念块级元素（block-level）是指作为一个整体的元素，典型的是段落（paragraph）。行内元素（inline），你可以把它理解为一部分块级元素，即一个块级元素包含一个或多个行内元素，典型的是run对象（我也不知道run应该翻译成什么）。举个例子，你在Word回车换行开始输入文本，即自成一个段落，如果你选中其中的几个文字，那这些文字即为run对象2.段落段落（paragraph）是最主要的块级元素，比如说我们要往文档里添加文字，其实就添加段落，add_paragraph()可以添加一个段落，返回一个Paragraph对象2.1插入段落fromdocximportDocumentf