爆火_草庐IT

467亿参数MoE追平GPT-3.5！爆火开源Mixtral模型细节首公开，中杯逼近GPT-4

今天，MistralAI正式放出了Mixtral8x7B的技术细节——在大多数基准测试中，Mixtral的表现不仅优于Llama270B，而且推理速度提高了整整6倍！尤其是，它在大多数标准基准测试上与GPT-3.5打平，甚至略胜一筹。新开源的Mixtral8x7B自带了一些出色的表现：比如可以很好地处理32k长度的上下文，支持英语、法语、意大利语、德语和西班牙语，且在代码生成方面表现出强大的性能。另外，它可以微调为指令跟随模型（instruction-followingmodel），在MT-Bench上获得了8.3分的好成绩。467亿参数打平GPT-3.5Mixtral是基于decoder-o

AutoGPT爆火，GitHub上已有42k星标，打造一款属于自己的AI助手，什么是全自动AI？ChatGPT已过时？

GitHub上线了一个新的基于GPT-4的开源应用项目AutoGPT，凭借超42k的Star数在开发者圈爆火。 AutoGPT能够根据用户需求，在用户完全不插手的情况下自主执行任务，包括日常的事件分析、营销方案撰写、代码编程、数学运算等事务都能代劳。比如某国外测试者要求AutoGPT帮他创建一个网站，AutoGPT就直接调用React框架生成了一个前端页面。因为同基于GPT-4的ChatGPT非常依赖人们输入提示词来完成任务，AutoGPT则将中间的多轮提问环节交给机器，因此有人称AutoGPT将会替代ChatGPT。卡尔帕西称：“AutoGPT是提示工程的下一个前沿领域。”他认为，一个GPT

深度揭秘爆火MoE！GPT-4关键架构，成开源模型逆袭杀手锏

Mistral上周末丢出的磁力链接震惊了开源圈子，这个7B×8E的开源MoE大模型性能已经到达了LLaMA270B的级别！而根据JimFan猜测，如果Mistral内部训练了34B×8E或者甚至100B+×8E级别的模型，那他们的能力很有可能已经无限接近GPT-4了。而在之前对于GPT-4结构的曝料中，大部分的信息也指向GPT-4很可能是由8个或者是16个MoE构成。为什么MoE能成为高性能大模型的必选项？简单来说，MoE是一种神经网络架构设计，在Transformer模块中集成了专家/模型层。当数据流经MoE层时，每个输入token都会动态路由到专家子模型进行处理。当每个专家专门从事特定任务

Astro 4.0 正式发布，爆火的现代化前端框架

12月5日，现代化前端框架Astro4.0版本正式发布！该版本提供了全新的API、更快的构建速度、重新设计的文档，以及为Astro提供了独特的新开发工具，以新颖有趣的方式增强本地开发环境！Astro是一个现代化的静态站点生成器和前端框架，它具有独特的设计理念：岛屿架构。它允许开发人员使用组件化的方式构建内容优先的网站，将各种技术栈（如React、Vue、Svelte等）的组件无缝集成到同一个项目中。2022年，Astro在JavaScript明星项目中排名第七，一年新增了15kStar，目前已获得了37.4kStar！了解更多：Astro，这个前端框架有点不一样！Astro4.0的更新亮点包括

创业180天估值20亿美元！欧版OpenAI爆火，Llama主创自立门户，英伟达都入股了

“欧洲版OpenAI”最新估值，逼近20亿美元！总部位于巴黎的大模型初创公司MistralAI最新一轮融资，4.87亿美元。投资方为安德森·霍洛维茨、英伟达、Salesforce等。其中安德森·霍洛维茨领投约2亿欧元，英伟达、Salesforce计划通过转换债券再投资1.2亿欧元。据了解，MistralAI由前DeepMind、前Meta科学家创立。2位主创是Llama的核心贡献者。今年5月，他们出走后创业，迅速引发圈内关注。种子轮即获得1.13亿美元，公司估值达2.6亿美元。9月时发布开源大模型Mistral-7B，全面对标Llama2。如今，随着最新一轮融资进入最后阶段，意味着Mistra

AI视觉字谜爆火！梦露转180°秒变爱因斯坦，英伟达高级AI科学家：近期最酷的扩散模型

AI画的玛丽莲·梦露，倒转180°后，竟然变成了爱因斯坦？！这是最近在社交媒体上爆火的扩散模型视错觉画，随便给AI两组不同的提示词，它都能给你画出来！哪怕是截然不同的对象也可以，例如一位男子，经过反色处理，就神奇地转变成一名女子：就连单词也能被翻转出新效果，happy和holiday只在一旋转间：原来，这是来自密歇根大学的一项“视觉字谜”新研究，论文一发出就在HackerNews上爆火，热度飙至近800。英伟达高级AI科学家JimFan赞叹称：这是我近期见到最酷的扩散模型！还有网友感叹称：这让我想到了从事分形压缩工作的那段经历。我一直认为它是纯粹的艺术。要知道，创作一幅经过旋转、反色或变形后呈

斯坦福美女博士创业项目爆火！AI视频生成出道即顶流

斯坦福华人博士休学搞创业，直接火爆AI圈！新产品瞄准AI视频生成，刚出道就成行业顶流，引来一众大佬围观评价。OpenAI大牛AndrejKarpathy转发，并激情附上长文一段：每个人都能成为多模态梦境的导演，就像《盗梦空间》里的筑梦师一样。就连StabilityAI创始人也来点赞：这个新产品名为Pika 1.0，背后公司Pika于今年4月成立。要知道，这一行的产品已有不少，如成立5年的Runway等公司。在AI视频生成“乱花迷人眼”的当下，这个新产品究竟是如何做到迅速破圈，吸引大量关注度的？从放出的Demo效果来看，Pika1.0不仅能根据文字图片，流畅地生成一段视频，动静转换就在一瞬间：而

OpenAI神秘Q*毁灭人类？爆火「Q*假说」竟牵出世界模型，全网AI大佬长文热议

OpenAI的神秘Q*项目，已经引爆整个AI社区！疑似接近AGI，因为巨大计算资源能解决某些数学问题，让SamAltman出局董事会的导火索，有毁灭人类风险……这些元素单拎出哪一个来，都足够炸裂。无怪乎Q*项目曝出三天后，热度还在持续上升，已经引起了全网AI大佬的探讨。AI2研究科学家Nathan激动地写出一篇长文，猜测Q假说应该是关于思想树+过程奖励模型。而且，Q*假说很可能和世界模型有关！几小时后，英伟达高级科学家JimFan也发出长文分析，跟Nathan的看法不谋而合，略有不同的是，JimFan的着重点是和AlphaGo的类比。对于Q*，JimFan发出了如此赞叹：在我投身人工智能领域的

“大模型本质就是两个文件！”特斯拉前AI总监爆火LLM科普，时长1小时，面向普通大众

特斯拉前AI总监AndrejKarpathy的新教程火了。这次，他专门面向普通大众做了一个关于大语言模型的科普视频。时长1小时，全部为“非技术介绍”，涵盖模型推理、训练、微调和新兴大模型操作系统以及安全挑战，涉及的知识全部截止到本月（非常新）。△视频封面图是Andrej用Dall·3画的视频上线油管仅1天，就已经有20万播放量。有网友表示：我刚看了10分钟就已经学到了很多东西，我以前从未用过视频中讲的这样的例子来解释LLM，它还弄清了我以前看到过的很多“混乱”的概念。在一水儿的夸课程质量高之外，还有相当多的人评价Andrej本人真的非常擅长简化复杂的问题，教学风格也总是让人印象深刻。不止如此，

让Stable Diffusion一秒出图！清华硕士加速神器爆火，已有公司接入

AI图像生成，已经进入了秒速级别，只要4步推理就能完成绘制，最快更是能在1秒之内完成。现在，清华大学联合HuggingFace的研究人员，推出了全新的绘图模型加速模块。作者给出的体验版当中，点击生成按钮后，模型只用了几秒钟就绘制出了4张清晰的图像。这个加速模块叫做LCM-LoRA，发布后不久就斩获了2k+次GitHub星标。它不仅加速能力强、泛化性能好，适配的模型也很广泛，SD系和LoRA模型都能用它来加速。团队基于LCM-LoRA自行优化的文生图模型已在HuggingFace上开放体验，图生图模型也推出了CoLab等版本。AI绘图工具迅速接入LCM-LoRA开源后不久，就有AI绘图工具厂商S