今天,MistralAI正式放出了Mixtral8x7B的技术细节——在大多数基准测试中,Mixtral的表现不仅优于Llama270B,而且推理速度提高了整整6倍!尤其是,它在大多数标准基准测试上与GPT-3.5打平,甚至略胜一筹。新开源的Mixtral8x7B自带了一些出色的表现:比如可以很好地处理32k长度的上下文,支持英语、法语、意大利语、德语和西班牙语,且在代码生成方面表现出强大的性能。另外,它可以微调为指令跟随模型(instruction-followingmodel),在MT-Bench上获得了8.3分的好成绩。467亿参数打平GPT-3.5Mixtral是基于decoder-o
GitHub上线了一个新的基于GPT-4的开源应用项目AutoGPT,凭借超42k的Star数在开发者圈爆火。 AutoGPT能够根据用户需求,在用户完全不插手的情况下自主执行任务,包括日常的事件分析、营销方案撰写、代码编程、数学运算等事务都能代劳。比如某国外测试者要求AutoGPT帮他创建一个网站,AutoGPT就直接调用React框架生成了一个前端页面。因为同基于GPT-4的ChatGPT非常依赖人们输入提示词来完成任务,AutoGPT则将中间的多轮提问环节交给机器,因此有人称AutoGPT将会替代ChatGPT。卡尔帕西称:“AutoGPT是提示工程的下一个前沿领域。”他认为,一个GPT
Mistral上周末丢出的磁力链接震惊了开源圈子,这个7B×8E的开源MoE大模型性能已经到达了LLaMA270B的级别!而根据JimFan猜测,如果Mistral内部训练了34B×8E或者甚至100B+×8E级别的模型,那他们的能力很有可能已经无限接近GPT-4了。而在之前对于GPT-4结构的曝料中,大部分的信息也指向GPT-4很可能是由8个或者是16个MoE构成。为什么MoE能成为高性能大模型的必选项?简单来说,MoE是一种神经网络架构设计,在Transformer模块中集成了专家/模型层。当数据流经MoE层时,每个输入token都会动态路由到专家子模型进行处理。当每个专家专门从事特定任务
12月5日,现代化前端框架Astro4.0版本正式发布!该版本提供了全新的API、更快的构建速度、重新设计的文档,以及为Astro提供了独特的新开发工具,以新颖有趣的方式增强本地开发环境!Astro是一个现代化的静态站点生成器和前端框架,它具有独特的设计理念:岛屿架构。它允许开发人员使用组件化的方式构建内容优先的网站,将各种技术栈(如React、Vue、Svelte等)的组件无缝集成到同一个项目中。2022年,Astro在JavaScript明星项目中排名第七,一年新增了15kStar,目前已获得了37.4kStar!了解更多:Astro,这个前端框架有点不一样!Astro4.0的更新亮点包括
“欧洲版OpenAI”最新估值,逼近20亿美元!总部位于巴黎的大模型初创公司MistralAI最新一轮融资,4.87亿美元。投资方为安德森·霍洛维茨、英伟达、Salesforce等。其中安德森·霍洛维茨领投约2亿欧元,英伟达、Salesforce计划通过转换债券再投资1.2亿欧元。据了解,MistralAI由前DeepMind、前Meta科学家创立。2位主创是Llama的核心贡献者。今年5月,他们出走后创业,迅速引发圈内关注。种子轮即获得1.13亿美元,公司估值达2.6亿美元。9月时发布开源大模型Mistral-7B,全面对标Llama2。如今,随着最新一轮融资进入最后阶段,意味着Mistra
AI画的玛丽莲·梦露,倒转180°后,竟然变成了爱因斯坦?!这是最近在社交媒体上爆火的扩散模型视错觉画,随便给AI两组不同的提示词,它都能给你画出来!哪怕是截然不同的对象也可以,例如一位男子,经过反色处理,就神奇地转变成一名女子:就连单词也能被翻转出新效果,happy和holiday只在一旋转间:原来,这是来自密歇根大学的一项“视觉字谜”新研究,论文一发出就在HackerNews上爆火,热度飙至近800。英伟达高级AI科学家JimFan赞叹称:这是我近期见到最酷的扩散模型!还有网友感叹称:这让我想到了从事分形压缩工作的那段经历。我一直认为它是纯粹的艺术。要知道,创作一幅经过旋转、反色或变形后呈
斯坦福华人博士休学搞创业,直接火爆AI圈!新产品瞄准AI视频生成,刚出道就成行业顶流,引来一众大佬围观评价。OpenAI大牛AndrejKarpathy转发,并激情附上长文一段:每个人都能成为多模态梦境的导演,就像《盗梦空间》里的筑梦师一样。就连StabilityAI创始人也来点赞:这个新产品名为Pika 1.0,背后公司Pika于今年4月成立。要知道,这一行的产品已有不少,如成立5年的Runway等公司。在AI视频生成“乱花迷人眼”的当下,这个新产品究竟是如何做到迅速破圈,吸引大量关注度的?从放出的Demo效果来看,Pika1.0不仅能根据文字图片,流畅地生成一段视频,动静转换就在一瞬间:而
OpenAI的神秘Q*项目,已经引爆整个AI社区!疑似接近AGI,因为巨大计算资源能解决某些数学问题,让SamAltman出局董事会的导火索,有毁灭人类风险……这些元素单拎出哪一个来,都足够炸裂。无怪乎Q*项目曝出三天后,热度还在持续上升,已经引起了全网AI大佬的探讨。AI2研究科学家Nathan激动地写出一篇长文,猜测Q假说应该是关于思想树+过程奖励模型。而且,Q*假说很可能和世界模型有关!几小时后,英伟达高级科学家JimFan也发出长文分析,跟Nathan的看法不谋而合,略有不同的是,JimFan的着重点是和AlphaGo的类比。对于Q*,JimFan发出了如此赞叹:在我投身人工智能领域的
特斯拉前AI总监AndrejKarpathy的新教程火了。这次,他专门面向普通大众做了一个关于大语言模型的科普视频。时长1小时,全部为“非技术介绍”,涵盖模型推理、训练、微调和新兴大模型操作系统以及安全挑战,涉及的知识全部截止到本月(非常新)。△视频封面图是Andrej用Dall·3画的视频上线油管仅1天,就已经有20万播放量。有网友表示:我刚看了10分钟就已经学到了很多东西,我以前从未用过视频中讲的这样的例子来解释LLM,它还弄清了我以前看到过的很多“混乱”的概念。在一水儿的夸课程质量高之外,还有相当多的人评价Andrej本人真的非常擅长简化复杂的问题,教学风格也总是让人印象深刻。不止如此,
AI图像生成,已经进入了秒速级别,只要4步推理就能完成绘制,最快更是能在1秒之内完成。现在,清华大学联合HuggingFace的研究人员,推出了全新的绘图模型加速模块。作者给出的体验版当中,点击生成按钮后,模型只用了几秒钟就绘制出了4张清晰的图像。这个加速模块叫做LCM-LoRA,发布后不久就斩获了2k+次GitHub星标。它不仅加速能力强、泛化性能好,适配的模型也很广泛,SD系和LoRA模型都能用它来加速。团队基于LCM-LoRA自行优化的文生图模型已在HuggingFace上开放体验,图生图模型也推出了CoLab等版本。AI绘图工具迅速接入LCM-LoRA开源后不久,就有AI绘图工具厂商S