碾压_草庐IT

碾压H100，英伟达下一代GPU曝光！首个3nm多芯片模块设计，2024年亮相

3nm制程，性能远超H100！就在近日，外媒DigiTimes爆料了英伟达的下一代GPU——代号为「Blackwell」的B100。据称，作为面向人工智能（AI）和高性能计算（HPC）应用的产品，B100将采用台积电的3nm工艺制程，以及更为复杂的多芯片模块（MCM）设计，并将于2024年第四季度现身。对于垄断了人工智能GPU市场80%以上份额的英伟达来说，则可以借着B100趁热打铁，在这波AI部署的热潮中进一步狙击AMD、英特尔等挑战者。据英伟达估计，到2027年，这一领域的产值将达到约3000亿美元。与Hopper/Ada架构不同的是，Blackwell架构将扩展到数据中心和消费级GPU。

碾压Llama2！微软13亿参数phi-1.5，单个A100训练，刷新SOTA

模型越大，能力越强吗？然而，事实并非如此。近日，微软研究人员推出了一个模型phi-1.5，仅有13亿参数。论文地址：https://arxiv.org/pdf/2309.05463.pdf具体来说，在常识推理、语言技能，phi-1.5表现与其他模型相当。同时在多步推理上，远远超过其他大模型。phi-1.5展现出了许多大模型具备的能力，能够进行「一步一步地思考」，或者进行一些基本上下文学习。小模型，大用处当前，大模型的主要改进似乎主要与参数规模挂钩，最强大的模型接近万亿参数，训练的数据也需要万亿个token。那么，随着一个问题就来了：模型参数越大，性能就越高吗？这不仅仅是一个学术问题，回答这个问

官方认可！256核心的AMD 轻松碾压240核心的Intel 官方认可！

近日，中国电子技术标准化研究院组织计算产品相关企业代表和行业专家，就2023年第一轮CPUBench公开测试活动提交的报告进行了审查。与会专家从测试数据合理性、测试报告完整性等多个维度，给出了客观公正的意见和建议，审查结果可作为后期数据公开和发布的支撑。CPUBench大家可能比较陌生，它其实就是参考行业权威基准测试工具SPECCPU开发设计的，因此具有极高的参考价值，而且不收费，任何人都可以免费使用。本次测试活动第一批次收到79份报告，涉及15款处理器产品，包括AMDEPYC、Intel至强，以及国产的华为鲲鹏/麒麟、飞腾腾锐、阿里平头哥倚天等不同系列。根据测试结果，搭载AMDEPYC975

侵吞全球算力！谷歌Gemini被曝算力达GPT-4五倍，手握TPU王牌碾压OpenAI

今天，著名的SemiAnalysis分析师DylanPatel和DanielNishball，又来爆料行业内幕了。而整个AI社区，再次被这次的消息所震惊：OpenAI的算力比起谷歌来，只能说是小儿科——谷歌的下一代大模型Gemini，算力已达GPT-4的5倍！根据Patel和Nishball的说法，此前屡屡被爆料将成为GPT-4大杀器的谷歌Gemini，已经开始在新的TPUv5Pod上进行训练了，算力高达~1e26FLOPS，比训练GPT-4的算力还要大5倍。如今，凭借着TPUv5，谷歌已经成为了算力王者。它手中的TPUv5数量，比OpenAI、Meta、CoreWeave、甲骨文和亚马逊拥有

昨天OpenAI GPT-4，今天微软Copilot，轮番上阵碾压谁？

来源：《飞哥说AI》公众号作者｜高佳创意｜李志飞微软Copilot横扫Office全系产品，正式改名为Microsoft365，其野心昭然。微软全家桶自带AI智能驾驶模式，意味着Windows全AI系列新品将火速渗透各行各业。扑面而来的科技革命，正以小时为单位进展。「为了构建Copilot，我们不只是简单地将ChatGPT连接到Microsoft365。该系统将Microsoft365应用程序与MicrosoftGraphofDataandIntelligence以及GPT-4相结合。」昨天OpenAIGPT-4，今天微软Copilot，无论明天如何演变，一个AI的黄金时代已经来了。世界剧变

ChatGPT上下文碾压64K开源模型！UC伯克利：开源模型能力严重「虚标」｜最新硬核评测曝光

早先发布Vicuna模型和大语言模型排位赛的LMSYSOrg（UC伯克利主导）的研究人员又开始搞事情了。这次，他们开发出了一个支持长上下文的开源大模型家族LongChat-7B和LongChat-13B，支持高达16K token的上下文长度。但是吧，其实市面上早已出现支持65K（MPT-7B-storyteller）和32K（CHatGLM2-6B）token的选手了。图片抱着一边向他们虚心学习一边质疑的研究者心态，他们设计一个专门评估大语言模型处理长上下文任务的性能的工具，测了测一众号称支持长上下文的模型们性能到底怎么样。不测不知道，一测发现之前宣称能支持长上下的开源模型几乎水平都不怎么样

碾压GPT-4！谷歌DeepMind CEO自曝：下一代大模型将与AlphaGo合体

谷歌，是真的破釜沉舟了。传说中合并了AlphaGo和类GPT-4大模型的Gemini，终于要来了吗？一个是用强化学习击败人类围棋冠军、创造历史的AI系统，一个是目前霸榜几乎所有大模型榜单、一骑绝尘的最强多模态大模型，两个AI一合体，简直要无敌了！图片谷歌DeepMindCEOHassabis近日对外媒Wired表示，Gemini还在开发中，还需要几个月，而谷歌DeepMind已经准备砸进数千万美元，甚至数亿。此前，SamAltman曾透露，创建GPT-4的成本超过了1亿美元。谷歌DeepMind，当然也不能输。太长不看版Gemini会将AlphaGo与GPT-4等大模型的语言功能合并，系统解决

清华第二代60亿参数ChatGLM2开源！中文榜居首，碾压GPT-4，推理提速42%

ChatGLM-6B自3月发布以来，在AI社区爆火，GitHub上已斩获29.8k星。如今，第二代ChatGLM来了！清华KEG和数据挖掘小组（THUDM）发布了中英双语对话模型ChatGLM2-6B。图片项目地址：https://github.com/THUDM/ChatGLM2-6BHuggingFace：https://huggingface.co/THUDM/chatglm2-6b最新版本ChatGLM2-6B增加了许多特性：-基座模型升级，性能更强大-支持8K-32k的上下文-推理性能提升了42%-对学术研究完全开放，允许申请商用授权值得一提的是，在中文C-Eval榜单中，ChatG

GPT-4创造力竟全面碾压人类！最新创造力测试GPT4排名前1%

最近，一项有关GPT-4的创造力思维测试火了。来自蒙大拿大学和UMWestern大学的研究团队发现，GPT-4在Torrance创造性思维测试（TTCT）中的得分直接排在了前1%。不管是流畅性、灵活性，还是原创性，要不和人类势均力敌，要不直接碾压人类。这项研究在南俄勒冈大学的创意会议上发表（ConferenceonCreativity）。包括蒙大拿大学和西澳大学教授在内的一个研究小组发现：OpenAI的GPT-4在托伦斯创造性思维测试（TTCT）中的得分在前1%，在流畅性、灵活性和原创性等创造性能力方面与人类相匹配或超过了人类。这些发现在南俄勒冈大学的创意会议上发表。GPT-4「头脑风暴」主导

比HuggingFace快24倍！伯克利神级LLM推理系统开源，碾压SOTA，让GPU砍半

过去2个月，来自UC伯克利的研究人员给大语言模型们安排了一个擂台——ChatbotArena。GPT-4等大语言模型玩家打起了「排位赛」，通过随机battle，根据Elo得分来排名。这一过程中，每当一个用户访问并使用网站，就需要同时让两个不同的模型跑起来。他们是如何做到的？这不，就在今天，UC伯克利重磅开源了世界最快LLM推理和服务系统vLLM。简之，vLLM是一个开源的LLM推理和服务引擎。它利用了全新的注意力算法「PagedAttention」，有效地管理注意力键和值。配备全新算法的vLLM，重新定义了LLM服务的最新技术水平：与HuggingFaceTransformers相比，它提供高