3nm制程,性能远超H100!就在近日,外媒DigiTimes爆料了英伟达的下一代GPU——代号为「Blackwell」的B100。据称,作为面向人工智能(AI)和高性能计算(HPC)应用的产品,B100将采用台积电的3nm工艺制程,以及更为复杂的多芯片模块(MCM)设计,并将于2024年第四季度现身。对于垄断了人工智能GPU市场80%以上份额的英伟达来说,则可以借着B100趁热打铁,在这波AI部署的热潮中进一步狙击AMD、英特尔等挑战者。据英伟达估计,到2027年,这一领域的产值将达到约3000亿美元。与Hopper/Ada架构不同的是,Blackwell架构将扩展到数据中心和消费级GPU。
模型越大,能力越强吗?然而,事实并非如此。近日,微软研究人员推出了一个模型phi-1.5,仅有13亿参数。论文地址:https://arxiv.org/pdf/2309.05463.pdf具体来说,在常识推理、语言技能,phi-1.5表现与其他模型相当。同时在多步推理上,远远超过其他大模型。phi-1.5展现出了许多大模型具备的能力,能够进行「一步一步地思考」,或者进行一些基本上下文学习。小模型,大用处当前,大模型的主要改进似乎主要与参数规模挂钩,最强大的模型接近万亿参数,训练的数据也需要万亿个token。那么,随着一个问题就来了:模型参数越大,性能就越高吗?这不仅仅是一个学术问题,回答这个问
近日,中国电子技术标准化研究院组织计算产品相关企业代表和行业专家,就2023年第一轮CPUBench公开测试活动提交的报告进行了审查。与会专家从测试数据合理性、测试报告完整性等多个维度,给出了客观公正的意见和建议,审查结果可作为后期数据公开和发布的支撑。CPUBench大家可能比较陌生,它其实就是参考行业权威基准测试工具SPECCPU开发设计的,因此具有极高的参考价值,而且不收费,任何人都可以免费使用。本次测试活动第一批次收到79份报告,涉及15款处理器产品,包括AMDEPYC、Intel至强,以及国产的华为鲲鹏/麒麟、飞腾腾锐、阿里平头哥倚天等不同系列。根据测试结果,搭载AMDEPYC975
今天,著名的SemiAnalysis分析师DylanPatel和DanielNishball,又来爆料行业内幕了。而整个AI社区,再次被这次的消息所震惊:OpenAI的算力比起谷歌来,只能说是小儿科——谷歌的下一代大模型Gemini,算力已达GPT-4的5倍!根据Patel和Nishball的说法,此前屡屡被爆料将成为GPT-4大杀器的谷歌Gemini,已经开始在新的TPUv5Pod上进行训练了,算力高达~1e26FLOPS,比训练GPT-4的算力还要大5倍。如今,凭借着TPUv5,谷歌已经成为了算力王者。它手中的TPUv5数量,比OpenAI、Meta、CoreWeave、甲骨文和亚马逊拥有
来源:《飞哥说AI》公众号作者|高佳创意|李志飞微软Copilot横扫Office全系产品,正式改名为Microsoft365,其野心昭然。微软全家桶自带AI智能驾驶模式,意味着Windows全AI系列新品将火速渗透各行各业。扑面而来的科技革命,正以小时为单位进展。「为了构建Copilot,我们不只是简单地将ChatGPT连接到Microsoft365。该系统将Microsoft365应用程序与MicrosoftGraphofDataandIntelligence以及GPT-4相结合。」 昨天OpenAIGPT-4,今天微软Copilot,无论明天如何演变,一个AI的黄金时代已经来了。世界剧变
早先发布Vicuna模型和大语言模型排位赛的LMSYSOrg(UC伯克利主导)的研究人员又开始搞事情了。这次,他们开发出了一个支持长上下文的开源大模型家族LongChat-7B和LongChat-13B,支持高达16K token的上下文长度。但是吧,其实市面上早已出现支持65K(MPT-7B-storyteller)和32K(CHatGLM2-6B)token的选手了。图片抱着一边向他们虚心学习一边质疑的研究者心态,他们设计一个专门评估大语言模型处理长上下文任务的性能的工具,测了测一众号称支持长上下文的模型们性能到底怎么样。不测不知道,一测发现之前宣称能支持长上下的开源模型几乎水平都不怎么样
谷歌,是真的破釜沉舟了。传说中合并了AlphaGo和类GPT-4大模型的Gemini,终于要来了吗?一个是用强化学习击败人类围棋冠军、创造历史的AI系统,一个是目前霸榜几乎所有大模型榜单、一骑绝尘的最强多模态大模型,两个AI一合体,简直要无敌了!图片谷歌DeepMindCEOHassabis近日对外媒Wired表示,Gemini还在开发中,还需要几个月,而谷歌DeepMind已经准备砸进数千万美元,甚至数亿。此前,SamAltman曾透露,创建GPT-4的成本超过了1亿美元。谷歌DeepMind,当然也不能输。太长不看版Gemini会将AlphaGo与GPT-4等大模型的语言功能合并,系统解决
ChatGLM-6B自3月发布以来,在AI社区爆火,GitHub上已斩获29.8k星。如今,第二代ChatGLM来了!清华KEG和数据挖掘小组(THUDM)发布了中英双语对话模型ChatGLM2-6B。图片项目地址:https://github.com/THUDM/ChatGLM2-6BHuggingFace:https://huggingface.co/THUDM/chatglm2-6b最新版本ChatGLM2-6B增加了许多特性:-基座模型升级,性能更强大-支持8K-32k的上下文-推理性能提升了42%-对学术研究完全开放,允许申请商用授权值得一提的是,在中文C-Eval榜单中,ChatG
最近,一项有关GPT-4的创造力思维测试火了。来自蒙大拿大学和UMWestern大学的研究团队发现,GPT-4在Torrance创造性思维测试(TTCT)中的得分直接排在了前1%。不管是流畅性、灵活性,还是原创性,要不和人类势均力敌,要不直接碾压人类。这项研究在南俄勒冈大学的创意会议上发表(ConferenceonCreativity)。包括蒙大拿大学和西澳大学教授在内的一个研究小组发现:OpenAI的GPT-4在托伦斯创造性思维测试(TTCT)中的得分在前1%,在流畅性、灵活性和原创性等创造性能力方面与人类相匹配或超过了人类。这些发现在南俄勒冈大学的创意会议上发表。GPT-4「头脑风暴」主导
过去2个月,来自UC伯克利的研究人员给大语言模型们安排了一个擂台——ChatbotArena。GPT-4等大语言模型玩家打起了「排位赛」,通过随机battle,根据Elo得分来排名。这一过程中,每当一个用户访问并使用网站,就需要同时让两个不同的模型跑起来。他们是如何做到的?这不,就在今天,UC伯克利重磅开源了世界最快LLM推理和服务系统vLLM。简之,vLLM是一个开源的LLM推理和服务引擎。它利用了全新的注意力算法「PagedAttention」,有效地管理注意力键和值。配备全新算法的vLLM,重新定义了LLM服务的最新技术水平:与HuggingFaceTransformers相比,它提供高