草庐IT

清华同方

全部标签

清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!

自从大模型火爆出圈以后,人们对压缩大模型的愿望从未消减。这是因为,虽然大模型在很多方面表现出优秀的能力,但高昂的的部署代价极大提升了它的使用门槛。这种代价主要来自于空间占用和计算量。「模型量化」 通过把大模型的参数转化为低位宽的表示,进而节省空间占用。目前,主流方法可以在几乎不损失模型性能的情况下把已有模型压缩至4bit。然而,低于3bit的量化像一堵不可逾越的高墙,让研究人员望而生畏。图1:量化模型的困惑度在2bit时迅速上升近期,一篇由清华大学、哈尔滨工业大学合作发表在arXiv上的论文为突破这一阻碍带来了希望,在国内外学术圈引起了不小的关注。这篇论文也在一周前登上huggingface的

国内公司有望做出Sora吗?这支清华系大模型团队给出了希望

2023年年底,很多人都预测,未来一年将是视频生成快速发展的一年。但出人意料的是,农历春节刚过,OpenAI就扔出了一个重磅炸弹——能生成1分钟流畅、逼真视频的Sora。它的出现让很多研究者担心:国内外AI技术的差距是不是又拉大了?根据OpenAI披露的技术报告,Sora的核心技术点之一是将视觉数据转化为patch的统一表示形式,并通过Transformer和扩散模型结合,展现了卓越的scale特性。无独有偶,最近发布的 StableDiffusion3 也采用了同样的架构。其实,这两项工作都是基于Sora核心研发成员WilliamPeebles和纽约大学计算机科学助理教授谢赛宁合著的一篇论文

清华系2B模型杀出支持离线本地化部署,可以个人电脑或者手机上部署的多模态大模型,超越 Mistral-7B、LLaMA-13B

清华系2B模型杀出支持离线本地化部署,可以个人电脑或者手机上部署的多模态大模型,超越Mistral-7B、LLaMA-13B。2月1日,面壁智能与清华大学自然语言处理实验室共同开源了系列端侧语言大模型MiniCPM,主体语言模型MiniCPM-2B仅有24亿(2.4B)的非词嵌入参数量。在综合性榜单上与Mistral-7B相近,在中文、数学、代码能力表现更优,整体性能超越Llama2-13B、MPT-30B、Falcon-40B等模型。具体开源模型包括:基于MiniCPM-2B的指令微调与人类偏好对齐的MiniCPM-2B-SFT/DPO。基于MiniCPM-2B的多模态模型MiniCPM-V

Windows环境下清华ChatGLM3+docker-desktop镜像制作和配置GPU环境docker容器本地运行

仅供学习交流使用,其他任何行为与本博客无关!!1.ChatGLM3的本地部署和docker-desktop的安装(1)下载或git拉取ChatGLM3镜像 拉取镜像,配置环境在此文就不多赘述  gitclone https://github.com/THUDM/ChatGLM3.git(2)docker-desktop的安装这里引用这位大佬的文章,讲的很详细

清华叉院、理想提出DriveVLM,视觉大语言模型提升自动驾驶能力

与生成式AI相比,自动驾驶也是近期AI最活跃的研究和开发领域之一。要想构建完全的自动驾驶系统,人们面临的主要挑战是AI的场景理解,这会涉及到复杂、不可预测的场景,例如恶劣天气、复杂的道路布局和不可预见的人类行为。现有的自动驾驶系统通常包括3D感知、运动预测和规划组成部分。具体来说,3D感知仅限于检测和跟踪熟悉的物体,忽略了罕见物体及其属性,运动预测和规划则关注物体的轨迹动作,通常会忽略物体和车辆之间的决策级交互。自动驾驶需要从数据驱动迭代到知识驱动,通过训练具备逻辑推理能力的大模型才能真正解决长尾问题,只有这样才能迈向开放世界的L4级能力。随着GPT4、Sora等大模型通过涌现、规模效应展现出

清华AutoGPT:掀起AI新浪潮,与GPT4.0一较高下

引言:        随着人工智能技术的飞速发展,自然语言处理(NLP)领域迎来了一个又一个突破。最近,清华大学研发的AutoGPT成为了业界的焦点。这款AI模型以其出色的性能,展现了中国在AI领域的强大实力。目录引言:一、清华AutoGPT简介二、清华AutoGPT与GPT4.0的比较三、简单问答与代码示例问答:代码示例:使用清华AutoGPT进行文本生成:使用GPT4.0进行文本生成: 一、清华AutoGPT简介        清华AutoGPT是一款基于Transformer架构的自然语言处理模型,它采用了大规模的语料库进行训练,具备了强大的语言理解和生成能力。该模型可以自动回答各种问题

清华系2B模型杀出,性能吊打LLaMA-13B

2月1日,面壁智能与清华大学自然语言处理实验室共同开源了系列端侧语言大模型MiniCPM,主体语言模型MiniCPM-2B仅有24亿(2.4B)的非词嵌入参数量。在综合性榜单上与Mistral-7B相近,在中文、数学、代码能力表现更优,整体性能超越Llama2-13B、MPT-30B、Falcon-40B等模型。具体开源模型包括:基于MiniCPM-2B的指令微调与人类偏好对齐的MiniCPM-2B-SFT/DPO。基于MiniCPM-2B的多模态模型MiniCPM-V,能力超越基于Phi-2的同参数级别多模态模型。MiniCPM-2B-SFT/DPO的Int4量化版MiniCPM-2B-SF

离线AI聊天清华大模型(ChatGLM3)本地搭建指南

随着人工智能技术的飞速发展,聊天机器人成为了一个热门的研究领域。清华大学研发的ChatGLM3模型,作为其中的佼佼者,为开发者提供了强大的自然语言处理能力。本文将指导您如何在本地搭建ChatGLM3模型,实现离线AI聊天功能。一、前置准备在开始搭建之前,您需要准备以下物品:一台性能良好的计算机,建议配置至少8GB内存和2GB显存的显卡。安装Python3.8或更高版本。安装必要的Python库,如torch、transformers等。下载ChatGLM3模型文件。二、安装依赖在搭建过程中,您需要使用到一些Python库。您可以通过以下命令安装这些库:pip install torch tra

清华系大模型创业关键人物盘点

共同探讨有深度的生成式AI技术前沿洞见、技术迭代、案例解析、方法和实践,请关注“神州问学”公众号,加入社群!在大模型的浪潮中,我们总能看到清华校友和教授的身影,称这些清华校友和教授创立的公司为“清华系”公司。当一家AI公司拥有“清华系”这个title,人们从心里都会更看好这家公司,这也是人们在不断的和清华系的公司与创业者打交道之后产生的信心。本期我们梳理了这次大模型浪潮中清华系的关键人物,以及他们所创立的公司。【张钹&姚期智】清华系人工智能奠基者在谈论这些清华系的人工智能创业者之前,我们必须先了解清华人工智能领域的奠基者 -- 张钹教授和姚期智教授。    张钹             姚期智

2023 ACM Fellow出炉:清华马维英、微软高剑峰、上交大陈海波等14位华人当选

【导读】2023ACMFellow正式揭榜!今年共有68人评选为ACMFellow,图灵奖三巨头,万维网之父位列其中。另外,清华马维英、微软高剑峰等14位华人纷纷入选。2023ACMFellow揭榜了!刚刚,美国计算机协会(AssociationforComputingMachinery)正式宣布了,2023年当选ACMFellow的68位成员。值得一提的是,今年图灵奖三巨头、万维网之父纷纷入选。新晋当选者中,华人学者占14席,包括我们熟知的马维英、高剑峰等知名AI大佬。另外,微软过去一年因AI加持也是名满天下,共有6位研究院当选今年的ACMFellow。此次提名是为了表彰68位Fellow因