草庐IT

清华版

全部标签

清华朱军团队新作:使用4位整数训练Transformer,比FP16快2.2倍,提速35.1%,加速AGI到来!

将激活、权重和梯度量化为4位,有望加速神经网络训练。然而,现有的4位训练方法需要自定义数字格式,而现代硬件不支持这种格式。最近,清华朱军团队提出了一种使用INT4算法实现所有矩阵乘法的Transformer训练方法。使用超低INT4精度进行训练,是非常具有挑战性的。为了实现这一目标,研究者仔细分析了Transformer中激活和梯度的具体结构,为它们提出专用的量化器。对于前向传播,研究者确定了异常值的挑战,并提出了Hadamard量化器来抑制异常值。对于后向传播,他们通过提出位分割,来利用梯度的结构稀疏性,并利用分数采样技术来准确量化梯度。这种新的算法,在自然语言理解、机器翻译和图像分类等广泛

深度学习实战38-基于清华ChatGLM-6b开源模型做体检报告解读任务,让体检报告解读变得轻松

大家好,我是微学AI,今天给大家介绍一下深度学习实战38-基于清华ChatGLM-6b开源模型做体检报告解读任务,让体检报告解读变得轻松。ChatGLM-6b是清华大学团队开源的一个语言大模型。本文将介绍一种基于ChatGLM-6B的体检报告智能解读应用项目。首先,我们将讨论体检报告解读的背景和重要性。接着,我们将详细介绍大语言模型的原理。最后,我们将展示如何利用ChatGLM构建一个体检报告智能解读的应用项目。由于模型训练受限,生成的数据是AI模型生成仅供参考,不作为具体依据。目录:引言体检报告解读背景2.1体检报告的重要性2.2传统体检报告解读方法的局限性大语言模型原理3.1什么是大语言模

《HarmonyOS原子化服务卡片原理与实战》清华大学出版社李洋著正式出版

感谢所有的参与者、付出者;本著作的出版,既是对我本人及团队两年多时间在HarmonyOS(鸿蒙)和OpenHarmony(开源鸿蒙)应用、原子化服务、服务卡片领域开发的学习、实践、探索的总结,也是对原子化服务未来发展的展望;继续努力体验与成长,持续奋斗。本书主要阐述鸿蒙操作系统(HarmonyOS)应用开发中全新的服务形式,原子化服务与服务卡片技术发展的必然趋势、运行的基本概念、原理与实战开发练习。本书总共分为三篇9章。第一篇基础原理篇为本书的第1到第3章,分别是概述、开发环境和快速入门、HarmonyOS应用基础与原理三章。第二篇成长提高篇为本书的第4到第6章,分别是常用模板开发练习,常用组

CentOS-8.4系统配置国内清华镜像站yum源

一、为啥要更改yum源1、Centos8官方已于2021年12月31日以后停止Centos8支持、转至Centos8Stream项目支持2021年12月31日以后,CentOSLinux8的使用者将无法获得包括问题修复和功能更新在内的任何软件维护和支持。2、CentosStream是一个面向开发者的滚动发布的Linux发行版,CentOSStreams可以当成是用来体验最新红帽系Linux特性的一个版本。3、因此,你追求稳定性,或者个人日常使用,都更推荐使用传统的CentOSLinux这个版本。4、官方渠道已经停止了CentOS8的下载,只有CentOS8-stream,我们可以去清华大学开源

清华大学发布《2023年GPT赋能通信行业应用白皮书》(132页)

加gzh回复“gpt”获取《2023年AIGC(GPT-4)赋能通信行业应用白皮书》完整版摘要:在ChatGPT/GPT-4席卷全球的热潮中,人们已经深刻认识到人工智能作为经济社会发展中一项变革性技术与关键性力量,将为全球产业带来的巨大飞跃和突破式发展,深刻影响未来世界竞争格局。通信行业作为信息通信基础设施的建设者和运营者,既为AI的发展提供基础设施支撑,又是AI应用落地的领先者AIGC(GPT-4)如何赋能通信行业应用,通信行业如何落地AIGC,这是通信业者必须要思考和回答的问题。本白皮书共计132页,通过对AIGC典型代表GPT-4的研究,以场景化的形式对GPT-4如何能通信行业进行了分析

清华大学携手蚂蚁集团,攻坚可信AI、安全通用大模型等关键技术

2023年4月7日,清华大学与蚂蚁集团签署合作协议,双方将在“下一代互联网应用安全技术”方向展开合作,聚焦智能风控、反欺诈等核心安全场景,携手攻坚可信AI、安全大模型等关键技术,并加速技术落地应用,以解决AI时代的互联网安全科技难题,筑牢数字安全屏障。 当天上午,清华大学副校长曾嵘、吴建平院士及蚂蚁集团首席技术官倪行军出席见证。清华大学计算机系主任尹霞、蚂蚁集团大安全事业群总裁赵闻飙代表签约。清华大学吴建平院士团队、蚂蚁安全实验室科研团队代表参会。 数字化智能化的颠覆性变革正在给互联网带来全新安全挑战。尤其是AI大规模应用所带来的深度智能化,使得安全面临复杂性、强对抗、输出对象的多样性等难题,

类GPT模型训练提速26.5%,清华朱军等人用INT4算法加速神经网络训练

我们知道,将激活、权重和梯度量化为4-bit对于加速神经网络训练非常有价值。但现有的4-bit训练方法需要自定义数字格式,而当代硬件不支持这些格式。在本文中,清华朱军等人提出了一种使用INT4算法实现所有矩阵乘法的Transformer训练方法。模型训练得快不快,这与激活值、权重、梯度等因素的要求紧密相关。神经网络训练需要一定计算量,使用低精度算法(全量化训练或FQT训练)有望提升计算和内存的效率。FQT在原始的全精度计算图中增加了量化器和去量化器,并将昂贵的浮点运算替换为廉价的低精度浮点运算。对FQT的研究旨在降低训练数值精度,同时降低收敛速度和精度的牺牲。所需数值精度从FP16降到FP8、

Ubuntu(arm)22.04配置清华源

1,清华源地址地址:https://mirror.tuna.tsinghua.edu.cn/help/ubuntu/2,获取ubuntu(arm)的源ubuntu(arm)要使用清华源中ubuntu-ports源以上源可以去清华源中获取,或者复制我下面得即可#默认注释了源码镜像以提高aptupdate速度,如有需要可自行取消注释debhttps://mirrors.tuna.tsinghua.edu.cn/ubuntu-ports/jammymainrestricteduniversemultiverse#deb-srchttps://mirrors.tuna.tsinghua.edu.cn/

2023年最新自动化/控制保研夏令营&预推免经验贴(清华/自动化所/浙大/上交)

本文起笔于2022年简短自述哈尔滨工业大学(深圳)机电学院自动化系大四在读。首先简单介绍一下我们学校的控制学科建设。哈工大的控制科学与工程专业在全国第四轮学科评估中为A+。在三所A+院校中,清华大学可以说是全能生,哈工大侧重控制理论和机器人(本部有机器人国家重点实验室),浙大的工控全国领先。另外据可靠消息,北理在第五轮学科评估中取得了A+,陈杰院士组非常厉害。我本次参加了多所学校的夏令营和预推免,也都是全国顶级的院所。我希望这篇文章可以帮助一些在自动化的路上脚踏实地的同学,找到适合自己的方向、导师、学校(注意顺序),以下院校排序是根据我参加夏令营/预推免的顺序。院校介绍中科院自动化研究所本人参

从末流211逆袭清华,我的电子通信保研之路

目录背景介绍准备工作推免经历夏令营预推免个人总结背景介绍本科末流211,专业电子信息工程,参加夏令营的时候专排2,约1%,六级五百出头,机器人实验室经历,两项国家级奖项,四项省级奖项,一项国家级大创负责人,实用新型专利若干,一项发明专利在申。准备工作因为正值疫情,有了去年线上的一些经验,所以在寒假的时候就开始准备了。寒假做的工作主要还是在定位和文书的一些准备上。现在回过头来看,定位很重要,如果没有一个很清晰的定位可能会对后来的心态造成很大的影响。寒假做的另一件比较重要的事就是梳理接下来回学校需要做的事情。回到学校后,大概在一个月内就把夏令营需要的材料准备好了,之后开始了我的一个推免面试。推免经