提速

【发布】ChatGLM2-6B：性能大幅提升，8-32k上下文，推理提速42%

目录前言CEval榜单ChatGLM2-6B模型性能升级评测结果推理性能示例对比

数慧时空20年磨一剑：推出智能遥感云平台DIEY，自然资源多模态大模型“长城”，为地理信息产业提速

作者|伍杏玲出品|CSDN据中国地理信息产业发展报告公布的数据，截至2020年末，行业从业单位13.8万家，从业人数336.6万，到2021年末，从业单位增加到16.4万家，从业人数增加到398万，产业规模越来越大，但人均产值却越来越低，产业亟待升级优化。由ChatGPT引发的AI大模型带来了新机遇。5月17日，第十二届全球地理信息开发者大会（WGDC2023），北京数慧时空信息技术有限公司（以下简称：数慧时空）发布自然资源多模态大模型“长城”和基于该大模型自主研发的智能遥感云平台DIEY产品，用技术为地理信息产业升级加码助力。一、自然资源多模态大模型“长城”，源自20年积累数慧时空创立于20

一剑模态 xff0c xff0 xff 人工智能大数据

清华朱军团队新作：使用4位整数训练Transformer，比FP16快2.2倍，提速35.1%，加速AGI到来！

将激活、权重和梯度量化为4位，有望加速神经网络训练。然而，现有的4位训练方法需要自定义数字格式，而现代硬件不支持这种格式。最近，清华朱军团队提出了一种使用INT4算法实现所有矩阵乘法的Transformer训练方法。使用超低INT4精度进行训练，是非常具有挑战性的。为了实现这一目标，研究者仔细分析了Transformer中激活和梯度的具体结构，为它们提出专用的量化器。对于前向传播，研究者确定了异常值的挑战，并提出了Hadamard量化器来抑制异常值。对于后向传播，他们通过提出位分割，来利用梯度的结构稀疏性，并利用分数采样技术来准确量化梯度。这种新的算法，在自然语言理解、机器翻译和图像分类等广泛

朱军清华 span text-align justify 人工智能新闻算法 AI

电脑提速方法：虚拟内存使用固态硬盘

今天看了一下系统的虚拟内存竟然设置在机械硬盘（D盘），怪不得越用越慢，调整到固态硬盘（C盘）后还是能明显感受到提升的。

固态提速 xff 硬盘 svg windows

类GPT模型训练提速26.5%，清华朱军等人用INT4算法加速神经网络训练

我们知道，将激活、权重和梯度量化为4-bit对于加速神经网络训练非常有价值。但现有的4-bit训练方法需要自定义数字格式，而当代硬件不支持这些格式。在本文中，清华朱军等人提出了一种使用INT4算法实现所有矩阵乘法的Transformer训练方法。模型训练得快不快，这与激活值、权重、梯度等因素的要求紧密相关。神经网络训练需要一定计算量，使用低精度算法（全量化训练或FQT训练）有望提升计算和内存的效率。FQT在原始的全精度计算图中增加了量化器和去量化器，并将昂贵的浮点运算替换为廉价的低精度浮点运算。对FQT的研究旨在降低训练数值精度，同时降低收敛速度和精度的牺牲。所需数值精度从FP16降到FP8、

朱军训练 span text-align style 人工智能新闻算法 AI

提速10倍+，StarRocks 指标平台在携程火车票的实践

作者简介Kane，携程高级数仓经理，专注数仓建设、数据应用和分析；Wn，大数据平台开发专家，专注大数据领域。携程火车票事业群运营着铁友、携程火车票和去哪儿火车票等重要的业务和品牌，目前正在积极地拓展海外市场。火车票的指标平台旨在为业务人员提供便捷的指标查询服务，让业务人员能够快速灵活地获得这些业务和品牌相关的指标数据。一、早期OLAP架构与痛点火车票事业群的业务涵盖了火车票、国际火车票、汽车票（含船票）等产品，错综复杂的业务也产生了多种多样订单和行为数据，通过对这些数据的分析可以揭示当前业务的发展现状，也可以为未来的发展提供方向指引。早些时候事业群开发过一套指标平台，根据不同的指标类型使用了3

携程提速 span text-align justify 开发新闻技术

中科院版「分割一切」模型来了，比Meta原版提速50倍 | GitHub 2.4K+星

比Meta的「分割一切模型」(SAM)更快的图像分割工具，来了！最近中科院团队开源了FastSAM模型，能以50倍的速度达到与原始SAM相同的效果，并实现25FPS的实时推理。该成果在Github已经获得2.4K+次星标，在Twitter、PaperswithCode等平台也受到了广泛关注。相关论文预印本现已发表。以下内容由投稿者提供视觉基础模型SAM[1]在许多计算机视觉任务中产⽣了重⼤影响。它已经成为图像分割、图像描述和图像编辑等任务的基础。然⽽，其巨⼤的计算成本阻碍了它在实际场景中的⼴泛应⽤。最近，中科院⾃动化所提出并开源了⼀种加速替代⽅案FastSAM。通过将分割⼀切任务重新划分为全实

中科中科院图片 FastSAM 分割人工智能模型 SAM

清华第二代60亿参数ChatGLM2开源！中文榜居首，碾压GPT-4，推理提速42%

ChatGLM-6B自3月发布以来，在AI社区爆火，GitHub上已斩获29.8k星。如今，第二代ChatGLM来了！清华KEG和数据挖掘小组（THUDM）发布了中英双语对话模型ChatGLM2-6B。图片项目地址：https://github.com/THUDM/ChatGLM2-6BHuggingFace：https://huggingface.co/THUDM/chatglm2-6b最新版本ChatGLM2-6B增加了许多特性：-基座模型升级，性能更强大-支持8K-32k的上下文-推理性能提升了42%-对学术研究完全开放，允许申请商用授权值得一提的是，在中文C-Eval榜单中，ChatG

二代碾压 span text-align style 人工智能新闻清华开源

DeepSpeed Chat: 一键式RLHF训练，让你的类ChatGPT千亿大模型提速省钱15倍

DeepSpeedChat:一键式RLHF训练，让你的类ChatGPT千亿大模型提速省钱15倍1.概述近日来，ChatGPT及类似模型引发了人工智能（AI）领域的一场风潮。这场风潮对数字世界产生了革命性影响。ChatGPT类模型具有惊人的泛用性，能够执行归纳、编程、翻译等任务，其结果与人类专家相当甚至更优。为了使ChatGPT等模型的训练和部署更轻松，AI开源社区进行了各种尝试（例如ChatLLaMa、Alpaca、Vicuna、Databricks-Dolly等）。然而，尽管开源社区付出了巨大的努力，目前仍缺乏一个支持端到端的基于人工反馈机制的强化学习（RLHF）的规模化系统，这使得训练强大

一键提速 xff xff0c xff0 chatgpt 人工智能自然语言处理 DeepSpeed 深度学习

Python潮流周刊：Python 3.13 计划将解释器提速 50%！

你好，我是猫哥。这里每周分享优质的Python及通用技术内容，部分为英文，已在小标题注明。（标题取自其中一则分享，不代表全部内容都是该主题，特此声明。）由于公众号不支持外链，文中大量链接无法点击。可直达我的博客阅读（复制到浏览器中打开）：https://pythoncat.top/posts/2023-06-24-weekly🦄文章&教程Python3.13版本的计划(英)FasterCPython项目（即香农计划）有了关于3.13版本的最新计划，这次的性能目标是减少解释器50%的耗时。涵盖三项主要工作：第2层的优化器、启用子解释器（PEP-554）、内存管理。为什么Numpy并行性很重要？(

解释器 Python data-id data list-paddingleft 大数据数据分析 Numpy 场景

3 4 567 8 9