chatGLM-LLAMA_草庐IT

Meta公布Llama 3训练集群细节！储备60万块H100迎接AGI

每年3月份，照例各家大厂又要开始秀自己最新的产品和研究了。OpenAI刚刚发布了震惊世人的Sora，最新的ChatGPT版本似乎也是箭在弦上。谷歌更是举全公司之力，从去年底就开始放出了包括GeminiUltra，Gemini1.5，Gemma在内，各分支赛道上的惊艳成果。可是作为开源AI的扛把子，Meta在去年发布了Llama2和后续的模型后，就一直缺少有影响力的产品问世。而对于开源社区来说，OpenAI虽好，可Meta才是大家真的衣食父母。大家都在翘首以待Llama3的发布。在Llama3公开之前，不甘寂寞的Meta还是想到办法在行业内刷了一波存在感——秀肌肉。MetaAI刚刚发表了一份技术

聊聊ChatGLM-6B医疗数据微调

转载请注明出处:https://www.cnblogs.com/zhiyong-ITNote/参考了多个医疗大模型，如扁鹊、灵心等，重新思考了下微调的方案以及数据集的格式；基于ChatGLM/其它LLM整合多种微调方法的非官方实现的框架，审视其数据集格式，以及调试效果，进行微调。最终基于liucongg/ChatGLM-Finetuning开源框架成功的微调出来我想要的结果。服务器环境阿里云PAI平台开源库下载在服务器上通过git一键下载即可：ChatGLM-6B下载直接在服务器上，通过魔塔社区的sdk下载代码一键下载即可：我加了一句代码打印出下载地址，然后通过mv命令拷贝到指定路径下。#模型

【DataWhale学习】用免费GPU线上跑chatGLM项目实践

用免费GPU线上跑chatGLM项目实践DataWhale组织了一个线上白嫖GPU跑chatGLM与SD的项目活动，我很感兴趣就参加啦。之前就对chatGLM有所耳闻，是去年清华联合发布的开源大语言模型，可以用来打造个人知识库什么的，一直没有尝试。而SD我前两天刚跟着B站秋叶大佬和Nenly大佬的视频学习过，但是生成某些图片显存吃紧，想线上部署尝试一下。参考：DataWhale学习手册链接1学习简介本文以趋动云平台为例，详细介绍下如何通过平台提供的在线开发环境，直接在云端编写、运行代码，并使用GPU资源进行加速。本教程将学习云算力资源的使用方式，并给出了两个AI项目实践：用免费GPU创建属于

Llama-3背后基础训练设施全揭秘：两个24KGPU集群，共4.9万个H100

作者丨KevinLee、AdiGangidi、MathewOldham编译丨诺亚出品|51CTO技术栈（微信号：blog51cto）日前，Meta在官网公布了两个全新的24KH100GPU集群（49,152个），并就新集群的技术细节做了逐一剖析。它们各自拥有超过2.4万个GPU，并在硬件、网络、存储、设计、性能和软件等方面上，专为支持大型语言模型如Llama3进行训练而深度优化。此次公告也被Meta团队视为其基础设施路线图中的一个关键步骤。“到2024年底，我们的目标是继续扩大基础设施建设，其中包括350,000个NVIDIAH100GPU，构成的计算能力相当于近600,000个H100GPU

LLaMA 2 和 QianWen-14B

阿里云通义千问14B模型开源！性能超越Llama2等同等尺寸模型-科技新闻-EDA365电子论坛网LLaMA2的硬件要求：LLaMA2系列模型有不同的参数量版本，如7B、13B和70B等。对于不同大小的模型，其硬件需求也有所不同。以下是一些硬件要求摘要：LLaMA270B推理时全精度（FP32）显存占用最低要求为约280GB。对于微调和推理，Llama-13B建议使用至少10GBVRAM（显存）的GPU，例如AMD6900XT、RTX206012GB、306012GB、3080或A2000。LLaMA2运行时还需要足够的CPU处理能力和内存支持，例如运行LLaMA-30B模型的最低RAM要求是

万字带你了解ChatGLM

本文分享自华为云社区《【云驻共创】华为云之昇思MindSpore大模型专题（第二期）-第一课：ChatGLM》，作者：愚公搬代码。前言1.昇思MindSpore昇思MindSpore是华为公司推出的一款全场景AI计算框架。它提供了自动微分、分布式训练和推理、模型部署等功能，支持多种硬件平台，包括CPU、GPU和AscendAI处理器。MindSpore采用图和算子相结合的编程模型，能够高效地处理复杂的深度学习任务。它具有灵活的设计、高效的性能和易于使用的接口，使开发者能够更快地开发和部署AI应用。MindSpore还支持自定义操作和算法，可以满足不同场景下的需求。2.大模型大模型是指具有数百万

【02】ChatGLM3-6B部署：CentOS7.9本地部署ChatGLM3-6B模型

一、ChatGLM-6B模型ChatGLM3是智谱AI和清华大学KEG实验室联合发布的对话预训练模型。ChatGLM3-6B是ChatGLM3系列中的开源模型，在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上，ChatGLM3-6B引入了如下特性：（1）更强大的基础模型：ChatGLM3-6B的基础模型ChatGLM3-6B-Base采用了更多样的训练数据、更充分的训练步数和更合理的训练策略。在语义、数学、推理、代码、知识等不同角度的数据集上测评显示，*ChatGLM3-6B-Base具有在10B以下的基础模型中最强的性能*。（2）更完整的功能支持：ChatGLM3-6B采用了全新

今日Arxiv最热NLP大模型论文：Llama-2上下文扩大48倍的方法来了，港大发布，无需训练

引言：大语言模型的长上下文理解能力在当今的人工智能领域，大语言模型（LargeLanguageModels，简称LLMs）的长上下文理解能力成为了一个重要的研究方向。这种能力对于模型来说至关重要，因为它使得LLMs能够有效地应对各种应用场景，例如在庞大的PDF文件中分析和回应查询、保留扩展的对话历史以及增强交互式聊天机器人的功能。然而，由于训练语料库的可获取性有限，以及长上下文微调的成本过高，目前的开源模型在性能上往往无法与专有模型相媲美，且通常只能提供较小的模型尺寸（例如7B/13B）。针对这些限制，不需要额外训练即可进行上下文扩展的方法变得尤为吸引人。最近的无训练方法，包括LM-infin

符尧大佬一作发文，仅改训练数据，就让LLaMa-2上下文长度扩展20倍！

引言：探索语言模型的长上下文能力近日，谷歌推出了GeminiPro1.5，将上下文窗口长度扩展到100万个tokens，目前领先世界。而其他语言模型也正在不断探索长上下文能力，也就是模型处理和理解超出其训练时所见上下文长度的能力。例如，一个模型可能在训练时只看到了每个输入中的4Ktokens，但在实际应用中，我们希望它能够处理长达128Ktokens的文档。这种能力对于多种应用场景至关重要，如多文档问答、代码库级别的代码理解、长历史对话建模，以及语言模型驱动的自主代理等。然而，由于注意力机制的二次复杂度，将模型的上下文长度从4K扩展到128K看上去似乎是不切实际的。本文将介绍一种数据工程方法，

llama_index 官方文档阅读笔记 (持续更新版)

llama0.10.17🦙版本阅读链接: LlamaIndex🦙v0.10.17LlamaIndex是一个基于 LLM 的应用程序的数据框架，它受益于上下文增强。这种LLM系统被称为RAG系统，代表“检索-增强生成”。LlamaIndex提供了必要的抽象，以便更轻松地摄取、构建和访问私有或特定于域的数据，以便将这些数据安全可靠地注入LLM，以实现更准确的文本生成。🚀为什么选择上下文增强？LLM的局限LLM在人类和数据之间提供了一个自然语言接口。广泛可用的模型是在大量公开数据（如维基百科、邮件列表、教科书、源代码等）上预先训练的。然而，虽然LLM是在大量数据上训练的，但它们并没有在你的数据上训练