chatGLM3_草庐IT

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM2/LLaMA2/Baichuan等】的高效工具【预训练+指令监督微调+

LLMs：LLaMAEfficientTuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM2/LLaMA2/Baichuan等】的高效工具【预训练+指令监督微调+奖励模型训练+PPO训练+DPO训练】)的简介、安装、使用方法之详细攻略目录相关文章LLMs之ChatGLM：ChatGLMEfficientTuning(一款高效微调ChatGLM-6B/ChatGLM2-6B的工具【LoRA/P-TuningV2/FreezeTuning/全量微调】)的简介、安装、使用方法之详细攻略LLMs：LLaMAEfficientTuning(一款可高效微调【全参数/LoR

chatglm2-6b在P40上做LORA微调

背景：目前，大模型的技术应用已经遍地开花。最快的应用方式无非是利用自有垂直领域的数据进行模型微调。chatglm2-6b在国内开源的大模型上，效果比较突出。本文章分享的内容是用chatglm2-6b模型在集团EA的P40机器上进行垂直领域的LORA微调。一、chatglm2-6b介绍github：https://github.com/THUDM/ChatGLM2-6Bchatglm2-6b相比于chatglm有几方面的提升：1.性能提升：相比初代模型，升级了ChatGLM2-6B的基座模型，同时在各项数据集评测上取得了不错的成绩；2.更长的上下文：我们将基座模型的上下文长度（ContextLe

AIGC大模型ChatGLM2-6B：国产版chatgpt本地部署及体验

1ChatGLM2-6B介绍ChatGLM是清华技术成果转化的公司智谱AI研发的支持中英双语的对话机器人。ChatGLM基于GLM130B千亿基础模型训练，它具备多领域知识、代码能力、常识推理及运用能力；支持与用户通过自然语言对话进行交互，处理多种自然语言任务。比如：对话聊天、智能问答、创作文章、创作剧本、事件抽取、生成代码等等ChatGLM2-6B升级亮点ChatGLM-6B的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上，又增加许多新特性：（1）更强大的性能基于ChatGLM初代模型的开发经验，全面升级了ChatGLM2-6B的基座模型。ChatGLM2-6B使

ChatGLM-6B does not appear to have a file named config.json.

文章目录代码调用演示效果实例一、问题二、场景说明三、error说明四、解决解决一解决二ChatGLM-6B是一个由清华大学和智谱AI联合研发的开源对话语言模型。它是一个支持中英双语问答的对话系统，并在中文方面进行了特别的优化。该模型基于GeneralLanguageModel(GLM)架构，具有62亿参数。借助模型量化技术，用户可以在消费级的显卡上进行本地部署，INT4量化级别下最低只需6GB显存。ChatGLM-6B使用了和ChatGLM相同的技术，针对中文问答和对话进行了优化经过约1T标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62亿参数的ChatGLM-6

AIGC：【LLM（四）】——LangChain+ChatGLM:本地知识库问答方案

文章目录一.文件加载与分割二.文本向量化与存储1.文本向量化(embedding)2.存储到向量数据库三.问句向量化四.相似文档检索五.prompt构建六.答案生成LangChain+ChatGLM项目(https://github.com/chatchat-space/langchain-ChatGLM)实现原理如下图所示(与基于文档的问答大同小异，过程包括：1加载文档->2读取文档->3/4文档分割->5/6文本向量化->8/9问句向量化->10在文档向量中匹配出与问句向量最相似的topk个->11/12/13匹配出的文本作为上下文和问题一起添加到prompt中->14/15提交给LLM生

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型，开箱即用

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型，开箱即用TextGen:ImplementationofTextGenerationmodels1.介绍TextGen实现了多种文本生成模型，包括：LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型，开箱即用。1.1最新更新[2023/06/15]v1.0.0版本:新增ChatGLM/LLaMA/Bloom模型的多轮对话微调训练，并发布医疗问诊LoRA模型shibing624/ziya-llama-

chatglm2-6b模型在9n-triton中部署并集成至langchain实践

一.前言近期，ChatGLM-6B的第二代版本ChatGLM2-6B已经正式发布，引入了如下新特性：①.基座模型升级，性能更强大，在中文C-Eval榜单中，以51.7分位列第6；②.支持8K-32k的上下文；③.推理性能提升了42%；④.对学术研究完全开放，允许申请商用授权。目前大多数部署方案采用的是fastapi+uvicorn+transformers，这种方式适合快速运行一些demo，在生产环境中使用还是推荐使用专门的深度学习推理服务框架，如Triton。本文将介绍我利用集团9n-triton工具部署ChatGLM2-6B过程中踩过的一些坑，希望可以为有部署需求的同学提供一些帮助。二.硬

【AI实战】ChatGLM2-6B 微调：AttributeError: ‘ChatGLMModel‘ object has no attribute ‘prefix_encoder‘

【AI实战】ChatGLM2-6B微调：AttributeError:'ChatGLMModel'objecthasnoattribute'prefix_encoder'ChatGLM2-6B介绍ChatGLM2微调问题解决方法1.安装transformers版本2.重新下载THUDM/chatglm2-6b中的文件3.重新训练参考ChatGLM2-6B介绍ChatGLM2-6B是开源中英双语对话模型ChatGLM-6B的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上，ChatGLM2-6B引入了如下新特性：1.更强大的性能：基于ChatGLM初代模型的开发经验，我

Centos/Ubuntu离线部署清华chatGLM（特别详细，十分钟搞定）

引言前段时间，清华公布了中英双语对话模型ChatGLM-6B，具有60亿的参数，初具问答和对话功能。最！最！最重要的是它能够支持私有化部署，大部分实验室的服务器基本上都能跑起来。因为条件特殊，实验室网络不通，那么如何进行离线部署呢？经过一下午的折腾终于搞定了，总结了这么一个部署文档供大家讨论学习。除去下载模型以及依赖包的时间，部署十分钟搞定！！让我们冲~~前提条件CUDAVersion11.0，内存32G或者显卡内存8G+8G机器内存及以上。安装Miniconda1.1获取安装包方法一、把Miniconda安装包、ChatGLM-6B模型、webui项目、项目依赖包都放到网盘里面了，可以直接通

导出LLaMA ChatGlm2等LLM模型为onnx

通过onnx模型可以在支持onnx推理的推理引擎上进行推理，从而可以将LLM部署在更加广泛的平台上面。此外还可以具有避免pytorch依赖，获得更好的性能等优势。这篇博客（大模型LLaMa及周边项目（二）-知乎）进行了llama导出onnx的开创性的工作，但是依赖于侵入式修改transformers库，比较不方便。这里本人实现了避免侵入式修改transformers库导出LLM为ONNX方法，代码库为:https://github.com/luchangli03/export_llama_to_onnx导出的LLM进行onnxsim优化：一种大于2GBONNX模型onnxsim优化方法_Luc