草庐IT

开源大模型ChatGLM2-6B 2. 跟着LangChain参考文档搭建LLM+知识库问答系统

0.环境租用了1台GPU服务器,系统ubuntu20,TeslaV100-16GB(GPU服务器已经关机结束租赁了)SSH地址:*端口:17520SSH账户:root密码:Jaere7pa内网:3389,外网:17518VNC地址:*端口:17519VNC用户名:root密码:Jaere7pa硬件需求,ChatGLM-6B和ChatGLM2-6B相当。量化等级   最低GPU显存FP16(无量化)   13GBINT8   10GBINT4   6GB1.基本环境1.1测试gpunvidia-smi(base)root@ubuntuserver:~#nvidia-smiTueSep1202:0

以大语言模型ChatGLM2-6B为后台,打造个人语音交互机器人Demo

引言随着以ChatGLM2-6B为代表的开源大型语言模型的兴起,人工智能革命正席卷全球……ChatGLM2-6B这一代表性的开源大型模型,以其易于部署、适度的参数量和强大的中文处理能力,为个人用户提供了在个人显卡上部署大型模型的便捷途径。然而,在大型语言模型领域,人机交互仍然主要以传统的文字输入为主,这种方式难以满足人们对实时性和高效率的需求。在许多情景下,人们更期望能够直接与一个语音交互的智能助手互动。本文将结合STT(自动语音识别)、大型模型和TTS(文本到语音合成)等人工智能技术,创建一个具备语音交互功能的智能机器人演示。环境准备在开始之前,我们需要准备好开发环境。本文的代码主要采用Py

使用STM32驱动3WE6B61B/CG24N9Z5L电磁阀(一)

一.方案设计--光耦选型已经完成STM32单片机通过modbusrtu控制16路电磁阀,接下来进行电路设计。设计思路为单片机控制控制光耦,光耦进行放大和隔离后,驱动mos管输出24VPWM波形,进行驱动。1.1光耦简介光耦是隔离传输器件,原边给定信号,副边回路就会输出经过隔离的信号。对于光耦的隔离容易理解,此处不做讨论。以一个简单的图(图.1)说明光耦的工作:原边输入信号Vin,施加到原边的发光二极管和Ri上产生光耦的输入电流If,If驱动发光二极管,使得副边的光敏三极管导通,回路VCC、RL产生Ic,Ic经过RL产生Vout,达到传递信号的目的。原边副边直接的驱动关联是CTR(电流传输比),

对 ChatGLM-6B 做 LoRA Fine-tuning

对ChatGLM-6B做LoRAFine-tuning搭建依赖环境加载模型和Tokenizer分析模型结构配置LoRA构建数据集定义常量测试Tokenizer的编解码定义Prompt构建AttentionMask和PositionIDs创建数据集开始训练预测保存训练模型重载训练后的模型ChatGLM-6B是一个支持中英双语的对话语言模型,基于GLM(GeneralLanguageModel)。它只有62亿个参数,量化后最低(INT4量化)只需要6GB的显存,完全可以部署到消费级显卡上。在实际使用这个模型一段时间以后,我们发现模型的对话表现能力确实非常不错。那么,基于这个模型做Fine-tuni

c++ - glm::ivec2 作为无序映射中的键

最近我更喜欢使用Scala编程语言而不是C++,现在我对移植一行非常简单的代码感到沮丧valmap=newHashMap[Vec2i,Entity]它只是拒绝在C++中编译并出现奇怪的模板错误。C++中Vec2i的等价物是glm::ivec2,它基本上是一个具有两个整数和一些数学运算符的结构。这是我得到的结果:#include#include#includeusingnamespacestd;usingnamespaceglm;structKeyTraits{size_toperator()(constivec2&k){returnstd::hash()(k.x)^std::hash(

c++ - 为什么 C++ 找不到 GLM header ?

我没有将GLM放入usr/local/include或usr/include的权限,但我需要将GLM用于openGL。代码(我无法更改)像这样查找GLM:#include#include#includeglm文件夹与我的main.cpp位于同一目录中,此代码来自该文件夹。我认为它不起作用,因为它正在usr/include中寻找glm,内置header所在的位置(我使用的是redhatlinux)我怎样才能阻止这种情况发生,因为我无法运行:g++main.cpp-lGL-lglut-lGLEW没有这些错误:main.cpp:46:23:error:glm/glm.hpp:Nosuchfi

AIGC - ChatGLM大模型:ChatGLM2-6B模型推理部署

前言如果你要问我为什么直接部署ChatGLM2的模型?因为当我在8月份在上海召开的全球人工智能大会上了解到清华-智谱发布的ChatGLM模型时,它已经发布了新的版本ChatGLM2,并且推理的效果提升了不少,那么本着只要最好的原则,我就直接上手先玩新版本了。模型简介部署的环境作为AIGC方面的小白来说,我抱着非常天真的想法,想让它在我的工作笔记本上用i5的CPU去跑,至于为什么这么想,当然是因为我没有GPU,身边也没有其他的带显卡电脑恰好,在腾讯云看到了GN7的显示优惠活动,60块钱15天,NvidiaT4的AI卡,直接斥巨资购买了15天并且为了方便访问模型资源,我这里选择了新加坡的节点软件环

ChatGLM-6B —— 80%替换ChatGPT的开源对话大模型介绍(GLM,General Language Model )

 ChatGLM-6B模型介绍开源地址:GitHub-THUDM/ChatGLM-6B:ChatGLM-6B:开源双语对话语言模型|AnOpenBilingualDialogueLanguageModel在线体验地址:

ChatGLM2-6B微调实践-QLora方案

ChatGLM2-6B微调实践-QLora方案环境部署Lora微调项目部署准备数据集修改训练脚本adapter推理模型合并与量化合并后的模型推理参数调优微调过程中遇到的问题参考:环境部署申请阿里云GPU服务器:CentOS7.664Anaconda3-2023.07-1-Linux-x86_64Python3.11.5GPUNVIDIAA10(显存24G/1core)CPU8vCore/30G安装Anaconda、CUDA、PyTorch参考:ChatGLM2-6B微调实践-P-Tuning方案Lora微调项目部署gitclonehttps://github.com/shuxueslpi/ch

【AI开源大模型】GLM-130B:开放的中英双语预训练模型

文章目录GLM-130B:开放的中英双语预训练模型摘要:何为GLM-130B?快速上手环境配置自回归文本生成/中间文本填空Example1Example2(Chinese)Example1Example2(Chinese)评估使用FasterTransformer加速推理速度(高达2.5倍)何为GLM-130B?架构1.训练目标:自回归文本填空2.位置编码:旋转位置编码