草庐IT

langchain-ChatGLM

全部标签

Llama 2 with langchain项目详解(一)

Llama2withlangchain项目详解(一)2023年2月25日,美国Meta公司发布了Llama1开源大模型。随后,于2023年7月18日,Meta公司发布了Llama2开源大模型,该系列包括了70亿、130亿和700亿等不同参数规模的模型。相较于Llama1,Llama2的训练数据增加了40%,上下文长度提升至4096,是Llama1的两倍,并且引入了分组查询注意力机制。具体而言,Llama2大模型在2万亿个标记上进行了训练,并使用了100万个人类标注的数据进行微调,如图17-1所示。图17-1Llama2模型和Llama1模型的比较据测评结果显示,Llama2在包括推理、编码、知

【LangChain】SQL

LangChain学习文档流行【LangChain】RetrievalQA【LangChain】对话式问答(ConversationalRetrievalQA)【LangChain】SQL概要本文讲述如何使用SQLDatabaseChain通过SQL数据库回答问题。在底层,LangChain使用SQLAlchemy连接到SQL数据库。因此,SQLDatabaseChain可以与SQLAlchemy支持的任何SQL方言一起使用,例如MSSQL、MySQL、MariaDB、PostgreSQL、OracleSQL、Databricks和SQLite。有关连接到数据库的要求的更多信息,请参阅SQLA

LangChain-Chatchat学习资料-Windows开发部署

在windows10下的安装部署参考资料1.LacnChain-Chatchat项目基础环境准备本人使用的是Windows10专业版22H2版本,已经安装了Python3.10,CUDA11.8版本,miniconda3。硬件采用联想R9000P,AMDR75800H,16G内存,RTX30606G。安装依赖#使用conda安装激活环境condacreate-nLangchain-Chatchatpython=3.10condaactivateLangchain-Chatchat#拉取仓库gitclonehttps://github.com/chatchat-space/Langchain-C

用LangChain开源框架实现知识机器人

前言LargeLanguageModels(LLMs)在2020年OpenAI的GPT-3的发布而进入世界舞台。从那时起,他们稳步增长进入公众视野。众所周知OpenAI的API无法联网,所以大家如果想通过它的API实现联网搜索并给出回答、总结PDF文档、基于某个Youtube视频进行问答等等的功能肯定是无法实现的。所以,我们来介绍一个非常强大的第三方开源库:LangChain。LangChain是一个用于开发由语言模型驱动的应用程序的框架。他主要拥有2个能力:可以将LLM模型与外部数据源进行连接&允许与LLM模型进行交互。项目地址:https://github.com/langchain-ai

chatglm2-6b模型在9n-triton中部署并集成至langchain实践

一.前言近期,ChatGLM-6B的第二代版本ChatGLM2-6B已经正式发布,引入了如下新特性:①.基座模型升级,性能更强大,在中文C-Eval榜单中,以51.7分位列第6;②.支持8K-32k的上下文;③.推理性能提升了42%;④.对学术研究完全开放,允许申请商用授权。目前大多数部署方案采用的是fastapi+uvicorn+transformers,这种方式适合快速运行一些demo,在生产环境中使用还是推荐使用专门的深度学习推理服务框架,如Triton。本文将介绍我利用集团9n-triton工具部署ChatGLM2-6B过程中踩过的一些坑,希望可以为有部署需求的同学提供一些帮助。二.硬

【AI实战】ChatGLM2-6B 微调:AttributeError: ‘ChatGLMModel‘ object has no attribute ‘prefix_encoder‘

【AI实战】ChatGLM2-6B微调:AttributeError:'ChatGLMModel'objecthasnoattribute'prefix_encoder'ChatGLM2-6B介绍ChatGLM2微调问题解决方法1.安装transformers版本2.重新下载THUDM/chatglm2-6b中的文件3.重新训练参考ChatGLM2-6B介绍ChatGLM2-6B是开源中英双语对话模型ChatGLM-6B的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B引入了如下新特性:1.更强大的性能:基于ChatGLM初代模型的开发经验,我

Centos/Ubuntu离线部署清华chatGLM(特别详细,十分钟搞定)

引言前段时间,清华公布了中英双语对话模型ChatGLM-6B,具有60亿的参数,初具问答和对话功能。最!最!最重要的是它能够支持私有化部署,大部分实验室的服务器基本上都能跑起来。因为条件特殊,实验室网络不通,那么如何进行离线部署呢?经过一下午的折腾终于搞定了,总结了这么一个部署文档供大家讨论学习。除去下载模型以及依赖包的时间,部署十分钟搞定!!让我们冲~~前提条件CUDAVersion11.0,内存32G或者显卡内存8G+8G机器内存及以上。安装Miniconda1.1获取安装包方法一、把Miniconda安装包、ChatGLM-6B模型、webui项目、项目依赖包都放到网盘里面了,可以直接通

LangChain:使用自然语言查询数据库

目录前言LangChain介绍为什么选择LangChainLangChain的结构代理SQLDatabaseAgent数据库模式和资源导入必要的库连接到数据库:设置LLM、工具包和代理执行器:使用自然语言查询数据库:完整代码示例:结论前言在LLM模型还没有特别成熟,像现在这样火爆之前,我们对于数据库的传统理解方式依然还是建立在需要先去学习如如何使用SQL脚本来跟Database进行交互。这将需要花费你大量的时间和精力,而且随着时代的发展,数据库版本的升级迭代和新型的数据库产品的诞生,我们都需要快速的去适应。前几年随着云计算的火热,为了适应市场的需求,我们的产品需要去适配各大主流云厂商的DB产品

导出LLaMA ChatGlm2等LLM模型为onnx

通过onnx模型可以在支持onnx推理的推理引擎上进行推理,从而可以将LLM部署在更加广泛的平台上面。此外还可以具有避免pytorch依赖,获得更好的性能等优势。这篇博客(大模型LLaMa及周边项目(二)-知乎)进行了llama导出onnx的开创性的工作,但是依赖于侵入式修改transformers库,比较不方便。这里本人实现了避免侵入式修改transformers库导出LLM为ONNX方法,代码库为:https://github.com/luchangli03/export_llama_to_onnx导出的LLM进行onnxsim优化:一种大于2GBONNX模型onnxsim优化方法_Luc

AI 智能对话 - 基于 ChatGLM2-6B 训练对话知识库

前情提要怎么将AI应用到工作中呢?比如让AI帮忙写代码,自己通过工程上的思维将代码整合排版,我挺烦什么代码逻辑严谨性的问题,但是我又不得不承认这样的好处,我们要开始将角色转换出来,不应该是一个工具人,而成为决策者,这是从AI爆发中看到的发展趋势,人们逐渐从流水线的工作中解放出来,逐渐成为可以独立思考的自由人,这是科技革命带给普通人最大的时代红利;但是从另外一个方面看这个问题的时候,每次科技革命到来时,抓不住时代机会的人总会被淘汰一批,当社会的体制的管理逻辑停滞不前,必然会爆发出不可避免的社会矛盾和流血革命,阶级固化不是理想和口号能解决的,有人做狼必然需要很多羊,这是自然法则,妄图通过口号改变这