草庐IT

LangChain-ChatGLM-Webui

全部标签

LangChain入门指南:定义、功能和工作原理

LangChain入门指南:定义、功能和工作原理引言LangChain是什么?LangChain的核心功能LangChain的工作原理LangChain实际应用案例如何开始使用LangChain引言在人工智能的浪潮中,语言模型已成为推动技术革新的重要力量。从简单的文本生成到复杂的交互式应用,语言模型正在重塑我们与机器交流的方式。在这个多变的技术领域,一个新兴的框架——LangChain——崭露头角,为开发基于语言模型的应用程序开辟了新的路径。LangChain不仅仅是又一个编程框架;它是一个连接语言模型与现实世界数据的桥梁。在LangChain的加持下,语言模型不再局限于处理静态的文本数据,而

【LangChain系列文章】4. 向量数据库Vector Stores

LangChainNo.4文章目录文本嵌入模型Textembeddingmodels简介文本嵌入模型使用向量数据库使用通过文本创建索引加载文件创建索引向量数据库类别如何选择向量数据库存储和搜索非结构化数据的常用方法之一是嵌入并存储生成的嵌入向量,然后在查询时嵌入非结构化查询并检索与嵌入查询“最相似”的嵌入向量。矢量存储负责存储嵌入数据并执行矢量搜索。使用向量数据库的一个关键步骤是创建文本向量,并存储进数据库。这个工作通常是通过Embedding实现的。所以,使用向量数据库前,首先需要熟悉文本嵌入模型textembeddingmodel文本嵌入模型Textembeddingmodels简介提供文

LangChain与Redis合作搞事情!创建提高财务文档分析准确性的工具

作者|Tannista编译|星璇出品|51CTO技术栈(微信号:blog51cto)让ChatGPT准确回答来自证券交易委员会文件的复杂问题,可谓是到处都是坑。先进人工智能模型的出现彻底改变了自然语言处理领域,使机器能够以越来越高的准确性和复杂性来分析、解释和响应人类语言。然而,尽管这些模型取得了重大进步,但一些人工智能助手(例如ChatGPT)在准确回答来自证券交易委员会文件的复杂问题方面仍然面临挑战。PatronusAI的研究人员发现,即使是性能最好的AI模型配置 OpenAI 的GPT-4-Turbo,在PatronusAI的新测试中也只能正确回答79%的问题。1、Redis与 Lang

LLaMa、Qwen、ChatGLM、ChatGLM2的区别

LLaMa、Qwen、ChatGLM、ChatGLM2的区别以下比较的前提是首先和BERT(transfomer)的对比感谢帮忙给我githubrepository的star,更多最新模型长期更新:https://github.com/zysNLP/quickllmLLaMa:去掉biasLayNorm方式:RMSnorm:https://zhuanlan.zhihu.com/p/650231190#torch自带LayerNormifself.norm_mode=='torch_buildin': returnF.layer_norm(hidden_states,self.normalize

FreeGPT-WebUI(CPP)

1.CppFreeGPTWebUI项目简介CppFreeGPTWebUI是一个开源项目,旨在为GPT模型提供一个简单易用的Web用户界面。这个项目可以帮助用户轻松地在浏览器中与GPT模型进行交互,而无需专业的编程知识。它的web服务器是使用c++实施的,使用c++实现gpt4free的接口项目的GitHub页面:https://github.com/fantasy-peak/cpp-freegpt-webuidockerrun-p8858:8858-it--namefreegptfantasypeak/freegpt:latestdockerrun-p8858:8858-it--namefre

Stable-diffusion-webui本地部署和简要介绍

 StableDiffusion是一款基于人工智能技术开发的绘画软件,它可以帮助艺术家和设计师快速创建高品质的数字艺术作品。是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像,同时也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词指导下产生图生图的翻译。  StableDiffusion项目本地化的部署,是纯代码界面,而StableDiffusionWebUI,是基于StableDiffusion项目的可视化操作项目。这里我们也是部署StableDiffusionWebUI。本地部署StableDiffusionUI前置条件 在部署StableDiffus

Stable-diffusion WebUI API调用方法

写这篇文章的主要原因是工作中需要写一个用训练好的模型批量生图的脚本,开始是想用python直接加载模型,但后来发现webui的界面中有很多用起来比较方便的插件和参数,最终改成调用WebUI接口的方式来批量生图。Stable-diffusion的webui界面使用比较方便,但是它的api文档比较简陋,很多功能需要去看源码,所以在这里记录下主要的调用方法相关文档官方文档:API·AUTOMATIC1111/stable-diffusion-webuiWiki·GitHub运行方式#1.首先需要在webui-user.bat中给COMMANDLINE_ARGS添加--api参数#2.启动命令中需要添

text-generation-webui加载codellama报错DLL load failed while importing flash_attn_2_cuda: 找不到指定的模块。

使用text-generation-webui加载codellama,报错:Traceback(mostrecentcalllast):File"C:\Users\Ma\AppData\Roaming\Python\Python310\site-packages\transformers\utils\import_utils.py",line1353,in_get_modulereturnimportlib.import_module("."+module_name,self.__name__)File"D:\Anaconda\Anaconda\envs\codellama\lib\impor

大模型应用开发框架 LangChain 学习笔记

一场关于大模型的战役正在全世界激烈地上演着,国内外的各大科技巨头和研究机构纷纷投入到这场战役中,光是写名字就能罗列出一大串,比如国外的有OpenAI的 GPT-4,Meta的 LLaMa,StanfordUniversity的 Alpaca,Google的 LaMDA 和 PaLM2,Anthropic的 Claude,Databricks的 Dolly,国内的有百度的 文心,阿里的 通义,科大讯飞的 星火,华为的 盘古,复旦大学的 MOSS,智谱AI的 ChatGLM 等等等等。一时间大模型如百花齐放,百鸟争鸣,并在向各个行业领域渗透,让人感觉通用人工智能仿佛就在眼前。基于大模型开发的应用和

使用vLLM和ChatGLM3-6b批量推理

当数据量大的时候,比如百万级别,使用ChatGLM3-6b推理的速度是很慢的。发现使用vLLM和ChatGLM3-6b批量推理极大的提高了推理效率。本文主要通过一个简单的例子进行实践。1.安装vLLM和PyTorch[2]除了Python(本文使用3.11)、CUDA(本文使用11.8)外,还要安装vllm、pytorch、xformers等库,特别注意版本要一致。官方提供类库版本主要是针对CUDA12.1版。如下所示:# 用CUDA 11.8安装vLLM# 指定vLLM版本export VLLM_VERSION=0.2.6# 指定Python版本export PYTHON_VERSION=3