草庐IT

LangChain-ChatGLM-Webui

全部标签

用通俗易懂的方式讲解大模型:在 CPU 服务器上部署 ChatGLM3-6B 模型

大语言模型(LLM)的量化技术可以大大降低LLM部署所需的计算资源,模型量化后可以将LLM的显存使用量降低数倍,甚至可以将LLM转换为完全无需显存的模型,这对于LLM的推广使用来说是非常有吸引力的。本文将介绍如何量化ChatGLM3-6B模型的GGML版本,并介绍如何在Colab的CPU服务器上部署量化后的模型,让大家在了解如何量化模型的同时也熟悉Colab的操作。通俗易懂讲解大模型系列用通俗易懂的方式讲解大模型:ChatGLM3-6B功能原理解析用通俗易懂的方式讲解大模型:使用LangChain和大模型生成海报文案用通俗易懂的方式讲解大模型:一个强大的LLM微调工具LLaMAFactory用

Stable Diffusion WebUI制作光影文字效果

在huggingface上下载control_v1p_sd15_brightness模型。将模型放在stable-diffusion-webui\extensions\sd-webui-controlnet\models目录下。SD参数配置正向提示词:city,Building,tallbuilding,NeonLight,gentlelightshinesthrough,animestyle,painting,highdefinition,lotsofdetails,balancedcolors,warmth,nightstarrysky,peoplewalkingdownthestreet

让AI做决策,学会langChain的Agent

今天内容涉及如下:1.initialize_agent,:执行gent工作,并把工具Tool传入2.Tool:选取行为函数工具类之前我们学习的都是把问题给AI,让AI模型给出答案,那么这种情况下应该怎么处理呢,我需要根据不同的问题选择不同的答案,比如我问AI我想选择一件衣服就去调用挑选衣服的方法,如果是查询订单,那么就专门去调用搜索订单的方法,如果是查询物流就专门去调用物流方面的方法,但是怎么识别出来哪个调用哪个呢?我们下面代码先模拟出怎么让AI根据我们的话语做选择,#!pipinstallopenai!pipinstalllangchainimportopenai,osfromlangcha

LLaMA、Baichuan、ChatGLM、Qwen、天工等大模型对比

12.10更新:Qwen技术报告核心解读BaichuanBaichuan2:OpenLarge-scaleLanguageModels数据处理:数据频率和质量,使用聚类和去重方法,基于LSH和denseembedding方法tokenizer:更好的压缩率,对数字的每一位分开,添加空格token位置编码:7BRope,13BALiBi使用了SwiGLU激活函数,因为SwiGLU是一个双线性层,多引入一个门控矩阵,参数量更多,hidden_size从4减少到了8/3使用了更高效的基于xFormers的attention实现使用RMSNorm,对transformer的block输入进行了Laye

WebUI自动化学习(Selenium+Python+Pytest框架)004

接下来,WebUI基础知识最后一篇。1.下拉框操作关于下拉框的处理有两种方式(1)按普通元素定位    安装普通元素的定位方式来定位下拉框,使用元素的操作方法element.click()方法来操作下拉框内容的选择(2)使用Select()类    Select()封装了3种可以查找下拉框选项的方法,实现对下拉框选项的选择,不用在进行点击动作,找到就直接选中了        使用流程:        定位到下拉框元素    driver.find_element_by_xxx('XXX')        实例化下拉框选项类        select=Select(element)      

LangChain简明指南,LangChain是什么?可以用来做什么?

背景自从2020年OpenAI发布GPT-3之后,大型语言模型(LLM)就在世界上广受欢迎,一直保持稳定的增长。直到2022年底,对于LLM和生成AI等广泛领域的兴趣才开始迅速增长,这可能是因为大量关于GPT-3的重大进展推动了这一趋势。Google发布了名为LaMDA的具有“有感知能力”的聊天机器人,首个高性能且开源的LLM——BLOOM也已经发布。此外,OpenAI还发布了他们的下一代文本嵌入模型和下一代“GPT-3.5”模型。在LLM领域取得巨大飞跃后,OpenAI推出了名为ChatGPT的新模型,使LLM成为人们关注的焦点。同时,HarrisonChase创造的LangChain也应运

Elasticsearch:使用 Gemini、Langchain 和 Elasticsearch 进行问答

本教程演示如何使用GeminiAPI创建embeddings并将其存储在Elasticsearch中。我们将学习如何将Gemini连接到Elasticsearch中存储的私有数据,并使用Langchian构建问答功能。准备Elasticsearch及Kibana如果你还没有安装好自己的Elasticsearch及Kibana的话,请参阅如下的文章来进行安装:如何在Linux,MacOS及Windows上进行安装ElasticsearchKibana:如何在Linux,MacOS及Windows上安装Elastic栈中的Kibana在安装的时候,请参照ElasticStack8.x的文章来进行安

Langchain 与 Elasticsearch:创新数据检索的融合实战

1、简介在信息爆炸的时代,有效地检索和处理数据变得至关重要。Langchain和Elasticsearch的结合,为我们提供了一个强大的工具,以更智能的方式进行数据检索和分析。作为一名拥有多年Elasticsearch实战经验的技术博主,我将在本文中详细介绍这两种技术的整合应用。2、LangChain简介Langchain是一个旨在简化自然语言处理任务的库。它允许开发者轻松地集成和使用各种AI模型,如GPT-3,来处理复杂的语言任务。3、Elasticsearch简介Elasticsearch是一个高度可扩展的开源全文搜索和分析引擎。它允许用户快速、实时地进行和分析大量数据。4、LangCha

从零开发短视频电商 Java开发者的AI大模型(LLM)应用开发和设计-LangChain4j

文章目录简介示例1.添加依赖2.设置OpenAIAPI密钥3.创建模型的实例并开始交互功能实践爬取网页并embeddingHuggingFace在线API集成加载离线model简介Github:https://github.com/langchain4jhttps://github.com/langchain4j/langchain4jhttps://github.com/langchain4j/langchain4j-embeddingshttps://github.com/langchain4j/langchain4j-examplesJava版langchain,利用LLMs的力量增强你

离线AI聊天清华大模型(ChatGLM3)本地搭建

在特定的情况下,要保证信息安全的同时还能享受到AIGC大模型带来的乐趣和功能,那么,离线部署就能帮助到你,最起码,它是一个真正可用的方案。大模型本身清华的(ChatGLM3),为的是对中文支持友好,另外就是我也很看好它,毕竟一直在优化自己的模型,提升模型的质量。如果基础环境没有布置好可以参考我上篇文章《Ubuntu22.04TeslaV100s显卡驱动,CUDA,cuDNN,MiniCONDA3环境的安装》。ChatGLM3(ChatGLM3-6B)项目地址https://github.com/THUDM/ChatGLM3大模型是很吃CPU和显卡的,所以,要不有一个好的CPU,要不有一块好的显