草庐IT

LLM-Vicuna

全部标签

LangChain大型语言模型(LLM)应用开发(五):评估

LangChain是一个基于大语言模型(如ChatGPT)用于构建端到端语言模型应用的Python框架。它提供了一套工具、组件和接口,可简化创建由大型语言模型(LLM)和聊天模型提供支持的应用程序的过程。LangChain可以轻松管理与语言模型的交互,将多个组件链接在一起,以便在不同的应用程序中使用。今天我们来学习DeepLearning.AI的在线课程:LangChainforLLMApplicationDevelopment的第五门课:Evaluation(评估),所谓评估是指检验LLM回答的问题是否正确的方法,在上一篇博客Q&AoverDocuments中我们解释了如何通过langcha

懂3D的语言模型来了!UCLA、上交、MIT等联合提出3D-LLM:性能大涨9%

大型语言模型(LLM)和视觉语言模型(VLM)在各种评测基准中都展现出了强大的性能,比如可以看图说话、进行常识推理。但这些模型的训练过程并没有引入3D物理世界,也就无法理解更丰富的现实概念,包括空间关系、布局、物体反馈等。最近,加州大学洛杉矶分校、上海交大、华南理工大学、麻省理工学院等机构的研究人员联合提出了一个全新的3D-LLM任务,把3D世界的知识注入到大型语言模型中,以3D点云及其特征作为输入,从而可以执行各种3D相关的任务,包括描述生成、3D问题回答、任务分解、3D辅助对话、导航等。论文链接:https://arxiv.org/pdf/2307.12981.pdf基于这个思路,研究人员

LangChain:打造自己的LLM应用

1、LangChain是什么LangChain是一个框架,用于开发由LLM驱动的应用程序。可以简单认为是LLM领域的Spring,以及开源版的ChatGPT插件系统。核心的2个功能为:1)可以将LLM模型与外部数据源进行连接。2)允许与LLM模型与环境进行交互,通过Agent使用工具。2、LangChain核心组件LangChain提供了各种不同的组件帮助使用LLM,如下图所示,核心组件有Models、Indexes、Chains、Memory以及Agent。2.1ModelsLangChain本身不提供LLM,提供通用的接口访问LLM,可以很方便的更换底层的LLM以及自定义自己的LLM。主要

[NLP]LLM高效微调(PEFT)--LoRA

LoRA背景神经网络包含很多全连接层,其借助于矩阵乘法得以实现,然而,很多全连接层的权重矩阵都是满秩的。当针对特定任务进行微调后,模型中权重矩阵其实具有很低的本征秩(intrinsicrank),因此,论文的作者认为权重更新的那部分参数矩阵尽管随机投影到较小的子空间,仍然可以有效的学习,可以理解为针对特定的下游任务这些权重矩阵就不要求满秩。技术原理LoRA(论文:LoRA:LOW-RANKADAPTATIONOFLARGELANGUAGEMODELS),该方法的核心思想就是通过低秩分解来模拟参数的改变量,从而以极小的参数量来实现大模型的间接训练。在涉及到矩阵相乘的模块,在原始的PLM旁边增加一

图技术在 LLM 下的应用:知识图谱驱动的大语言模型 Llama Index

LLM如火如荼地发展了大半年,各类大模型和相关框架也逐步成型,可被大家应用到业务实际中。在这个过程中,我们可能会遇到一类问题是:现有的哪些数据,如何更好地与LLM对接上。像是大家都在用的知识图谱,现在的图谱该如何借助大模型,发挥更大的价值呢?在本文,我便会和大家分享下如何利用知识图谱构建更好的In-contextLearning大语言模型应用。此文最初以英文撰写的,而后我麻烦ChatGPT帮我翻译成了英文。下面是翻译的prompt:“Inthisthread,youareaChineseTechbloggertohelptranslatemybloginmarkdownfromEnglishi

使用LLM插件从命令行访问Llama 2

最近的一个大新闻是MetaAI推出了新的开源授权的大型语言模型Llama2。这是一项非常重要的进展:Llama2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA2更名为Llama2)。Facebook最初的LLaMA模型于今年2月发布,掀起了开源LLM领域的创新浪潮——从微调变体到从零开始的再创造。只有一个限制:用户不能将它用于商业目的。Llama2的出现改变了这一点!它仍然有一些有趣的限制,重点是:用户不得使用Llama材料或Llama材料的任何输出或结果来改进任何其他大型语言模型(不包括Llama2或其衍生作品)。如果在Llama2版本发布之日,由被许可人或被许可人的附属

LLM-LLaMA:使用Huggingface提供的脚本文件,对原始的LLaMA-13B转换为Huggingface的格式

使用Huggingface提供的脚本文件,对原始的LLaMA-13B转换为Huggingface的格式,具体的脚本文件在此处。下面是运行的命令(假设下载的原始文件位于./下,希望转换后的路径为./converted):pythonconvert_llama_weights_to_hf.py--input_dir./--model_size13B--output_dir./converted  convert_llama_weights_to_hf.py#Copyright2022EleutherAIandTheHuggingFaceInc.team.Allrightsreserved.##Li

llama.cpp LLM模型 windows cpu安装部署踩坑记录

一直想在自己的笔记本上部署一个大模型验证,早就听说了llama.cpp,可是一直没时间弄。今天终于有时间验证了。首先本机安装好g++,cmake.我下载的cmake版本是cmake-3.27.0-rc4-windows-x86_64.msi。安装时选择增加系统变量。接着GitHub-ggerganov/llama.cpp:PortofFacebook'sLLaMAmodelinC/C++执行以下步骤:gitclonehttps://github.com/ggerganov/llama.cppcdllama.cppmkdirbuildcdbuildcmake..cmake--build.--co

企业应该如何利用生成式 AI? —— 10+用例和LLM最佳实践

目录HowshouldenterprisesleveragegenerativeAI?企业应该如何利用生成式AI?Whataretheguidelinesforenterprisegenerativemodels?企业生成模型的准则是什么?Consistent 一致 Controlled 控制 Ethicallytrained 受过道德培训 Explainable 解释 Fair 公平 

LLM - Chinese-Llama-2-7b 初体验

目录一.引言二.模型下载三.快速测试四.训练数据五.总结一.引言自打LLama-2发布后就一直在等大佬们发布LLama-2的适配中文版,也是这几天蹲到了一版由LinkSoul发布的 Chinese-Llama-2-7b,其共发布了一个常规版本和一个4-bit的量化版本,今天我们主要体验下Llama-2的中文逻辑顺便看下其训练样本的样式,后续有机会把训练和微调跑起来。二.模型下载HuggingFace: https://huggingface.co/LinkSoul/Chinese-Llama-2-7b4bit量化版本: https://huggingface.co/LinkSoul/Chine