LLM-Vicuna_草庐IT

解密Prompt系列14. LLM Agent之搜索应用设计：WebGPT & WebGLM & WebCPM

前两章，我们分别介绍了基于微调和prompt的工具调用方案，核心都是如何让大模型和工具进行交互，包括生成工具调用语句和处理工具调用请求。不过在实际应用中，想要设计一个可以落地的LLMAgent，需要更全面整体的系统设计。本章我们以搜索工具为例，介绍如何更好和搜索引擎进行交互的LLMAgent。搜索Agent方案为啥需要整体方案，直接调用搜索接口取Top1返回不成嘛？要是果真如此Simple&Naive，NewBing岂不是很容易复刻->.->我们先来看个例子，前一阵火爆全网的常温超导技术，如果想回答LK99哪些板块会涨，你会得到以下搜索答案从以上的搜索结果不难发现，Top1答案并不能回答问题，

用BigDL-LLM 即刻加速百亿级参数LLM推理

我们正迈入一个由大语言模型（LargeLanguageModel,LLM）驱动的AI新时代，LLM在诸如客户服务、虚拟助理、内容创作、编程辅助等各类应用中正发挥着越来越重要的作用。然而，随着LLM规模不断扩大，运行大模型所需的资源消耗也越来越大，导致其运行也越来越慢，这给AI应用开发者带来了相当大的挑战。为此，英特尔最近推出了一个名为BigDL-LLM[1]的大模型开源库，可助力AI开发者和研究者在英特尔® 平台上加速优化大语言模型，提升大语言模型在英特尔® 平台上的使用体验。下面就展示了使用BigDL-LLM加速过的330亿参数的大语言模型Vicuna-33b-v1.3[2]在一台搭载英特尔

通过 Amazon SageMaker JumpStart 部署 Llama 2 快速构建专属 LLM 应用

来自Meta的Llama2基础模型现已在AmazonSageMakerJumpStart中提供。我们可以通过使用AmazonSageMakerJumpStart快速部署Llama2模型，并且结合开源UI工具Gradio打造专属LLM应用。Llama2简介Llama2是使用优化的Transformer架构的自回归语言模型, 旨在用于英文领域的商业和研究用途，其context长度是Llama1代的两倍。目前提供三种参数规格（7B、13B和70B）的基础模型。（来源：https://ai.meta.com/llama/）使用SageMakerJumpStart 简化大模型的部署一站式开发平台Amaz

为何向量数据库对LLM很重要？

译者|布加迪审校|重楼当您浏览Twitter、LinkedIn或新闻源上的时间轴时，可能会看到一些关于聊天机器人、LLM和GPT的内容。因为每周都有新的LLM发布，很多人都在谈论LLM。我们目前置身于一场人工智能革命，许多新应用都依赖于向量嵌入。不妨让我们更多地了解向量数据库以及为什么它们对LLM很重要。向量数据库的定义不妨先定义向量嵌入（VectorEmbedding）。向量嵌入是一种数据表示，它携带语义信息，帮助人工智能系统更好地理解数据，并能够保持长期记忆。对于任何您想学的新东西，最重要的部分是理解并记住主题。嵌入是由人工智能模型生成的，比如含有大量特征的LLM，这使得它们的表示难以管理

AIGC：【LLM（四）】——LangChain+ChatGLM:本地知识库问答方案

文章目录一.文件加载与分割二.文本向量化与存储1.文本向量化(embedding)2.存储到向量数据库三.问句向量化四.相似文档检索五.prompt构建六.答案生成LangChain+ChatGLM项目(https://github.com/chatchat-space/langchain-ChatGLM)实现原理如下图所示(与基于文档的问答大同小异，过程包括：1加载文档->2读取文档->3/4文档分割->5/6文本向量化->8/9问句向量化->10在文档向量中匹配出与问句向量最相似的topk个->11/12/13匹配出的文本作为上下文和问题一起添加到prompt中->14/15提交给LLM生

意外！明星公司 Jasper 裁员；SD进阶教程之混合语法；2份LLM进展必读报告；谷歌Bard支持中文且免费 | ShowMeAI日报

👀日报&周刊合集|🎡生产力工具与行业应用大全|🧡点赞关注评论拜托啦！🤖AIGC领域的当红炸子鸡Jasper裁员，转头聚焦AI营销Jasper是一家美国人工智能公司，乘着AIGC的东风迅速崛起，成为AI助手领域的独角兽。不过其创始人兼CEODaveRogenmoser在个人LinkedIn账号宣布，公司要裁员了。在经过了大量业务探索后，公司决定专注为大中型企业的营销团队提供AI服务，因此将裁撤其他业务线员工。不过，Dave在帖子中也说明，被裁撤的员工非常优秀并会为他们推荐新工作⋙LinkedIn@DaveRogenmoser|了解更多Jasper创业史🤖Bard悄咪咪支持中文了！Google这波

文生图prompt不再又臭又长！LLM增强扩散模型，简单句就能生成高质量图像

扩散模型已经成为了主流的文本到图像生成模型，可以基于文本提示的引导，生成高质量且内容丰富的图像。但如果输入的提示过于简洁，现有的模型在语义理解和常识推理方面都存在局限，导致生成的图像质量下降明显。为了提高模型理解叙述性提示的能力，中山大学HCP实验室林倞团队提出了一种简单而有效的参数高效的微调方法SUR-adapter，即语义理解和推理适配器，可应用于预训练的扩散模型。论文地址：https://arxiv.org/abs/2305.05189开源地址：https://github.com/Qrange-group/SUR-adapter为了实现该目标，研究人员首先收集并标注了一个数据集SURD

中国科学院团队首篇LLM模型压缩综述：细聊剪枝、知识蒸馏、量化技术

近来，大型语言模型（LLM）在各种任务中表现出色。然而，即便有卓越的任务处理能力，LLM却面临着巨大的挑战，这些挑战源于其巨大的规模和计算需求。举个例子，GPT-175B版本具有惊人的1750亿参数，至少需要320GB（使用1024的倍数）的半精度（FP16）格式存储。此外，部署此模型进行推理还需要至少五个A100GPU，每个GPU具有80GB的内存，这样才能有效地保证运行。为了解决这些问题，当下一种被称为模型压缩的方法可以成为解决方案。模型压缩可以将大型、资源密集型模型转换为适合存储在受限移动设备上的紧凑版本。此外它可以优化模型，以最小的延迟更快地执行，或实现这些目标之间的平衡。除了技术方面

电脑部署本地类似ChatGPT3.5的AI模型Vicuna的常见错误和原因

1.msvcp140.dll丢失的解决方方法进入电脑的程序和功能只要是像下面图片的全部点击修复或者重新安装再或者从网上下载缺少的vc运行库文件放进自己的C:\Windows\System里，您的系统是64位的请将文源件复制到C:\Windows\SysWOW64目录。 2.由于llama运行旧的模型需要的版本和llama的版本需要兼容，所以在2023年5月12日以后的llama.cpp才能使用新的权重。3报错“tok_embeddings.weight你的ggml模型与ggml.cpp不兼容。4.这种报错你的模型下载后被你改了名字因此找不到GGML了。5.如果你的llama的版本太高运行不了

开源LLM微调训练指南：如何打造属于自己的LLM模型

一、介绍今天我们来聊一聊关于LLM的微调训练，LLM应该算是目前当之无愧的最有影响力的AI技术。尽管它只是一个语言模型，但它具备理解和生成人类语言的能力，非常厉害！它可以革新各个行业，包括自然语言处理、机器翻译、内容创作和客户服务等，成为未来商业环境的重要组成部分。我相信很多人在领略了GPT等大语言模型的魅力之后，都希望迫不及待的考虑能将模型能力集成到自己的产品中去，提升产品竞争力，由于LLM天然具备强大的语义理解能力，使得我们原来在用尝试用NLP去解决一些比较困难的问题突然变得迎刃而解，非常简单，甚至超出你的想象。此刻，我脑海里已经想到了很多可以借助LLM来实现的场景。但是，我们也要面对一个