草庐IT

LLM-Blender

全部标签

容器下在 Triton Server 中使用 TensorRT-LLM 进行推理

1.TensorRT-LLM编译模型1.1TensorRT-LLM简介使用TensorRT时,通常需要将模型转换为ONNX格式,再将ONNX转换为TensorRT格式,然后在TensorRT、TritonServer中进行推理。但这个转换过程并不简单,经常会遇到各种报错,需要对模型结构、平台算子有一定的掌握,具备转换和调试能力。而TensorRT-LLM的目标就是降低这一过程的复杂度,让大模型更容易跑在TensorRT 引擎上。需要注意的是,TensorRT针对的是具体硬件,不同的GPU型号需要编译不同的TensorRT格式模型。这与ONNX模型格式的通用性定位显著不同。同时,TensortR

使用CLIP和LLM构建多模态RAG系统

在本文中我们将探讨使用开源大型语言多模态模型(LargeLanguageMulti-Modal)构建检索增强生成(RAG)系统。本文的重点是在不依赖LangChain或LLlamaindex的情况下实现这一目标,这样可以避免更多的框架依赖。什么是RAG在人工智能领域,检索增强生成(retrieve-augmentedGeneration,RAG)作为一种变革性技术改进了大型语言模型(LargeLanguageModels)的能力。从本质上讲,RAG通过允许模型从外部源动态检索实时信息来增强AI响应的特异性。该体系结构将生成能力与动态检索过程无缝结合,使人工智能能够适应不同领域中不断变化的信息。

开源 LLM 安全扫描器

Vigil是一款开源安全扫描程序,可检测即时注入、越狱以及对大型语言模型(LLM)的其他潜在威胁。当攻击者使用专门设计的输入成功影响LLM时,就会出现即时注入。这导致LLM无意中实现了攻击者设定的目标。​我对LLM的可能性感到非常兴奋,但也注意到围绕它们构建的应用程序以及我们允许应用程序访问的数据需要更好的安全实践。这个项目给了我一个很好的机会在人工智能和网络安全的交叉点上构建一些东西。希望它能为其他安全研究人员和开发人员提供一个尝试现有的LLM输入和输出安全措施,甚至创建自己的安全措施的开始。Vigil的创建者AdamM.Swanda告诉我们,这比期望直接在生产中使用的任何东西都更有“可能”

2023-12-30 AIGC-LangChain指南-打造LLM的垂域AI框架

摘要:2023-12-30AIGC-LangChain指南-打造LLM的垂域AI框架LangChain指南-打造LLM的垂域AI框架CHATGPT以来,Langchain可能是目前在AI领域中最热门的事物之一,仅次于向量数据库。它是一个框架,用于在大型语言模型上开发应用程序,例如GPT、LLama、HuggingFace模型等。它最初是一个Python包,但现在也有一个TypeScript版本,在功能上逐渐赶上,并且还有一个刚刚开始的Ruby版本。大家都知道在应用系统的业务中结合ChatGPT需要大量的prompt,想像一下:(1)如果我需要快速读一本书,想通过本书作为prompt,使用Cha

MedicalGPT:基于LLaMA-13B的中英医疗问答模型(LoRA)、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。

项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用CSDN平台,自主完成项目设计升级,提升自身的硬实力。专栏订阅:项目大全提升自身的硬实力[专栏详细介绍:项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域)MedicalGPT:基于LLaMA-13B的中英医疗问答模型(LoRA)、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya

【ChatGPT】Web LLM:你的本地的ChatGPT —— 完全在您的浏览器中运行 vicuna-7b 大型语言模型,它非常令人印象深刻

目录WebLLM—— 完全在您的浏览器中运行vicuna-7b大型语言模型,它非常令人印象深刻指示聊天演示链接免责声明InstructionsChatDemoLinksDisclaimer

GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板

当你让大模型写一首「莎士比亚十四行诗」,并以严格的韵律「ABABCDCDEFEFGG」执行。同时,诗中还要包含提供的3个词。对于这么高难度的创作题,LLM在收到指令后,并不一定能够按要求做出这首诗。正所谓,人各有所长,LLM也是如此,仅凭单一模型有时是无法完成一项任务的。那该如何解?最近,来自斯坦福和OpenAI的两位研究员,设计了一种提升LLM性能的全新方法——元提示(meta-prompting)。「元提示」能够把单一的LLM变身为全能的「指挥家」。论文地址:https://arxiv.org/abs/2401.12954通过使用高层「元提示」指令,让大模型把复杂任务拆成子任务,然后再将这

无需人工标注!LLM加持文本嵌入学习:轻松支持100种语言,适配数十万下游任务

文本嵌入(wordembedding)是自然语言处理(NLP)领域发展的基础,可以将文本映射到语义空间中,并转换为稠密的矢量,已经被广泛应用于各种自然语言处理(NLP)任务中,如信息检索(IR)、问答、文本相似度计算、推荐系统等等,比如在IR领域,第一阶段的检索往往依赖于文本嵌入来进行相似度计算,先在大规模语料库中召回一个小的候选文件集,再进行细粒度的计算;基于嵌入的检索也是检索增强生成(RAG)的关键组成部分,使大型语言模型(LLM)可以访问动态的外部知识,而无需修改模型参数。早期的文本嵌入学习方法如word2vec,GloVe等大多是静态的,无法捕捉自然语言中丰富的上下文信息;随着预训练语

未来五年AI如何改变各学科?从LLM到AI蛋白设计、医疗保健......

五年前(2019年1月),《NatureMachineIntelligence》创刊。当然,就人工智能(AI)而言,五年前似乎是一个不同的时代。1月24日,NatureMachineIntelligence杂志在《AnniversaryAIreflections》(周年人工智能反思)专题中,再次联系并采访了近期在期刊发表评论和观点文章的作者,请他们从各自所在领域中举例说明人工智能如何改变科学过程。想知道,他们对人工智能领域的哪些其他主题感到兴奋、惊讶或担忧,以及他们对2024年以及未来五年的人工智能的希望和期望是什么。一个反复出现的主题是大型语言模型和生成人工智能的持续发展、它们对科学过程的变

谷歌再雪前耻,新Bard逆袭GPT-4冲上LLM排行榜第二!Jeff Dean高呼我们回来了

一夜之间,Bard逆袭GPT-4,性能直逼最强GPT-4Turbo!这个听起来似乎像梦里的事情,确确实实地发生了。就在昨天,谷歌首席JeffDean发推提前透露了谷歌的最新版模型——GeminiPro-scale。基于此,Bard相较于3月份的首次亮相,不仅在表现上有了显著的提升,而且还具备了更多的能力。可以看到,在最新的GeminiPro-scale加持下,Bard直接蹿升到了排行榜第二名的位置。一口气把之前的两款GPT-4模型斩于马下,甚至和排名第一的GPT-4Turbo的差距也非常小。虽然JeffDean并没有具体阐述「scale」的含义,但从名称上推测,很可能是一个比初代GeminiP