TensorRT-LLM_草庐IT

Building AI-Copilot：构建 LLM 支持的生成应用程序的一些经验教训和模式

我们正在构建一个用于产品策略和生成创意的实验性人工智能副驾驶，名为“Boba”。一路上，我们学到了一些关于如何构建此类应用程序的有用经验，我们已经根据模式制定了这些应用程序。这些模式允许应用程序帮助用户更有效地与大语言模型(LLM)交互，编排提示以获得更好的结果，帮助用户导航复杂的对话流路径，并集成LLM没有的知识有可用的。目录概述UsingBoba

将LLM接入PC端，实现电脑助手

一、大语言模型自去年十一月份来，LLM（LargeLanguageModel）如雨后春笋涌现。从最开始的ChatGPT到文心一言，现在已经有几十上百个LLM。而LLM本身还在继续发展，其应用场景也在不断发掘。现阶段如同AI的文艺复兴时期，LLM每天都在推出各种新的应用，关于AGI（通用人工智能）的设想也越发接近可能。本文我们将讨论Prompt技巧、模型Fine-tuning等内容，并完成LLM的二次开发，将LLM接入应用。二、文心千帆现在有许多大模型平台，可以直接调用API的有ChatGPT、Claude、文心千帆等。相比之下文心千帆的接口更易获得，因此本文选择文心千帆。2.1平台介绍文心千帆

实战YOLO V5推演（TensorRT版本 C++）

兜兜转转还是来到了C++，欠的债该还的得还，因此本篇文章试图从C++来撬动tensorrt完成转换模型和推理，而不是借助python库文章目录前言一、Tensorrt前置1.1Tensorrt基本概念1.2异步推演说明二、实战YOLOV5推演1.TensorRT模型转换所以要替换模型了，明天见！分割线,mmp今天阳性了,明天请了天假,今明两天搞定它!!!!3.再来一遍总结前言希望本篇文章结束后，我能回答两个问题：python不好用么，为什么还要转C++；yolov5的export.py已经实现在python端的模型转化了啊？不需要c++的可以看这个《【深度学习】目标检测yolov5模型量化安装

LangChain大型语言模型(LLM)应用开发(五)：评估

LangChain是一个基于大语言模型（如ChatGPT）用于构建端到端语言模型应用的Python框架。它提供了一套工具、组件和接口，可简化创建由大型语言模型(LLM)和聊天模型提供支持的应用程序的过程。LangChain可以轻松管理与语言模型的交互，将多个组件链接在一起，以便在不同的应用程序中使用。今天我们来学习DeepLearning.AI的在线课程:LangChainforLLMApplicationDevelopment的第五门课：Evaluation(评估)，所谓评估是指检验LLM回答的问题是否正确的方法，在上一篇博客Q&AoverDocuments中我们解释了如何通过langcha

懂3D的语言模型来了！UCLA、上交、MIT等联合提出3D-LLM：性能大涨9%

大型语言模型（LLM）和视觉语言模型（VLM）在各种评测基准中都展现出了强大的性能，比如可以看图说话、进行常识推理。但这些模型的训练过程并没有引入3D物理世界，也就无法理解更丰富的现实概念，包括空间关系、布局、物体反馈等。最近，加州大学洛杉矶分校、上海交大、华南理工大学、麻省理工学院等机构的研究人员联合提出了一个全新的3D-LLM任务，把3D世界的知识注入到大型语言模型中，以3D点云及其特征作为输入，从而可以执行各种3D相关的任务，包括描述生成、3D问题回答、任务分解、3D辅助对话、导航等。论文链接：https://arxiv.org/pdf/2307.12981.pdf基于这个思路，研究人员

LangChain：打造自己的LLM应用

1、LangChain是什么LangChain是一个框架，用于开发由LLM驱动的应用程序。可以简单认为是LLM领域的Spring，以及开源版的ChatGPT插件系统。核心的2个功能为：1）可以将LLM模型与外部数据源进行连接。2）允许与LLM模型与环境进行交互，通过Agent使用工具。2、LangChain核心组件LangChain提供了各种不同的组件帮助使用LLM，如下图所示，核心组件有Models、Indexes、Chains、Memory以及Agent。2.1ModelsLangChain本身不提供LLM，提供通用的接口访问LLM，可以很方便的更换底层的LLM以及自定义自己的LLM。主要

[NLP]LLM高效微调(PEFT)--LoRA

LoRA背景神经网络包含很多全连接层，其借助于矩阵乘法得以实现，然而，很多全连接层的权重矩阵都是满秩的。当针对特定任务进行微调后，模型中权重矩阵其实具有很低的本征秩（intrinsicrank），因此，论文的作者认为权重更新的那部分参数矩阵尽管随机投影到较小的子空间，仍然可以有效的学习，可以理解为针对特定的下游任务这些权重矩阵就不要求满秩。技术原理LoRA（论文：LoRA:LOW-RANKADAPTATIONOFLARGELANGUAGEMODELS），该方法的核心思想就是通过低秩分解来模拟参数的改变量，从而以极小的参数量来实现大模型的间接训练。在涉及到矩阵相乘的模块，在原始的PLM旁边增加一

图技术在 LLM 下的应用：知识图谱驱动的大语言模型 Llama Index

LLM如火如荼地发展了大半年，各类大模型和相关框架也逐步成型，可被大家应用到业务实际中。在这个过程中，我们可能会遇到一类问题是：现有的哪些数据，如何更好地与LLM对接上。像是大家都在用的知识图谱，现在的图谱该如何借助大模型，发挥更大的价值呢？在本文，我便会和大家分享下如何利用知识图谱构建更好的In-contextLearning大语言模型应用。此文最初以英文撰写的，而后我麻烦ChatGPT帮我翻译成了英文。下面是翻译的prompt：“Inthisthread,youareaChineseTechbloggertohelptranslatemybloginmarkdownfromEnglishi

ffmpeg tensorrt c++多拉流硬解码yolov5 yolov7 bytetrack 人流追踪统计硬件编码推流直播

ffmpeg拉流硬解码yolov5bytetrack人流追踪统计硬件编码推流直播编程语言C++，所以环境搭建可能比较复杂，需要有耐心。我的机器配置CPU：I512490FGPU：RTX20606GBRAM：16x2GB双通道我测试运行可以25路（很极限了），20路比较稳，不会爆显存。多路编码推流有个问题，就是NVIDIA对消费级显卡编码有限制一般是3路吧，但是这个可以破解的，很简单。照着readme做就好了。https://github.com/keylase/nvidia-patch效果榨干显卡环境变量大家参考一下PS:cuda\bin是cudnn的目录。重要的事情说三遍感谢杜老感谢杜老感谢

JeTSON Xavier NX TX2_NX 暗转yolov5 v6.2使用Tensorrt加速实现USB摄像头和CSI摄像头的目标识别及采坑记录

本文是参考各位博客朋友的笔记做了实操整理勿喷。硬件设备nvidiaJETSONNXTX2_NX 软件版本BSP3273(Jetpack4.6.3)再次分享一下刷机指导JetsonLinuxR32.7.3NVIDIA®JetsonLinux驱动程序包是Jetson™的主板支持包。它包括Linux内核，UEFI引导加载程序，NVIDIA驱动程序，闪存实用程序，基于Ubuntu的示例文件系统以及Jetson平台的更多内容。NVIDIAJetsonLinux32.7.3JetsonLinux32.7.3是JetsonLinux32.7.1之上的次要版本，包含安全修复。其余功能与JetsonLinux3