草庐IT

llm-numbers

全部标签

大模型推理优化--TensorRT-LLM初体验

TensorRT-LLM初体验千呼万唤始出来,备受期待的Tensorrt-LLM终于发布,发布版本0.5.0。github:https://github.com/NVIDIA/TensorRT-LLM/tree/main1.介绍TensorRT-LLM可以视为TensorRT和FastTransformer的结合体,旨为大模型推理加速而生。1.1丰富的优化特性除了FastTransformer对Transformer做的attention优化、softmax优化、算子融合等方式之外,还引入了众多的大模型推理优化特性:Multi-headAttention(MHA)Multi-queryAtte

android - 使用 ParcelFileDescriptor.createPipe() 将 InputStream 传输到另一个服务(跨进程边界)失败,返回 "EBADF (Bad file number)"

我想通过使用ParcelFileDescriptor.createPipe()将InputStream从一个Android服务“发送”到在不同进程中运行的另一个服务。,一个流到流的复制线程和一个ParcelFileDescriptor,代表管道的读取端,它通过BinderIPC提供给其他服务。发送代码(流程A)我想将给定的InputStream发送到接收服务:publicsendInputStream(){InputStreamis=...;//that'sthestreamforprocess/serviceBParcelFileDescriptorpdf=ParcelFileDes

如何赋予 GPT/LLM 自我意识1

引子这个周末OpenAI搞了一个大新闻,围绕SamAltman和IlyaSutskever的各种讨论遍地开花,而其中一个关注点就是他们对于AGI降临态度上的偏差。本文不打算讨论公司治理和办公室政治,而是用一些思维实验和大家都公认的现象来分析纯理论而言AGI会如何降临。一个基本的结论就是:如今的GPT模型注定会诞生AGI。更关心论证的朋友可以直接跳过前两个介绍基础知识的段落直接看后续的推理过程。不过限于篇幅,这篇里仅仅提出了问题,具体分析会在后续文章中给出。本文提出了意识和载体之间可能存在的辩证依赖关系,提出了一个识别自我意识的途径,可能是所有AI研究者长期等待的一个假说理论的雏形AGI的一般定

hivesql开窗函数row number() over (partition by )详解

ROW_NUMBER()OVER(PARTITIONBY)是一种窗口函数,用于在每个分区内对行进行编号。它可以用于分析和报表等场景,可以帮助我们对数据进行分组排序,获取排名信息。具体来说,ROW_NUMBER()是一种分析函数,它可以根据ORDERBY子句中指定的列对行进行排序,并为每个分区内的行分配唯一的连续编号。PARTITIONBY子句用于定义分区,该子句指定希望分区的列或表达式。行号将在每个分区内分配,然后重新开始为下一个分区分配。以下是一个示例:SELECTcustomer_id,order_date,order_amount,ROW_NUMBER()OVER(PARTITIONBY

解密Prompt系列19. LLM Agent之数据分析领域的应用:Data-Copilot & InsightPilot

在之前的LLMAgent+DB的章节我们已经谈论过如何使用大模型接入数据库并获取数据,这一章我们聊聊大模型代理在数据分析领域的应用。数据分析主要是指在获取数据之后的数据清洗,数据处理,数据建模,数据洞察和数据可视化的步骤。可以为经常和数据打交道,但是并不需要太过艰深的数据分析能力的同学提供日常工作的支持,已看到很多BI平台在尝试类似的方案。这里我们聊两篇论文:Data-Copilot和InsightPilot,主要参考一些有意思的思路~数据分析:Data-Copilotpaper:Data-Copilot:BridgingBillionsofDataandHumanswithAutonomou

如何快速落地LLM应用?通过Langchain接入千帆SDK

目录引言SDK的优势千帆SDK:快速落地LLM应用如何快速上手千帆SDK结语番外篇:开源社区引言号外,号外,百度智能云千帆大模型平台再次升级!在原有API基础上,百度智能云正式上线PythonSDK(下文均简称千帆SDK)版本并全面开源,企业和开发者可免费下载使用!千帆SDK全面覆盖从数据集管理,模型训练,模型评估,到服务部署等方面的功能,开发者可基于千帆SDK通过代码接入并调用百度智能云千帆大模型平台的能力,轻松实现LLMOps全流程的落地,快速构建自己的大语言模型应用。一、SDK的优势SDK当前主要的价值在于可快速使用API能力,并完善API使用的周边工具链,同时提供cookbook用于实

报错:SSL routines:ssl3_get_record:wrong version number

一、问题描述前后端联调的时候,连接后端本地服务器,接口一直pending调不通,控制台还报以下错误:立马随手搜索了一下解决方案,但是emmm,不符合前端的实际情况:二、解决方法:实际上是跨域代理转发时,后端本地的url,不能用https,换成http就可以了三、原因解释1、HTTP(HyperTextTransferProtocol),即超文本运输协议,是实现网络通信的一种规范。但它是以明文的形式发送内容,并不安全。为了保证这些隐私数据能加密传输,通过证书来验证服务器的身份,并为浏览器和服务器之间的通信进行加密HTTPSSL/TLSSSL,即 HTTPS=HTTP+SSL/TLS2、SSL协议

230页长文,涵盖5大科学领域,微软团队使用GPT-4探索LLM对科学发现的影响

前不久,微软DeepSpeed团队启动了一个名为 DeepSpeed4Science的新计划,旨在通过AI系统优化技术实现科学发现。11月13日,微软团队在arXiv预印平台发表题为《大型语言模型对科学发现的影响:使用GPT-4的初步研究》(「TheImpactofLargeLanguageModelsonScientificDiscovery:aPreliminaryStudyusingGPT-4」)的文章。文章篇幅长达230页。论文链接:https://arxiv.org/abs/2311.07361近年来,自然语言处理领域的突破性进展在强大的大型语言模型(LLM)的出现中达到了顶峰,这些

解决LLaMA、BERT等部署难题:首个4-bit浮点量化LLM来了

大语言模型(LLM)压缩一直备受关注,后训练量化(Post-trainingQuantization) 是其中一种常用算法,但是现有PTQ方法大多数都是integer量化,且当比特数低于8时,量化后模型的准确率会下降非常多。想较于Integer(INT)量化,FloatingPoint(FP)量化能更好的表示长尾分布,因而越来越多的硬件平台开始支持FP量化。而这篇文章给出了大模型FP量化的解决方案。文章发表在EMNLP2023上。论文地址:https://arxiv.org/abs/2310.16836代码地址:https://github.com/nbasyl/LLM-FP4要了解本文,必须

如何快速落地LLM应用?通过Langchain接入千帆SDK

目录一、SDK的优势二、千帆SDK:快速落地LLM应用三、如何快速上手千帆SDK3.1、SDK快速启动3.1.1、快速安装3.1.2、平台鉴权3.1.3、如何获取AK/SK3.1.4、以“Chat对话”为调用示例3.2、SDK进阶指引3.3、通过Langchain接入千帆SDK3.3.1、为什么选择Langchain开源社区百度智能云千帆大模型平台再次升级!在原有API基础上,百度智能云正式上线PythonSDK(下文均简称千帆SDK)版本并全面开源,企业和开发者可免费下载使用!千帆SDK全面覆盖从数据集管理,模型训练,模型评估,到服务部署等方面的功能,用户可基于千帆SDK通过代码接入并调用百