Efficient-LLMs-Survey
全部标签LLMs之Chinese-LLaMA-Alpaca:基于单机CPU+Windows系统实现中文LLaMA算法进行模型部署(llama.cpp)+模型推理全流程步骤【安装环境+创建环境并安装依赖+原版LLaMA转HF格式+合并llama_hf和chinese-alpaca-lora-7b→下载llama.cpp进行模型的量化(CMake编译+生成量化版本模型)→部署f16/q4_0+测试效果】的图文教程(非常详细)目录相关文章论文相关
LLMs之RAG:LangChain-ChatGLM-Webui(一款基于本地知识库(各种文本文档)的自动问答的GUI界面实现)的简介、安装、使用方法之详细攻略目录LangChain-ChatGLM-Webui的简介1、支持的模型LangChain-ChatGLM-Webui的安装1、安装T1、直接安装环境准备启动程序T2、Docker安装(1)、Docker基础环境运行(2)、Docker小白运行2、开启服务:JinaServingAPI(1)、启动服务(2)、执行curl初始化模型命令(3)、执行curl构建向量库命令(4)、执行curl发送指令(5)、DockerAPI服务快速启动La
LLMs之Code:大语言模型纵向赋能场景—垂直行业场景应用之大模型代码场景的简介、主流LLMs(SQLCoder/CodeLlama/Ziya-Coding/CodeShell等)及其评估基准(包括数据集)、案例应用之详细攻略目录大模型代码场景的简介大模型代码场景的主流LLMs及其评估基准(包括数据集)
作者:禅与计算机程序设计艺术1.简介:随着技术的不断革新、应用需求的不断增加、社会发展的不断推进等诸多因素的影响,越来越多的人们在追求自我实现、追求自由、追求幸福。而在互联网的帮助下,人们已经能够实现人与人之间更加亲密的联系、更高效的沟通、更具创造力的工作、更大的商业利益、更广阔的未来。但是,对于信息化、数字化、网络化带来的各种变革,以及由此带来的无限可能性,却远远没有看到足够的讨论。基于对人类行为模式的分析和理解,计算机科学界提出了模拟人类的研究,其中最著名的模型就是微观经济学中使用的“agent-basedmodel”,其主要思想是构建一个虚拟环境,并让多个被称为“agent”的实体相互作
《KnowledgeTracing:ASurvey》论文在2023年2月收录于ACMComputingSurveys(IF好像有14)https://dl.acm.org/doi/pdf/10.1145/3569576后文里,我用技能一词来代替原文中的KC-knowledgecomponent=其他文献的知识点引文教学是促进知识转移的重要活动新冠促进教育系统的数字化转型目前的挑战每个题目可能对应多个技能技能之间存在依赖性,例如k1是k2的先决条件学生的遗忘行为会导致认知下降,对遗忘特征建模,技能可以根据遗忘相关性排序DLKT的方向:1.记忆结构2.注意力机制3.图表示学习4.文本特征5.遗忘特
分层强化学习综述论文阅读HierarchicalReinforcementLearning:AComprehensiveSurvey摘要一、介绍二、基础知识回顾2.1强化学习2.2分层强化学习2.2.1子任务符号2.2.2基于半马尔可夫决策过程的HRL符号2.3通用项定义三、分层强化学习方法3.1学习分层策略(LHP)3.1.1封建分层方法(基于goal)3.1.2策略树方法(基于option)3.2同时子任务发现+分层策略学习3.2.1统一策略树方法3.2.2封建方法的统一学习3.3独立子任务发现3.3.1子目标发现3.3.2不同技能发现3.4迁移分层强化学习3.4.1迁移+子任务策略蒸馏3
卷积神经网络硬件实现综述阅读之——《2019-ASurveyofConvolutionalNeuralNetworksonEdgewithReconfigurableComputing》Abstract:在本文中描述了常见的CNN网络的特点、运行CNN网络时的可重构计算的能力、硬件实现可重构CNN网络的最新技术水平,以及边缘可重构平台在未来发展的趋势和挑战。Introduction:边缘计算与云端计算的对比:边缘计算云端计算低延时高延时计算具有时效性计算不具备时效性网络传输依赖性低网络传输依赖性高特定任务的处理特定应用的处理成本低成本高分布式难于管理云端位于中心,易于管理难以调试(远程)容易调
SODA2022_cite=12_Cheng——Towardslarge-scalesmallobjectdetection:SurveyandBenchmarkshttps://shaunyuan22.github.io/SODA/小目标检测=smallobjectdetection=SODDatasets:SODA-D:OneDrvie;BaiduNetDiskSODA-A:OneDrvie;BaiduNetDiskCodesTheofficialcodesofourbenchmark,whichmainlyincludesdatapreparationandevaluation,arer
知识图谱综述(2021.4)论文标题:ASurveyonKnowledgeGraphs:Representation,Acquisition,andApplications论文期刊:IEEETRANSACTIONSONNEURALNETWORKSANDLEARNINGSYSTEMS,2021论文地址:https://arxiv.53yu.com/pdf/2002.00388.pdf%E2%80%8Barxiv.org目录知识图谱综述(2021.4)摘要1.简介2.概述3.知识表示学习(KRL)3.1表示空间3.1.1点空间3.1.2复向量空间3.1.3高斯分布3.1.4流形和群3.2评分函数3
LLMs之Vicuna:在Linux服务器系统上实Vicuna-7B本地化部署(基于facebookresearch的GitHub)进行模型权重合并(llama-7b模型与delta模型权重)、模型部署且实现模型推理全流程步骤的图文教程(非常详细)导读:因为Vicuna的训练成本很低,据说只需要$300左右,所以,还是有必要尝试本地化部署一下Vicuna-7B。根据论文描述,>>关于Vicuna-13B的推理效果,优于LLaMA-13B和Alpaca-13B,据说达到了ChatGPT的90%以上的能力。>>关于Vicuna-13B的评估,该方法是对各个模型Alpaca、LLaMA、ChatGP