LLM+VLM

全方位、无死角的开源，邢波团队LLM360让大模型实现真正的透明

开源模型正展现着它们蓬勃的生命力，不仅数量激增，性能更是愈发优秀。图灵奖获得者YannLeCun也发出了这样的感叹：「开源人工智能模型正走在超越专有模型的路上。」专有模型在技术性能和创新能力上展现了非凡的力量，但是它们不开源的性质成为LLM发展的阻碍。一些开源模型虽然为从业者和研究者提供了多样化的选择，但大多数只公开了最终的模型权重或推理代码，越来越多的技术报告将其范围限制在顶层设计和表面统计之内。这种闭源的策略不仅限制了开源模型的发展，而且还在很大程度上阻碍了整个LLM研究领域的进步。这意味着，这些模型需要更全面和深入地共享，包括训练数据、算法细节、实现挑战以及性能评估的细节。Cerebra

死角开源 span text-align style 人工智能新闻 AI 技术

用RLHF 2%的算力让LLM停止有害输出，字节提出LLM遗忘学习

随着大型语言模型（LLM）的发展，从业者面临更多挑战。如何避免LLM产生有害回复？如何快速删除训练数据中的版权保护内容？如何减少LLM幻觉（hallucinations，即错误事实）?如何在数据政策更改后快速迭代LLM？这些问题在人工智能法律和道德的合规要求日益成熟的大趋势下，对于LLM的安全可信部署至关重要。目前业界的主流解决方案为LLM对齐(alignment)，即通过建立对比数据（正样本和负样本）用强化学习的方式来对LLM进行微调(Finetuning)，也就是RLHF(ReinforcementLearningfromHumanFeedback)[1]，从而保证LLM输出符合人类预期和

字节有害 span text-align style 人工智能新闻模型算力

ToolkenGPT：用大量工具增强LLM

深度学习自然语言处理原创作者：cola用外部工具增强大型语言模型(LLM)已经成为解决复杂问题的一种方法。然而，用样例数据对LLM进行微调的传统方法，可能既昂贵又局限于一组预定义的工具。最近的上下文学习范式缓解了这一问题，但有限的上下文长度局限于少样本样例，导致不能完全挖掘工具的潜力。此外，当有许多工具可供选择时，上下文学习可能完全不起作用。因此本文提出了一种替代方法ToolkenGPT，它结合了双方的优势。论文：ToolkenGPT:AugmentingFrozenLanguageModelswithMassiveToolsviaToolEmbeddings地址：https://arxiv.

ToolkenGPT 增强 xff0c xff0 xff

论文阅读——Img2LLM（cvpr2023）

arxiv：[2212.10846]FromImagestoTextualPrompts:Zero-shotVQAwithFrozenLargeLanguageModels(arxiv.org)一、介绍使用大语言模解决VQA任务的方法大概两种：multi-modalpretrainingandlanguage-mediatedVQA，即多模态预训练的方法和以语言模型为媒介的VQA。Multi-modalpretraining：训练一个额外的模块对齐视觉和语言向量。这类方法有两个很大的缺点，一是计算资源大，训练Flamingo需要1536TPUv4，耗时两周。另外是灾难性遗Catastrophi

mdash Img2LLM xff0c xff xff0 深度学习人工智能

构建更好的基于LLM的应用程序的四大秘诀

作者 | AdrienTreuille译者 | 布加迪审校 | 重楼出品|51CTO技术栈（微信号：blog51cto）自从OpenAI发布首个ChatGPT模型以来，人们对生成式AI的兴趣激增。基于大语言模型（LLM）的应用程序现处于企业思考生产力和效率的最前沿，用于构建生成式AI应用程序的工具和框架得到了极大的扩展。但人们仍然担心生成式AI输出的准确性，因此开发人员需要快速学会处理诸如此类的问题，以构建强大、可靠的应用程序。以下是提高LLM应用程序准确性的一些建议和技术，以及选择正确LLM的注意事项。我们无法详尽地探讨这些问题，因为每个问题本身都很复杂，但我们可以提供一番建议，供诸位进一步

应用程序秘诀应用程序人工智能 LLM AI ChatGPT

【Video-LLaMA】增强LLM对视频内容的理解

Paper:《Video-LLaMA:AnInstruction-tunedAudio-VisualLanguageModelforVideoUnderstanding》Authors:HangZhang,XinLi,LidongBing;Affiliation:TheAlibabaDAMOAcademy;Keywords:MultimodalLargeLanguageModels,Cross-modaltraining.研发背景大型语言模型(LLM)在遵循用户意图和指示上表现出了卓越的理解和理解能力，通常，LLM的用户请求和相应的响应都是文本形式的，然而，由于现实世界的信息通常是多模态的，仅

Video-LLaMA 增强 span class vlist 音视频人工智能计算机视觉深度学习语音识别

【腾讯云云上实验室】从零开始搭建爬虫+向量数据库+LLM大模型构建企业私有化知识库

1.前言本文主要论证从零开始搭建爬虫->向量数据库->LLM大模型知识库过程，文章中不依赖任何爬虫、LangChain、ChatGLM等框架，从最原始角度通俗易懂、直观的解读大模型与向量数据库结合过程，给大家提供现阶段热门企业大模型解决方案建设思路和方向。目前流行的中文开源大模型非ChatGLM（智普）、baichuan（百川）等莫属。虽然认知能力赶不上ChatGPT3.5，但是它的开源吸引了广大的AI研究者。目前大语言模型存在最大的问题在于：1、研究成本高，如果搭建一个13B以及以上的模型，全量运行需要24GB以上显存，如果进行量化质量又达不到要求，前期研究就要投入大量成本并且如果有多个

爬虫向量 xff xff0c xff0 AI编程腾讯云大数据数据库 AIGC

LLM大语言模型（一）：ChatGLM3-6B本地部署

部署 ChatGLM3 colspan rowspan td 语言模型人工智能自然语言处理 LLM chatglm GPU

LLM大语言模型（一）：ChatGLM3-6B本地部署

部署 ChatGLM3 colspan rowspan td 语言模型人工智能自然语言处理 LLM chatglm GPU

微调都不要了？3个样本、1个提示搞定LLM对齐，提示工程师：全都回来了

我们知道，仅在无监督文本语料库上预训练的基础大语言模型（LLM）通常无法直接用作开源域的AI助手（如ChatGPT）。因此，为了让这些基础的LLM成为有用且无害的AI助手，研究人员往往使用指令调优和偏好学习对它们进行微调。先来看下指令调优的定义，它是一种监督微调（SFT）过程，主要使用人工注释或者从GPT-4等专有LLM中收集的数据。偏好学习则是一种典型的人类反馈强化学习（RLHF），它不断地调优监督微调后的LLM以进一步对齐人类偏好。基于调优的对齐促使LLM显著改进，似乎释放了令人印象深刻的能力，并表明广泛的微调对构建AI助手至关重要。然而，MetaAI等机构的一项研究LIMA提出了表面对齐

提示对齐 span text-align 人工智能新闻 AI 模型

13 14 151617 18 19