LLaMA-META_草庐IT

LLaMA、Baichuan、ChatGLM、Qwen、天工等大模型对比

12.10更新：Qwen技术报告核心解读BaichuanBaichuan2:OpenLarge-scaleLanguageModels数据处理：数据频率和质量，使用聚类和去重方法，基于LSH和denseembedding方法tokenizer：更好的压缩率，对数字的每一位分开，添加空格token位置编码：7BRope，13BALiBi使用了SwiGLU激活函数，因为SwiGLU是一个双线性层，多引入一个门控矩阵，参数量更多，hidden_size从4减少到了8/3使用了更高效的基于xFormers的attention实现使用RMSNorm，对transformer的block输入进行了Laye

Llama.cpp工具main使用手册

Llama.cpp提供的main工具允许你以简单有效的方式使用各种LLaMA语言模型。它专门设计用于与llama.cpp项目配合使用。推荐：用NSDT编辑器快速搭建可编程3D场景Llama.cpp的工具main提供简单的C/C++实现，具有可选的4位量化支持，可实现更快、更低的内存推理，并针对桌面CPU进行了优化。该程序可用于使用LLaMA模型执行各种推理任务，包括根据用户提供的提示生成文本以及使用反向提示进行类似聊天的交互。1、快速开始要立即开始，请运行以下命令，确保使用你拥有的模型的正确路径：基于Unix的系统（Linux、macOS等）：./main-mmodels/7B/ggml-mo

【新】Unity Meta Quest MR 开发（一）：Passthrough 透视配置

文章目录📕教程说明📕配置透视的串流调试功能📕第一步：设置OVRManager📕第二步：添加OVRPassthroughLayer脚本📕第三步：在场景中添加虚拟物体📕第四步：设置相机📕第五步（可选）：删除场景中的天空盒此教程相关的详细教案，文档，思维导图和工程文件会放入SpatialXR社区。这是一个高质量XR社区，博主目前在内担任XR开发的讲师。此外，该社区提供教程答疑、及时交流、进阶教程、外包、行业动态等服务。社区链接：SpatialXR高级社区（知识星球）SpatialXR高级社区（爱发电）📕教程说明这期教程我将会介绍如何在Unity中，利用MetaXRSDK，去配置MetaQuest中的

万元预算打造高质量13B私有模型，Colossal-AI LLaMA-2 开源方案再升级

几个月前，Colossal-AI团队仅利用8.5Btoken数据、15小时、数千元的训练成本，成功构建了性能卓越的中文LLaMA-27B版本模型，在多个评测榜单性能优越。在原有训练方案的基础上，Colossal-AI团队再次迭代，并通过构建更为细致完善的数据体系，利用25Btoken的数据，打造了效果更佳的13B模型，并开源相关权重。开源代码与权重：https://github.com/hpcaitech/ColossalAI性能表现注：基于ColossalEval评分，括号中分数来源于对应模型官方发布的榜单分数，C-Eval分数来源于官网Leaderboard。在英文MMLU榜单中，Colo

Mistral AI vs. Meta:顶级开源LLM比较

为了提高性能，大型语言模型(llm)通常会通过增加模型大小的方法来实现这个目标，但是模型大小的增加也增加了计算成本和推理延迟，增加了在实际场景中部署和使用llm的障碍。MistralAI是一家总部位于巴黎的欧洲公司，一直在研究如何提高模型性能，同时减少为实际用例部署llm所需的计算资源。Mistral7B是他们创建的最小的LLM，它为传统的Transformer架构带来了两个新概念，Group-QueryAttention(GQA)和SlidingWindowAttention(SWA)。这些组件加快了推理速度，减少了解码过程中的内存需求，从而实现了更高的吞吐量和处理更长的令牌序列的能力。此外

Unity Meta Quest 一体机开发（九）：【手势追踪】通过录制抓取手势实现自定义抓取姿势

文章目录📕教程说明📕录制前的准备📕第一种录制方法（HandGrabPoseTool场景）⭐在运行模式中确认录制⭐保存录制的手势，将物体做成Prefab⭐在编辑阶段调整抓取手势🔍FingersFreedom🔍调整录制手势的手指弯曲🔍隐藏预渲染的手势模型📕第二种录制方法（HandGrabPoseRecorder窗口）⭐选择用哪一只手录制⭐选择给哪一个物体录制抓取手势⭐在运行模式中确认录制⭐保存录制的手势⭐给物体加载录制的手势数据⭐在编辑阶段调整抓取手势📕生成镜像手势📕生成姿势相同，不同缩放的手势此教程相关的详细教案，文档，思维导图和工程文件会放入SpatialXR社区。这是一个高质量XR社区，博主

2023年最具影响力的 10 篇AI论文（Llama2、SAM、LLM、 Pythia、QLoRA、BloombergGPT、DPO、Mistral 7B、Orca 2、transformer）

2023一年又过去，这一年，AI圈子以一种“狂飙突进”的速度飞速发展，哪怕在这个领域深耕多年的学者们也开始感叹“从没有见过哪个领域在哪一年如同AI领域在2023年这样如此飞速的发展与不断的进化”，毫无疑问，这一年AI，尤其是大模型的爆发将会深刻影响未来我们生活的方方面面。抱着年终总结，也是对过去的2023这一里程碑式的一年回顾与展望的态度，来自AheadAI的SebastianRaschka博士为我们带来了2023年最值得大家关注，也是最有影响力的十篇AI论文，这里我们就和大家一起，用这十篇工作再次为2023年写下一段注脚（十篇论文不分先后）一、Pythia—大模型该如何训练？来自

买个机器人端茶倒水有希望了？Meta、纽约大学造了一个OK-Robot

「xx，去把电视柜上的遥控器帮我拿过来。」在一个家庭环境中，很多家庭成员都不免被支使干这种活儿。甚至有时候，宠物狗也难以幸免。但人总有支使不动的时候，宠物狗也并不一定都能听懂。帮人类干活儿的终极梦想还是寄托在机器人身上。最近，纽约大学、Meta研发出的一款机器人学会了这个技能。你只需要对它说，「把桌子上的玉米片拿到床头柜上」，它就能自己找到玉米片，并规划出路线和相应的动作，顺利完成任务。此外，它还能帮你整理东西或扔垃圾。这个机器人名叫OK-Robot，由来自纽约大学、Meta的研究者共同构建。他们将视觉语言模型（用于物体检测）、导航和抓取的基础模块整合到一个开放知识型框架中，为机器人的高效拾放

LLM之RAG实战（十六）| 使用Llama-2、PgVector和LlamaIndex构建LLM Rag Pipeline

近年来，大型语言模型（LLM）取得了显著的进步，然而大模型缺点之一是幻觉问题，即“一本正经的胡说八道”。其中RAG（RetrievalAugmentedGeneration，检索增强生成）是解决幻觉比较有效的方法。本文，我们将深入研究使用transformer库、Llama-2模型、PgVector数据库和LlamaIndex库来构建RAGPipeline完整过程。一、什么是RAG（检索增强生成）？检索增强生成（RAG）模型是传统语言模型与信息检索组件的融合。从本质上讲，RAG利用外部数据（通常来自大型语料库或数据库）来增强大语言模型生成过程，以产生更知情和上下文相关的响应。二

2024年1月17日Arxiv最热论文推荐：清华提出多模态知识检索新框架、MIT新方法大幅提升LLMs的连贯性、浙大新模型助力视频任务新突破、Meta 革新搜索技术、Google革新AI写作

本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。论文解读、论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马良平台（saibomaliang.com）上的智能体「AI论文解读达人」提供。如需查看其他热门论文，欢迎移步 saibomaliang.com ^_^TOP1GenerativeMulti-ModalKnowledgeRetrievalwithLargeLanguageModels标题：清华&腾讯联手突破！提出多模态知识检索新框架，性能大幅领先，AAAI2024亮相标签：Tsinghua、Tencent、NLP、IR、AAAI2024作者：XinweiL