LLM-Blender_草庐IT

终结扩散模型，IGN单步生成逼真图像！UC伯克利谷歌革新LLM，美剧成灵感来源

已经红遍半边天的扩散模型，将被淘汰了？当前，生成式AI模型，比如GAN、扩散模型或一致性模型，通过将输入映射到对应目标数据分布的输出，来生成图像。通常情况下，这种模型需要学习很多真实的图片，然后才能尽量保证生成图片的真实特征。最近，来自UC伯克利和谷歌的研究人员提出了一种全新生成模型——幂等生成网络（IGN）。图片论文地址：https://arxiv.org/abs/2311.01462IGNs可以从各种各样的输入，比如随机噪声、简单的图形等，通过单步生成逼真的图像，并且不需要多步迭代。这一模型旨在成为一个「全局映射器」（globalprojector），可以把任何输入数据映射到目标数据分布。

解决Blender在Unity中动画导入不兼容的问题

如果你在blender中建立了一个模型，创建了相应的动画和其他东西，导出成FBX文件可能会发现在unity中并不存在animation。提供一个解决方案：1.首先选中你要导入的带有相应动画的物体，然后点击文件，导出成FBX文件。2.勾选选中的物体3.点击烘焙动画然后再导出。 4.导入到unity时注意要将animationtype为legacy

Milvus Cloud——LLM Agent 现阶段出现的问题

LLMAgent现阶段出现的问题由于一些LLM（GPT-4）带来了惊人的自然语言理解和生成能力，并且能处理非常复杂的任务，一度让LLMAgent成为满足人们对科幻电影所有憧憬的最终答案。但是在实际使用过程中，大家逐渐发现了通往通用人工智能的道路并不是一蹴而就的，目前Agent很容易在一些情况下失败：Agent会在处理某一个任务上陷入一个循环prompt越来越长，最终甚至超出最大内容长度记忆模块的策略没有给LLM某些关键的信息而导致执行失败LLM由于幻觉问题错误使用工具，或者让事情半途而废上述问题随着大家对于Agent的了解开始浮出水面，这些问题一部分需要LLM自身来解决，另一部分也需要Agen

个人技术总结——使用Blender进行植物建模并导入Unity

文章目录一、技术概述1.1为什么会有这样的需求1.2学习该技术的原因1.3实现的难点1.4实现效果展示二、技术详述2.1实现思路概述2.2树叶的处理2.3灌木的建模2.3行道树的建模三、技术使用过程中遇到的问题和解决过程3.1遇到的问题3.2解决过程四、总结五、参考资料一、技术概述1.1为什么会有这样的需求在我们的项目《福大模拟器》中，为真实展示福州大学的校园风采，对各类具体事物建模的真实程度提出了较高的要求。植物作为校园中随处可见的事物，自然成为了模型的重要组成部分，所以有必要对各种植物进行模型的构建。1.2学习该技术的原因为使所建的模型更符合在现实生活中的模样，也为了玩家能如身临其境地体验

从零详细地梳理一个完整的 LLM 训练流程

深度学习自然语言处理分享知乎：何枝在这篇文章中，我们将尽可能详细地梳理一个完整的LLM训练流程。包括模型预训练（Pretrain）、Tokenizer训练、指令微调（InstructionTuning）等环节。文末进群，作者答疑、不错过直播1.预训练阶段（PretrainingStage）工欲善其事，必先利其器。当前，不少工作选择在一个较强的基座模型上进行微调，且通常效果不错（如：[alpaca]、[vicuna]等）。这种成功的前提在于：预训练模型和下游任务的差距不大，预训练模型中通常已经包含微调任务中所需要的知识。但在实际情况中，我们通常会遇到一些问题，使得我们无法直接使用一些开源back

LLM系列 | 22 : Code Llama实战(下篇)：本地部署、量化及GPT-4对比

引言模型简介依赖安装模型inference代码补全4-bit版模型代码填充指令编码CodeLlamavsChatGPTvsGPT4小结引言青山隐隐水迢迢，秋尽江南草未凋。小伙伴们好，我是《小窗幽记机器学习》的小编：卖热干面的小女孩。紧接前文：今天这篇小作文作为代码大语言模型CodeLlama的下篇，主要介绍如何在本地部署CodeLlama，同时介绍如何对CodeLlama做模型量化。最后，对比CodeLlama、ChatGPT和GTP4这三者的代码生成效果。模型简介官方发布了3类CodeLlama模型，每类都有三种模型尺寸：CodeLlama：Base模型(即常说的基座模型)，为通用的代码生成

MoE：LLM终身学习的可能性

本文分享自华为云社区《DTSETechTalk|第47期：MoE：LLM终身学习的可能性》，作者：华为云社区精选。在DTSETechTalk的第47期直播《MoE：LLM终身学习的可能性》中，昇思MindSpore技术专家吕老师与各位开发者分享有关于LLMlifelonglearning的概念，帮助大家了解持续学习的特性与理论知识，同时也详细介绍了MoE的发展史，让我们更为直观的去理解其中技术要点。Continuallifelonglearning（终身学习）终身学习系统被定义为一种能够从连续的信息中学习的自适应算法，随着时间的推移，这些信息逐步可用，并且所要学习的任务数量（例如，分类任务中的

理论+实践详解最热的LLM应用框架LangChain

本文分享自华为云社区《LangChain是什么？LangChain的详细介绍和使用场景》，作者：码上开花_Lancer。一、概念介绍1.1Langchain是什么？官方定义是：LangChain是一个强大的框架，旨在帮助开发人员使用语言模型构建端到端的应用程序，它提供了一套工具、组件和接口，可简化创建由大型语言模型(LLM)和聊天模型提供支持的应用程序的过程。LangChain是一个语言模型集成框架，其使用案例与语言模型的使用案例大致重叠，包括文档分析和摘要、聊天机器人和代码分析。简单来说，LangChain提供了灵活的抽象和AI优先的工具，可帮助开发人员将LLM应用程序从原型转化为生产环境。

LLM时代中的分布式AI

深度学习相较传统机器学习模型，对算力有更高的要求。尤其是随着深度学习的飞速发展，模型体量也不断增长。于是，前几年，我们看到了芯片行业的百家争鸣和性能指标的快速提升。正当大家觉得算力问题已经得到较大程度的缓解时，大语言模型（LLM,Largelanguagemodel）的兴起又带来了前所未有的挑战。当网络模型达到一定量级后（比如参数量达到10B级别），表现出In-contextlearning，Instructionfollowing和Step-by-stepreasoning等涌现能力（Emergentabilities）。这些能力是以往模型所不具备的，因此LLM引起了学术界与工业界的浓厚兴趣

大型语言模型（LLM）技术精要，不看亏了

哈喽，大家好。今天分享一篇知乎高赞文章，作者是张俊林老师。图片读完收获很多，能帮大家更好地理解、学习大模型。原文有2.8w字，我提炼了核心要点，阅读需要10min。ChatGPT的出现给很多人带来了惊喜和醒悟。有人惊喜地发现大型语言模型（LLM）的效果如此出色，而有人则意识到我们对LLM的认知和发展理念距离世界先进水平还有很大差距。我是既惊喜又醒悟的一员，也是典型的中国人，善于自我反思。因此，我开始反思，并将这篇文章作为反思的结果。我认为，OpenAI在LLM的理念和相关技术方面领先于国外的Google和DeepMind大约半年到一年的时间，领先国内大约两年左右。在LLM这个问题上，梯队很明显