GenAI模型_草庐IT

AI大模型的预训练、迁移和中间件编程

大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要是AI大模型的预训练、迁移和中间件编程，希望能对学习大模型的同学们有所帮助。前言 OpenAI在2022年11月推出了人工智能聊天应用—ChatGPT。它具有广泛的应用场景，在多项专业和学术基准测试中表现出的智力水平，不仅接近甚至有时超越了

Mac上LLAMA2大语言模型安装到使用

LLAMA介绍LLaMA是由Facebook的母公司MetaAI设计的一个新的大型语言模型。LLaMA拥有70亿到650亿个参数的模型集合，是目前最全面的语言模型之一。Llama是目前唯一一个可以进行本地部署和本地训练的大型模型，对各种提问有非常好的处理能力。非常适合个人和中小型企业，构建自己的大数据模型。很多人都说是ChatGPT的平替。通过微调来满足特定小众行业的使用，将会在未来有非常大的潜力。Mac上由于没有Nvidia显卡的加持，无法配置CUDA进行深度学习。好在有大神制作了C++的库，能实现小成本在低配Mac上跑模型的能力。llama.cpp是一个推理框架，在没有GPU跑LLAMA时

java - 如何建模和处理表示DTO以从复杂的域模型中抽象出来？

嗨，我正在开发一个需要使用Hibernate处理复杂域模型的应用程序。该应用程序使用SpringMVC，并且在表示层中使用域对象非常困惑，因此我认为我应该使用往返于服务层的DTO，以使它们与我的View中的内容相匹配。现在假设我有一个CarLease实体，其属性不是简单的Java原语，而是由诸如Make，Model等其他实体组成的publicclassCarLease{privateMakemake;PrivateModelmodel;...}大多数属性都是这种方式，可以使用jspView上的下拉选择来选择它们，每个属性都会将ID回发给Controller。现在考虑一些标准用例:创建，

java - 在 Java 中同时使用 Observer 和 Observable 的模型设计不好吗？

这个问题与MVC(模型-View-Controller)有关。我的模型当前使用Java中的Observer/Observable模式更新我的View:publicclassModelextendsObservable{}publicclassViewimplementsObserver{@Overridepublicvoidupdate(observableo,Objectobj){//...updatetheviewusingthemodel.}}这很好用。但是，我的模型变得越来越复杂-它开始包含其他类的列表:publicclassModelextendsObservable{Lis

北大具身智能成果入选CVPR'24：只需一张图一个指令，就能让大模型玩转机械臂

只靠一张物体图片，大语言模型就能控制机械臂完成各种日常物体操作吗？北大最新具身大模型研究成果ManipLLM将这一愿景变成了现实：在提示词的引导下，大语言模型在物体图像上直接预测机械臂的操作点和方向。进而，得以操控机械臂直接玩转各项具体的任务：例如打开抽屉、冰箱，揭锅盖、掀马桶盖……作者表示：该方法利用LLM的推理和面对开放世界的泛化能力，成功提升了模型在物体操纵方面的泛化能力。在仿真和真实世界中，ManipLLM在各种类别的物体上均取得了令人满意的效果，证明了其在多样化类别物体中的可靠性和适用性。与谷歌RT2等输出机器人本体动作的策略相比(如下图所示)，该方法侧重于以物体为中心（Object

大视频模型是世界模型？DeepMind/UC伯克利华人一作：预测下一帧就能改变世界

没人怀疑，OpenAI开年推出的史诗巨作Sora，将改变视频相关领域的内容生态。但GoogleDeepMind、UC伯克利和MIT的研究人员更进一步，在他们眼里，「大视频模型」也许能够像世界模型一样，真正的做到理解我们身处的这个世界。论文地址：https://arxiv.org/abs/2402.17139在作者看来，视频生成将彻底改变物理世界的决策，就像语言模型如何改变数字世界一样。研究人员认为，与文本类似，视频可以作为一个统一的接口，吸收互联网知识并表征不同的任务。例如，经典的计算机视觉任务可以被视为下一代帧生成任务（next-framegenerationtask）。模型可以通过生成操作

清华、哈工大把大模型压缩到了1bit，把大模型放在手机里跑的愿望就快要实现了！

自从大模型火爆出圈以后，人们对压缩大模型的愿望从未消减。这是因为，虽然大模型在很多方面表现出优秀的能力，但高昂的的部署代价极大提升了它的使用门槛。这种代价主要来自于空间占用和计算量。「模型量化」通过把大模型的参数转化为低位宽的表示，进而节省空间占用。目前，主流方法可以在几乎不损失模型性能的情况下把已有模型压缩至4bit。然而，低于3bit的量化像一堵不可逾越的高墙，让研究人员望而生畏。图1:量化模型的困惑度在2bit时迅速上升近期，一篇由清华大学、哈尔滨工业大学合作发表在arXiv上的论文为突破这一阻碍带来了希望，在国内外学术圈引起了不小的关注。这篇论文也在一周前登上huggingface的

一句话让图片动起来，苹果发力大模型动画生成，可直接编辑结果

现阶段，大模型惊人的创新能力持续影响着创意领域，尤其是以Sora为代表的视频生成技术，更是引领了新一代潮流。当大家都为Sora感到震撼的同时，或许苹果的这项研究也值得大家关注一下。在一篇名为「Keyframer:EmpoweringAnimationDesignusingLargeLanguageModels」的研究中，来自苹果的研究者发布了一个可以利用LLM生成动画的框架Keyframer，该框架允许用户采用自然语言提示来创建静态2D图像的动画。论文地址：https://arxiv.org/pdf/2402.06071.pdf具体而言，该研究结合了基于语言提示设计工件的新兴设计原则和LLM的

Mac专属大模型框架来了！两行代码部署，能聊本地数据，还支持中文

Mac用户，终于不用羡慕N卡玩家有专属大模型ChatwithRTX了！大神推出的新框架，让苹果电脑也跑起了本地大模型，而且只要两行代码就能完成部署。仿照ChatwithRTX，框架的名字就叫ChatwithMLX（MLX是苹果机器学习框架），由一名OpenAI前员工打造。黄院士的框架里有的功能，例如本地文档总结、YouTube视频分析，ChatwithMLX里也都有。而且包括中文在内共有11种可用语言，自带支持的开源大模型多达七种。体验过的用户表示，虽然计算量负担对苹果设备可能大了点，但是新手也很容易上手，ChatwithMLX真的是个好东西。那么，ChatwithMLX的实际效果究竟怎么样呢

DeepMind CEO：LLM+树搜索就是AGI技术线路，AI科研依赖工程能力，闭源模型就是比开源安全

谷歌在2月之后突然切换到了996模式，不到一个月的时间抛出了5个模型。而DeepMindCEOHassabis本人也是四处为自家的产品站台，曝出了很多幕后的开发内幕。在他看来，虽然还需要技术突破，但是现在人类通往AGI之路已经出现。而DeepMind和谷歌Brain的合并，标志着AI技术发展已经进入了新的时代。问：DeepMind一直站在技术的前沿。比如像AlphaZero这样系统，内部的智能体能够经过一系列思考，达成最终目标。这是否意味着大型语言模型（LLM）也能够加入这种研究的行列呢？Hassabis：我个人认为，这是一个非常有潜力的方向。我们需要继续完善这些大型模型，让它们成为更精确的世