词元化模型_草庐IT

【SD大模型分享】之前做小说推文花钱买来的，各种3D、2.5D、真实系、动画系、古风系lora，AI绘画小模型分享

写在前面因为之前自己做小说推文，为了画风更精致一点，当时找遍了各种资源，也花钱买了一些模型，现在不做了，就跟大家分享一下吧。想做推文的，直接下载就行了。地址我放在文章最底部了，真实有效，不骗人，放心！应用介绍这个是stablediffusion（以下简称“SD”）AI智能绘画的大模型，比如咱们常见的一些文字生成动漫风格的，都是通过将这个大模型导入到SD里后生成出来对应的图片。功能特色1.真实3D2.手绘画风3.动漫画风（2.5D）4.二次元5.万能系6.tag描述词7.lora小模型案例演示这里，我随便用自己电脑给大家生成一张演示看看吧。原文地址：SD大模型全套打包下载地址|晒应用导航

用开源模型合并利器MergeKit开发自己的定制模型

译者|朱先忠审校|重楼摘要：本文将介绍使用开源工具MergeKit并利用四种不同算法实现合并多个LLM，实现无需借助昂贵GPU的情况下轻松定制出自己的大型语言模型。简介模型合并是一种将两个或多个LLM合并为单个模型的技术。这是一种相对较新的实验性方法，可以以低廉的资金投入来创建新模型（不需要GPU）。模型合并工作出奇地好，而且在OpenLLM排行榜上先后出现了许多基于模型合并技术的最先进的模型。在本教程中，我们将使用开源的MergeKit库来实现模型合并。更具体地说，我们将回顾四种合并方法，并提供相应的配置示例。然后，我们将使用MergeKit创建我们自己的模型——Marcoro14-7B-s

首次攻克「图基础模型」三大难题！港大开源OpenGraph：零样本学习适配多种下游任务

图学习（GraphLearning）技术能够对复杂的关系数据进行挖掘和学习，在推荐系统、社交网络分析、引用网络和交通网络等多个领域都显示出了巨大的应用价值。图神经网络（GraphNeuralNetworks,GNNs）基于迭代的消息传递机制，能够捕捉图结构数据中的复杂高阶关系，在各类图学习应用场景中取得了巨大的成功。通常，这种端到端的图神经网络需要大量、高质量的标注数据才能获得较好的训练效果。近年来，一些工作提出图模型的预训练-微调（Pre-trainingandFine-tuning）模式，使用各种自监督学习任务在无标注的图数据上首先进行预训练，再在少量标注数据上进行微调，以对抗监督信号不足

进一步加速落地：压缩自动驾驶端到端运动规划模型

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：OntheRoadtoPortability:CompressingEnd-to-EndMotionPlannerforAutonomousDriving论文链接：https://arxiv.org/pdf/2403.01238.pdf代码链接：https://github.com/tulerfeng/PlanKD作者单位：北京理工大学ALLRIDE.AI河北省大数据科学与智能技术重点实验室论文思路端到端的运动规划模型配备了深度神经网络，在实现全自动驾驶方面展现出了巨大潜力。然而，过大的神经网络使得它们不适合部署在资源受限的系统上，这无

苹果大模型MM1杀入场：300亿参数、多模态、MoE架构，超半数作者是华人

今年以来，苹果显然已经加大了对生成式人工智能（GenAI）的重视和投入。此前在2024苹果股东大会上，苹果CEO蒂姆・库克表示，今年将在GenAI领域实现重大进展。此外，苹果宣布放弃10年之久的造车项目之后，一部分造车团队成员也开始转向GenAI。如此种种，苹果向外界传达了加注GenAI的决心。目前多模态领域的GenAI技术和产品非常火爆，尤以OpenAI的Sora为代表，苹果当然也想要在该领域有所建树。今日，在一篇由多位作者署名的论文《MM1:Methods,Analysis&InsightsfromMultimodalLLMPre-training》中，苹果正式公布自家的多模态大模型研究成

仅需200M参数，零样本性能超越有监督！谷歌发布时序预测基础模型TimesFM

时间序列预测在零售、金融、制造业、医疗保健和自然科学等各个领域无处不在：比如说在零售场景下中，「提高需求预测准确性」可以有显著降低库存成本并增加收入。深度学习（DL）模型基本上垄断了「多变量时间序列预测」任务，在各个竞赛、现实应用中的表现都非常好。与此同时，用于自然语言处理（NLP）任务的大型基础语言模型也取得了快速进展，大幅提升了翻译、检索增强生成、代码补全等任务的性能。NLP模型的训练依赖于海量文本数据，其中数据来源多种多样，包括爬虫、开源代码等，训练后的模型能够识别语言中的模式，并具备零样本学习的能力：比如说把大模型用在检索任务时，模型可以回答有关当前事件的问题并对其进行总结。尽管基于D

AI大模型专题：大模型安全与伦理研究报告2024

今天分享的是AI大模型系列深度研究报告：《AI大模型专题：大模型安全与伦理研究报告2024》。（报告出品方：腾讯研究院）报告共计：76页大模型具有不同于传统模型的特点和优势第一，大模型和传统模型在规模上存在差异。大模型是基于深度学习的方法，具有更多的参数和更复杂的模型结构，往往具有数十亿百亿干亿以上个参数。这样大的参数量使得大模型能够更好地捕捉数掘中的复杂模式和特征，通过多层次的神经元连接和权重调整，能够学习到更丰富的语义和特征表示，从而提升了模型的表现能力。第二，大模型和传统模型在训练数据上存在差异。大模型能够更好地捕提数据中的统计规律和模式，提高模型的泛化能力和预测准确性。然而，海量训练数

零一万物模型官方 Yi-34B 模型本地离线运行部署使用笔记（物理机和docker两种部署方式），200K 超长文本内容，34B 干翻一众 70B 模型，打榜分数那么高，这模型到底行不行？

零一万物模型官方Yi-34B模型本地离线运行部署使用笔记（物理机和docker两种部署方式），200K超长文本内容，34B干翻一众70B模型，打榜分数那么高，这模型到底行不行？目前最具公信力的HuggingFace榜单中，包括Yi-34B在内，排在它前面的模型只有26个，但是其中48%（14个）都是Yi-34B和Yi-34B200K的变体模型，其中第一名是来自社区用户fblgit的“LLaMaYi34B”，比之前因为数据污染而被取消榜单资格的TigerBot的70B的效果还要好一些，千问憋出的大招QWen72B暂居第二；而原本被70B霸占的头部榜单里，还剩包括QWen72B在内和Llama2变

云计算 3月13号（OSI 七层模型:物理层、数据链路层、网络层、传输层、会话层、表示层、应用层）

走进网络 1.认识计算机1.计算机网络是由计算机和通讯构成的，网络研究的是“通信”。------1946世界上第一台计算机2.终端：只有输入和输出功能，没有计算和处理功能。3.数据：一串数字（二进制数），通常指文字、语音等。4.通信：将源所产生的数据传递到目的的过程。5.网络：由两台或者两台以上计算机组成，能够进行信息共享的环境。6.网络的构成：（计算机、手机、pad、服务器……）、传输介质（网线、光纤、数据线……）、网络设备（交换机、路由器、防火墙）2.传输介质传输介质包括电缆、双绞线和光纤等。1.双绞线：有效传输长度100M线序:标准568A：绿白绿，橙白蓝，蓝白橙，棕白棕。标准568B

AI-线性回归模型

线性回归应用场景房价预测，通过分析房地产市场的历史数据，如房屋大小、位置、建造年份等因素，线性回归可以帮助预测未来房价的走势。销售额预测，企业可以利用线性回归模型来预测产品的销售额，这通常涉及到产品价格、市场营销预算、季节性因素等变量的分析。贷款额度预测，金融机构可以使用线性回归来评估客户的信用风险，并据此决定贷款额度。线性回归(Linearregression) 线性回归是一种利用直线方程对变量之间关系进行建模的回归分析方法。定义：线性回归分析用于研究两个或多个变量之间的关系，其中一个是自变量，另一个是因变量。在这种方法中，目标是找到一个线性方程，即一个直线，该直线能够尽可能好地预测因变量