草庐IT

machine-learning-model

全部标签

Multi-task Learning 理论(多任务学习)

一.多任务学习理论1.1多任务学习的定义如果有个任务(传统的深度学习方法旨在使用一种特定模型仅解决一项任务),而这个任务或它们的一个子集彼此相关但不完全相同,则称为多任务学习(以下简称为MTL)。通过使用所有个任务中包含的知识,将有助于改善特定模型的学习多任务学习本质上是迁移学习的一种方式,通过共享表示信息,同时学习多个相关任务,使这些任务取得比单独训练一个任务更好的效果,可以在一定程度上缓解模型的过拟合,提高模型的泛化能力通过权衡主任务与辅助的相关任务中的训练信息来提升模型的泛化性与表现。从机器学习的视角来看,MTL可以看作一种inductivetransfer(先验知识),通过提供indu

【人工智能】大模型LLM技术生态全景图 | The Foundation Large Language Model (LLM) & Tooling Landscape

目录“Softwareiseatingtheworld…”  “软件正在吞噬世界...”~MarcAndreessen ~马克·安德森Everycompanyisasoftwarecompany…sooneverycompanywillbeanAIcompany.每家公司都是软件公司...很快,每家公司都将成为人工智能公司。Everybodyisusingsoftware…sooneverybodywilldirectlybeusingAI.每个人都在使用软件...很快,每个人都将直接使用AI。1️⃣FoundationalLargeLangaugeModels&DataCentricTool

DEEPASSET: DEep Learning based Approach for sErviceTerM

作者:禅与计算机程序设计艺术1.简介近年来,随着移动通信网络、物联网和大数据等新兴技术的发展,服务供需双方之间的联系也变得越来越紧密,因而在物流交付过程中的需求响应时间变长了。尽管早期的货运服务通常采用固定预约、悬挂或派送的方式进行,但随着经济规模和数字化发展,目前最流行的是基于互联网的动态调度方式,其中包括地图服务、叫车服务、打车服务以及共享单车等。这些新的供需信息交换模式给服务提供者和消费者带来了巨大的机遇,同时也带来了新的挑战——如何准确及时地将需求信息传播到用户手中。如何利用海量的用户需求信息进行精准、高效的服务调度仍然是一个重要课题。针对当前的调度问题,基于深度学习的算法方法一直占据

【论文笔记+代码解读】《ATTENTION, LEARN TO SOLVE ROUTING PROBLEMS!》

介绍本文提出了一种注意力层+强化学习的训练模型,以解决TSP、VRP、OP、PCTSP等路径问题。文章致力于使用相同的超参数,解决多种路径问题。文中采用了贪心算法作为基线,相较于值函数效果更好。注意力模型文中定义了AttentionModel以解决TSP问题,针对其它问题,不需要改变模型,只需要修改输入、掩码、解码上下文等参量。模型采用编码-解码结构,编码器生成所有输入节点的嵌入,解码器依次生成输入节点的序列π。以下都以TSP问题举例:编码器本文中的编码器部分与Transformer架构中的编码器类似,但不使用位置编码。编码器结点输入维度是2,经过一个线性网络将特征维度扩展到128维;之后经过

AIpowered Quantum Chess With Reinforcement Learning: Is

作者:禅与计算机程序设计艺术1.简介Quantumchessisoneofthemostexcitingandpromisingtopicsincomputersciencetoday.Wemaythinkthatquantummechanicswillrevolutionizeourunderstandingofnaturebutithasn'thappenedyet.Thefieldofquantumchessisstillveryyoungandresearchersaretryingtodevelopnewalgorithmsandtechniquesforplayingthisgam

AI新宠:Prompt Learning,用提示学习调教大模型

“提示学习”对于很多人来说都是新名词,PromptLearning 和 Prompting 这两者之间有什么区别和联系呢?现在的一些大模型如何利用“提示语言”呢?本期直播课为大家做了详细介绍,从AI范式的一个变迁,到提示学习(PromptLearning)和“提示”的有趣小例子!快跟微软ATP一起来看看吧!▍走近“大”模型目前,当谈及AI技术的时候 ,它的最核心的一点 ,就是“模型”这个概念。什么叫模型 ?比如下图的 AI 模型是语言模型 :那像ChatGPT这种大模型,简直就像人类一样拥有智能的模型,那是因为它非常复杂。它是很大的一个神经网络,是有着1,750亿个参数的函数,拥有巨大的表现力

强化学习路径优化:基于Q-learning算法的机器人路径优化(MATLAB)

一、强化学习之Q-learning算法Q-learning算法是强化学习算法中的一种,该算法主要包含:Agent、状态、动作、环境、回报和惩罚。Q-learning算法通过机器人与环境不断地交换信息,来实现自我学习。Q-learning算法中的Q表是机器人与环境交互后的结果,因此在Q-learning算法中更新Q表就是机器人与环境的交互过程。机器人在当前状态s(t)下,选择动作a,通过环境的作用,形成新的状态s(t+1),并产生回报或惩罚r(t+1),通过式(1)更新Q表后,若Q(s,a)值变小,则表明机器人处于当前位置时选择该动作不是最优的,当下次机器人再次处于该位置或状态时,机器人能够避免

基于Diffusion Model的数据增强方法应用——毕业设计 其五

文章目录1题目简介2前言3数据集3.1数据集划分3.2ResNet34测试4扩散模型数据增强4.1数据预处理4.2数据集增强4.3数据增强后的消融实验4.3.10.4噪声强度下4张图片4.3.20.8噪声强度下4张图片4.3.30.4噪声强度下8张图片4.3.40.8噪声强度下8张图片5总结1题目简介笔者个人的毕业设计课题如下:简介:使用预训练的DiffusionModel图像生成模型生成图像,将这些生成的图像作为扩充训练集加入到2D目标检测器、2D图像分类器的训练过程。深度学习是数据驱动的,随着数据量的扩充,能够提高检测器、分类器的鲁棒性、准确性。建议的baseline:分类:ResNet检

Code Llama: Open Foundation Models for Code

本文是LLM系列文章,针对《CodeLlama:OpenFoundationModelsforCode》的翻译。CodeLlama:代码的开放基础模型摘要1引言2CodeLlama:专业化Llama2用于代码3结果4负责任的人工智能与安全5相关工作6讨论摘要我们发布了CodeLlama,这是一个基于Llama2的大型代码语言模型系列,提供了开放模型中最先进的性能、填充功能、对大型输入上下文的支持,以及编程任务的零样本指令跟随能力。我们提供多种风格以涵盖广泛的应用程序:基础模型(Code-Lama)、Python专业化(Code-LAMA-Python),以及分别具有7B、13B和34B参数的指

ios - CocoaPod 规范 : Unable to find other source ref for Model. xcdatamodeld

我正在尝试创建一个包含CoreData模型的pod。我已按照提示使用resources和reserve_path。但是当我尝试使用podliblint对规范进行lint时,出现了一个我什至不明白的奇怪错误:-ERROR|[iOS]unknown:Encounteredanunknownerror(Unabletofindothersourcereffor/Users/rzolin/Projects/ArmorText/iOS-Pod-Test/SampleMessengerCocoapodFramework/SampleMessengerCocoapodFramework/Code/D