草庐IT

machine-learning-model

全部标签

由浅入深理解Latent Diffusion/Stable Diffusion(3):一步一步搭建自己的Stable Diffusion Models

DiffusionModels专栏文章汇总:入门与实战前言:关于如何使用stablediffusion的文章已经够多了,但是由浅入深探索stablediffusionmodels背后原理,如何在自己的科研中运用stablediffusion预训练模型的博客少之又少。本系列计划写5篇文章,和读者一起遨游diffusionmodels的世界!本文主要介绍带大家一步步搭建自己的stablediffusionmodels。目录背景设置仔细研究文本到嵌入pipeline

分子模拟第一弹——基于SWISS-MODEL的蛋白三维结构预测

    从今天开始,小编将开始为大家更新分子模拟相关的文章。首先,给大家介绍的第一部分知识是基于SWISS-MODEL的蛋白三维结构预测。    学过相关生物知识的同学都知道,蛋白质的一级结构决定了其高级结构,所以,我们可以根据已有的天然蛋白质结构对未知蛋白结构进行预测。其中最常用的方法之一就是比较建模法(comparativemodelingmethod),即我们常听到的同源建模(HomologyModeling),而SWISS-MODEL在线网站就是一款使用同源建模法预测蛋白三维结构的网站。下面我们就具体看一下如何使用这个在线网站进行蛋白的三维结构预测及结果解读。前期准备预测工具:SWIS

【深度学习】扩散模型(Diffusion Model)详解

【深度学习】扩散模型(DiffusionModel)详解文章目录【深度学习】扩散模型(DiffusionModel)详解1.介绍2.具体方法2.1扩散过程2.2逆扩散过程2.3损失函数3.总结4.参考1.介绍扩散模型有两个过程:扩散过程:如上图所示,扩散过程为从右到左X0→XTX_0\rightarrowX_TX0​→XT​的过程,表示对图片逐渐加噪,且Xt+1X_{t+1}Xt+1​是在XtX_{t}Xt​上加躁得到的,其只受XtX_{t}Xt​的影响。因此扩散过程是一个马尔科夫过程。X0X_0X0​表示从真实数据集中采样得到的一张图片,对X0X_0X0​添加TTT次噪声,图片逐渐变得模糊。

将 reinforcement learning 应用于智能语音识别高级优化

作者:禅与计算机程序设计艺术1.引言1.1.背景介绍近年来,随着人工智能技术的快速发展,语音识别技术在智能助手、智能家居等领域应用广泛。然而,传统的语音识别技术在处理复杂语音场景、识别准确率等方面存在一定的局限性。为此,reinforcementlearning(强化学习)技术被引入到语音识别领域,以期提高识别准确率、实现更智能化的语音助手。1.2.文章目的本文旨在阐述将reinforcementlearning应用于智能语音识别高级优化的方法与技术,包括技术原理、实现步骤、应用示例以及优化与改进等。通过深入剖析这一技术,旨在为语音识别领域的从业者提供有益参考,以便更好地应对日益复杂的语音识别

3、手动搭建强化学习的环境reinforcement learning

一、概述在强化学习(ReinforcementLearning)的研究领域,并没有一些很好的模块可以使用。不像DeepLearning一样,有很多的框架,比如说tensorflow,pytorch,cafe等。应对这不同环境下的RL,可能编写的代码就会不一样,所以我们需要能够学会使用基础框架自己搭建一个属于自己的模型,更加好的理解底层原理,以后不管遇到什么样的环境,也能够应付。Numpy,pandas:用于数据处理;Matplotlib:展示误差曲线等,数据可视化;Tkinter:编写模拟环境;Tensorflow:实现神经网络和强化学习的结合;OpenAIgym:提供许多现成的游戏环境;二、

文献阅读:LLaMA: Open and Efficient Foundation Language Models

文献阅读:LLaMA:OpenandEfficientFoundationLanguageModels1.文章简介2.模型训练1.训练数据2.模型结构3.模型训练1.Optimizer2.效率优化3.效果评估1.经典任务下效果1.CommenSenseReasoning2.Closed-bookQuestionAnswering3.ReadingComprehension4.Mathematicalreasoning5.Codegeneration6.MassiveMultitaskLanguageUnderstanding7.Evolutionofperformanceduringtrain

【开源AI大模型】WizardCoder: Empowering Code Large Language Models with Evol-Instruct

文章目录WizardCoder:EmpoweringCodeLargeLanguageModelswithEvol-InstructNewsComparingWizardCoderwiththeClosed-SourceModels.ComparingWizardCoderwiththeOpen-SourceModels.CallforFeedbacksUnofficialVideoIntroductionsContentsOnlineDemoFine-tuningInferenceEvaluationHumanEval

【论文导读】- SpreadGNN: Serverless Multi-task Federated Learning for Graph Neural Networks(去服务器的多任务图联邦学习)

文章目录论文信息摘要SpreadGNNFramework用于图层次学习的联邦图神经网络图神经网络的联邦多任务学习SpreadGNNDPA-SGD的收敛性质实验总结论文信息SpreadGNN:ServerlessMulti-taskFederatedLearningforGraphNeuralNetworks原文链接:SpreadGNN:ServerlessMulti-taskFederatedLearningforGraphNeuralNetworks:https://arxiv.org/abs/2106.02743摘要GraphNeuralNetworks(GNNs)arethefirstc

阅读文献《SCNet:Deep Learning-Based Downlink Channel Prediction for FDD Massive MIMO System》

该文献的作者是清华大学的高飞飞老师,于2019年11月发表在IEEECOMMUNICATIONSLETTERS上。文章给出了当用户位置到信道的映射是双射时上行到下行的确定映射函数;还提出了一个稀疏复值神经网络(sparsecomplex-valuedneuralnetwork,SCNet)来逼近映射函数,SCNet直接根据预估的上行链路CSI预测下行链路CSI,不需要下行链路训练,也不需要上行链路反馈。1研究背景在大规模MIMO中,BS使用CSI用于波束形成、用户调度等,UE使用CSI用于信号检测,但由于下行链路训练和上行链路反馈相关的开销过高,因此需要进行优化工作。由于BS和用户的信道只有很

M3AE: Multimodal Representation Learning for Brain Tumor Segmentation with Missing Modalities

 摘要 提出SimCLR,用于视觉表征的对比学习,简化了最近提出的对比自监督学习算法,为了理解是什么使对比预测任务能够学习有用的表示,系统研究了提出框架的主要组成部分,发现:(1)数据增强的组成在定义有效的预测任务中起着关键的作用(2)在表示和对比损失之间引入一个可学习的非线性变换,大大提高了已学习表示的质量(3)与监督学习相比,对比学习受益于更大的批量规模和更多的训练步骤SimCLR学习的自监督表示训练的线性分类器达到了76.5%的top-1精度,比之前的技术水平提高了7%,与监督ResNet-50的性能相匹配。  方法对比学习框架  随机采样一个minibatch的数据(N个样本),定义生