HanQ,LuZ,ZhaoS,etal.Data-drivenbasedphaseconstitutionpredictioninhighentropyalloys[J].ComputationalMaterialsScience,2022,215:111774.文章目录摘要1.引言2.方法2.1数据收集和处理2.2机器学习模型3.结果和分析3.1特征相关性3.2机器学习模型的预测性能3.3特征和特征降维的重要性和有效性3.3.1特种重要性排序3.3.2特征有效性分析:RFECV(循环特征提取和交叉验证)3.3.3特征降维:PCA分析3.4模型对比3.4.1通过二元分类和ROC曲线进行模型比较
论文导读:论文背景:2023年12月11日,AI科学家李飞飞团队与谷歌合作,推出了视频生成模型W.A.L.T(WindowAttentionLatentTransformer)——一个在共享潜在空间中训练图像和视频生成的、基于Transformer架构的扩散模型。李飞飞是华裔女科学家、世界顶尖的AI专家,现为美国国家工程院院士、美国国家医学院院士、美国艺术与科学院院士,斯坦福大学终身教授、斯坦福大学人工智能实验室主任,曾任谷歌副总裁和谷歌云首席科学家。面向问题:视频生成任务中目前主流的方法依然倾向于使用卷积或U-Net作为骨干网络,而没有充分利用Transformer模型的优势。视频的高维度也
前言 这里记录以下知网看到的一篇论文,论文的信息如下,感兴趣的可以自行下载下来研读。论文名称:一种污水处理优化控制过程的超标抑制控制方法期刊名称:高校化学工程学报(JournalofChemicalEngineeringofChineseUniversities)摘要 原文:常规污水处理过程多目标优化控制中存在出水氨氮和总氮浓度长时间超标的问题,为此提出一种污水处理优化控制过程的超标抑制控制方法。该方法在对多目标优化算法获取的溶解氧和硝态氮质量浓度设定值进行跟踪控制的同时,引入了超标抑制决策;利用AdaBoost-LSSVM实时预测出水氨氮和总氮质量浓度,并根据两者的超标情
FIFL:AFairIncentiveMechanismforFederatedLearningFL公平激励机制(多中心FL,无区块链)论文资源已免费上传问题1)没有与其花费的资源相匹配的奖励,设备就没有兴趣参加训练。2)防范恶意员工——上传无意义的更新进行破坏,防范低水平与搭便车者——获得奖励大于为系统带来的收入。本文设计 公平奖励员工,以吸引可靠高效的员工;同时基于动态实时员工评估机制惩罚和消除恶意员工。根据两个指标表征工人的评估结果:1)贡献和2)声誉。贡献衡量员工对系统的效用,声誉是员工在一段时间内产生有用更新的概率,两者结合决定奖励诚实员工(或惩罚攻击者)的金额。系统模型1
论文地址(CVPR2021)代码实现(PyTorch版)《M3DSSD:Monocular3DSingleStageObjectDetector》目录《M3DSSD:Monocular3DSingleStageObjectDetector》0摘要1简介2相关工作3方法3.1骨干网络3.2特征对齐模块3.3非对称非局部注意力块3.42D-3D检测和损失4实验0摘要本文提出一种带有特征对齐及非对称非局部注意力机制的单目三维单阶段目标检测器(Monocular3DSingleStageobjectDetector,M3DSSD)。现有的anchor-based单目三维目标检测方法存在特征不匹配的问题
目录摘要:1.问题重述1.1.问题背景1.2.需要解决的问题1.2.1.
10毫秒生成一张图像,1分钟6000张图像,这是什么概念?下图中,就可以深刻感受到AI的超能力。图片甚至,当你在二次元小姐姐图片生成的提示中,不断加入新的元素,各种风格的图片更迭也是瞬间闪过。图片如此惊人的图片实时生成速度,便是来自UC伯克利、日本筑波大学等研究人员提出StreamDiffusion带来的结果。这个全新的解决方案是一种扩散模型流程,能够以超过100fps的速度,实现实时交互式图像生成。图片论文地址:https://arxiv.org/abs/2312.12491StreamDiffusion开源后直接霸榜GitHub,狂揽3.7k星。图片StreamDiffusion创新性采用
Lag-Llama:TowardsFoundationModelsforTimeSeriesForecasting摘要本文提出Lag-Llama,在大量时间序列数据上训练的通用单变量概率时间序列预测模型。模型在分布外泛化能力上取得较好效果。模型使用平滑破坏幂律(smoothlybrokenpower-laws)。介绍目前任务主要集中于在相同域的数据上训练模型。当前已有的大规模通用模型在大规模不同数据上进行训练,展现出了极强的泛化能力。本文训练了一个Transformer模型,使用大量时序数据进行训练并在未见过的数据集上进行测试。文章在Monash时序仓库上训练了Lag-Llama。本文贡献:提
文章目录一.GPT系列1.in-contextlearning(情景学习)二.ChatGPT背景介绍(Instruct?Align?社会化?)三.InstructGPT的方法四.InstructGPT工作的主要结论五.总结六.参考链接一.GPT系列基于文本预训练的GPT-1,GPT-2,GPT-3三代模型都是采用的以Transformer为核心结构的模型(下图),不同的是模型的层数和词向量长度等超参,它们具体的内容如下表:GPT-1比BERT诞生略早几个月。它们都是采用了Transformer为核心结构,不同的是GPT-1通过自左向右生成式的构建预训练任务,然后得到一个通用的预训练模型,这个模
作者:CSDN@_养乐多_labml-nn库集合了多种神经网络和相关算法的简单PyTorch实现,可以帮助我们快速开发深度学习模型。并配有逐行解释代码的文档。一、网站给大家分享一个深度学习模型代码逐行解释网站(https://nn.labml.ai/),主流模型都包含在里面。该网站中文翻译网站:https://nn.labml.ai/zh/该网站可以逐行解释深度模型代码。二、主要包含的模型主要包含的模型有类型项目Transformers多头注意力、Transformer构建模块、TransformerXL、相对多头注意力、旋转位置嵌入(RoPE)、带线性偏置的注意力(ALiBi)、RETRO、