草庐IT

machine-learning-model

全部标签

LLMs之LLaMA-2:源码解读之所有py文件(包括example_text_completion.py/example_chat_completion.py+model.py/generation

LLMs之LLaMA-2:源码解读之所有py文件(包括example_text_completion.py/example_chat_completion.py+model.py/generation.py/tokenizer.py)目录一、llama2源码解读—推理功能—(example_text_completion.py/example_chat_completion.py)1、源码解读(example_text_completion.py文件)利用预训练好的语言模型基于文本提示实现生成文本任务运行脚本命令#1.0、main函数使用预训练模型生成文本#1.1、先通过Llama.build

大模型 Dalle2 学习三部曲(一)Latent Diffusion Models学习

引言Diffusion model大获成功,但是它的短板也很明显,需要大量的计算资源,并且推理速度比较慢。如何才能提升Diffusion model的计算效率。业界有各种各样的改进,无疑Latent Diffusion Models(潜在扩散模型,LDMs)是比较成功的一篇,那就来学习一下LDMS是怎么做的吧论文贡献1,与基于变换的方法相比,论文的方法在处理更高维度数据,可以高效地应用于高分辨率图像的合成,具体措施如下)使用潜在空间进行训练:作者在隐空间而不是像素空间上训练扩散模型。这使得模型可以在更高分辨率的图像上实现高效的图像合成,同时降低计算复杂性。)训练自动编码器:首先,作者训练了一个

Code Llama: Open Foundation Models for Code

PapernameCodeLlama:OpenFoundationModelsforCodePaperReadingNotePaperURL:https://ai.meta.com/research/publications/code-llama-open-foundation-models-for-code/ProjectURL:https://about.fb.com/news/2023/08/code-llama-ai-for-coding/BlogURL:https://ai.meta.com/blog/code-llama-large-language-model-coding/Co

翻译"Deep ANC: A deep learning approach to active noise control"

DeepANC:主动噪声控制的深度学习方法原论文地址:DeepANC:Adeeplearningapproachtoactivenoisecontrol引文:[1]HaoZA,DlwaB.DeepANC:Adeeplearningapproachtoactivenoisecontrol[J].NeuralNetworks,2021,141:1-10.摘要传统的主动噪声控制(ANC)方法是以最小均方算法为基础的自适应信号处理,主要用于线性系统,但是在存在非线性失真的情况下表现不佳。在本文中,我们将ANC表述为一个监督学习问题,并提出了一种称为深度ANC的深度学习方法来解决非线性ANC问题。主要思

stable diffusion model训练遇到的问题【No module named ‘triton‘】

一天早晨过来,发现昨天还能跑的diffusion代码,突然出现了【Nomodulenamed‘triton’】的问题,导致本就不富裕的显存和优化速度雪上加霜,因此好好探究了解决方案。首先是原因,由于早晨过来发现【电脑重启】导致了【训练终止】(美好的心情从看到windows更新结束),基本可以判定是由于windows更新,以及所编译的triton的windows版本的原因,最终解决方案如下:1、第一步,按顺序卸载triton、xformers、torchpipuninstalltritonpipuninstallxformerspipuninstalltorch2、第二步,利用huggingfa

自监督学习UNSUPERVISED REPRESENTATION LEARNING BY PREDICTING IMAGE ROTATIONS论文笔记

文章目录一、自监督简介1.监督和无监督学习2.无监督学习3.自监督学习二、论文内容0.辅助任务1.出发点2.符号假设3.网络模型4.优点三、实验结果1.CIFAR实验a.评估学习到的特征层次结构b.探讨学习到的特征质量和辅助任务旋转角度之间的关系c.对比实验2.在IMageNet上不同任务的实验结果a.分类任务参考文献一、自监督简介关于自监督部分内容参考Self-supervisedLearning再次入门和知乎微调大佬的回答什么是无监督学习。1.监督和无监督学习监督学习利用大量带有标签的数据来训练网络,使得网络能够提取得到丰富的语义特征。无监督信息不需要标签数据来进行训练,通过对数据内在特征

PV3D: A 3D GENERATIVE MODEL FOR PORTRAITVIDEO GENERATION 【2023 ICLR】

ICLR:InternationalConferenceonLearningRepresentationsCCF-A国际表征学习大会:深度学习的顶级会议生成对抗网络(GANs)的最新进展已经证明了生成令人惊叹的逼真肖像图像的能力。虽然之前的一些工作已经将这种图像gan应用于无条件的2D人像视频生成和静态的3D人像合成,但很少有工作成功地将gan扩展到生成3D感知人像视频。在这项工作中,我们提出了PV3D,这是第一个可以合成多视图一致人像视频的生成框架。具体来说,我们的方法通过推广3D隐式神经表示来模拟时空空间,将最近的静态3D感知图像GAN扩展到视频领域。为了将运动动力学引入到生成过程中,我们

【避坑】paddlepaddle-gpu安装报错:The GPU architecture in your current machine is Pascal, which is not

版本与报错信息完整的系统、显卡等环境如下:系统:win10显卡:GeForceGTX10606GBpython3.7.16cuda:cuda11.2.0cudnn:cudnn8.2.1paddlepaddle:pip安装版本:gpu==2.5.1.post112安装指令为:python-mpipinstallpaddlepaddle-gpu==2.5.1.post112-fhttps://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html安装成功后,测试结果如下:(base)D:\Downloads>python-c"importpa

机器学习(十一):Scikit-learn库的基础与使用

全文共15000余字,预计阅读时间约30~50分钟|满满干货,建议收藏!本文涉及的代码下载地址一、介绍1.1Scikit-learn的发展历程及定义Scikit-learn的发展始于2007年,由DavidCournapeau在GoogleSummerofCode项目中启动。项目后续得到了许多开发者的贡献,包括INRIA(法国国家信息与自动化研究所),Waikato大学和其他机构。项目之所以取名为Scikit-Learn,也是因为该算法库是基于SciPy来进行的构建,而Scikit则是SciPyKit(SciPy衍生的工具套件)的简称Scikit-learn是目前机器学习领域最完整、同时也是最

【AI人工智能】用于代码生成的大型语言模型 Large Language Models for Code Generation

 目录LargeLanguageModelsforCodeGeneration–Part1用于代码生成的大型语言模型——第1部分Introduction