草庐IT

user_model

全部标签

LLM之Colossal-LLaMA-2:源码解读(init_tokenizer.py文件)实现基于源词表的扩展、(init_model.py文件)实现过计算均值扩展模型、(prepare_pretr

LLM之Colossal-LLaMA-2:源码解读(init_tokenizer.py文件)实现基于源词表的扩展(中文标记的新词汇)进而实现持续预训练、(init_model.py文件)实现过计算均值来扩展模型的嵌入层以适应新的词汇表,然后保存扩展后的模型、(prepare_pretrain_dataset.py文件)将原始数据集进行处理和切片并保存为JSONL格式和Arrow格式目录

各大搜索引擎的User-Agent

各大搜索引擎的User-Agentbaidu:Mozilla/5.0(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)Google:Mozilla/5.0(compatible;Googlebot/2.1;+http://www.google.com/bot.html)Sogou:Sogouwebspider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)Yahoo:Mozilla/5.0(compatible;Yahoo!Slurp/3.0;h

【论文笔记】SINE: SINgle Image Editing with Text-to-Image Diffusion Models

声明不定期更新自己精度论文,通俗易懂,初级小白也可以理解涉及范围:深度学习方向,包括CV、NLP论文标题:SINE:SINgleImageEditingwithText-to-ImageDiffusionModels论文链接:https://www.semanticscholar.org/paper/SINE%3A-SINgle-Image-Editing-with-Text-to-Image-Zhang-Han/a6ad30123bef4b19ee40c3d63cfabf00d211f0efhttps://www.semanticscholar.org/paper/SINE%3A-SINgl

git 安装后配置用户名遇到error: invalid key: user.name......

git:‘config–global’isnotagitcommand.See‘git--help’.error:invalidkey:user.namea_dyl执行下面语句时报错:fatal:notinagitdirectorygitconfiguser.name使用gitinit新建一个Git仓库,完了就好了

SD整合包,Lora模型下载了放models/Lora文件夹里,但是webui页面加载不出来(已解决)

1.首先用的是秋叶大神的整合包,一键启动后,发现在C站下载的Lora模型加载不出来,刚开始还不小心放在SD大模型的文件夹里,倒是可以看到,但是生成图像的时候会提示是Lora模型,不是大模型,不匹配啥的,生成失败;2.先描述一下我的问题,Lora模型放在指定的文件夹D:\BaiduNetdiskDownload\sd-webui-aki-v4.4\models\Lora下,甚至启动器的模型管理页面也能看到Lora模型,但是在webui页面就是重启、刷新都不显示出来,显示暂无内容,就很奇怪;3.然后网上搜了很多,主要是以下这两个链接,有一些提示和解决方法:1)【图片】关于lora文件在webui中

Hadoop报错Permission denied: user=dr.who, access....

一、提出问题:Hadoop集群上tmp文件夹上方出现红色代码串“Permissiondenied:user=dr.who,access=READ_EXECUTE,inode="/tmp":root:supergroup:drwxrwx---”。该问题其实是一个权限问题,可能会导致运行“hadoopjar”命令时报错;MapReduce工件,中间数据将保存在该目录下。MapReduce作业执行完成后,这些文件将自动清除。如果删除此临时文件,则可能会影响当前正在运行的mapreduce作业:报错原因是因为运行”hadoopjar“文件时的默认hdfs文件夹是tmp,但是由于权限不够导致运行失败。赋

c++ - Visual Studio Code : Take Input From User

目前,我正在尝试在VisualStudio代码中编写C/C++程序。为此,我安装了两个扩展:C/C++&C++Intellisense根据文档,调试工具不适用于Windows。我已经能够通过以下任务构建和运行代码:{"version":"0.1.0","command":"cmd","isShellCommand":true,"args":["/C"],"tasks":[{"taskName":"Makefile","suppressTaskName":true,//Makethisthedefaultbuildcommand."isBuildCommand":true,//Showt

一文带你解密 Large Language Model(大型语言模型)

在过去十年间,AI(人工智能)领域取得了令人瞩目的突破,而其中的 NLP(自然语言处理)是其中一项重要的子领域。NLP致力于开发各种技术和方法,用于处理和理解人类语言的文本数据。NLP的发展使得机器能够更好地理解和处理人类语言,从而实现更加智能和自然的交互。这包括了诸如文本分类、情感分析、命名实体识别、机器翻译、问答系统等多个任务和应用领域。NLP技术的核心是建立起对语言的理解和表达的模型。LLM (大型语言模型)是其中一项关键技术。LLM基于深度神经网络架构,通过学习大规模语料库中的文本数据,能够捕捉到单词、短语和句子之间的语义和语法规律。从而使得LLM能够自动生成连贯、自然的文本,增强了机

对于 《Robust Blockchained Federated Learning with Model Validation and PoS Inspired Consensus》的讨论

对于《RobustBlockchainedFederatedLearningwithModelValidationandProof-of-StakeInspiredConsensus》的讨论文章概述本文主要是根据GoogleFL和VanillaFL为基础进行创新的,发表于2021年。其中VanillaFL是Google公司于2017年写的一篇论文《Communication-EfficientLearningofDeepNetworksfromDecentralizedData》中提到的方法,也是全球第一个提出联邦学习的论文。GoogleFL也是Google公司于2017年写的一篇论文《Fed

【论文阅读】Scaling Laws for Neural Language Models

前言本文简要介绍Scalinglaw的主要结论原文地址:ScalingLawsforNeuralLanguageModels个人认为不需要特别关注公式内各种符号的具体数值,而更应该关注不同因素之间的关系,比例等SummaryPerformancedependsstronglyonscale,weaklyonmodelshapescale:参数量NNN,数据量DDD,计算量CCCshape:模型深度,宽度,self-attentionhead数目等Smoothpowerlaws:N,D,CN,D,CN,D,C三个因素中,当其他两个不受限制时,模型性能与任意一个因素都有power-lawrelat