草庐IT

llama_factory_py

全部标签

LLMs之Chinese-LLaMA-Alpaca-2:源码解读(run_clm_sft_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的che

LLMs之Chinese-LLaMA-Alpaca-2:源码解读(run_clm_sft_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的checkpoint+加载预训练模型和tokenizer)→数据预处理(监督式任务的数据收集器+指令数据集【json格式】)→优化模型配置(量化模块+匹配模型vocabulary大小与tokenizer+初始化PEFT模型【LoRA】+梯度累积checkpointing等)→模型训练(继续训练+评估指标+自动保存中间训练结果)/模型评估(+PPL指标)目录源码解读(run_clm_sft_with_pe

斯坦福大学发布 AI 基础模型“透明度指标”,Llama 2 以 54% 居首但“不及格”

10月20日消息,斯坦福大学日前发布了AI基础模型“透明度指标”,其中显示指标最高的是Meta的Lama2,但相关“透明度”也只有54%,因此研究人员认为,市面上几乎所有AI模型,都“缺乏透明度”。据悉,这一研究是由HAI基础模型研究中心(CRFM)的负责人RishiBommasani所主导,调查了海外最流行的10款基础模型:Meta的Llama2、BigScience的BloomZ、OpenAI的GPT-4、StabilityAI的StableDiffusion、AnthropicPBC的Claude、谷歌的PaLM2、Cohere 的Command、AI21Labs的Jurassic-2、

你的GPU能跑Llama 2等大模型吗?用这个开源项目上手测一测

在算力为王的时代,你的GPU可以顺畅的运行大模型(LLM)吗?对于这一问题,很多人都难以给出确切的回答,不知该如何计算GPU内存。因为查看GPU可以处理哪些LLM并不像查看模型大小那么容易,在推理期间(KV缓存)模型会占用大量内存,例如,llama-2-7b的序列长度为1000,需要1GB的额外内存。不仅如此,模型在训练期间,KV缓存、激活和量化都会占用大量内存。我们不禁要问,能不能提前了解上述内存的占用情况。近几日,GitHub上新出现了一个项目,可以帮你计算在训练或推理LLM的过程中需要多少GPU内存,不仅如此,借助该项目,你还能知道详细的内存分布情况、评估采用什么的量化方法、处理的最大上

LLaMA2上下文长度暴涨至100万tokens,只需调整1个超参数

只需微调一下,大模型支持上下文大小就能从1.6万tokens延长至100万?!还是在只有70亿参数的LLaMA2上。要知道,即使是当前最火的Claude2和GPT-4,支持上下文长度也不过10万和3.2万,超出这个范围大模型就会开始胡言乱语、记不住东西。现在,一项来自复旦大学和上海人工智能实验室的新研究,不仅找到了让一系列大模型提升上下文窗口长度的方法,还发掘出了其中的规律。按照这个规律,只需调整1个超参数,就能确保输出效果的同时,稳定提升大模型外推性能。外推性,指大模型输入长度超过预训练文本长度时,输出表现变化情况。如果外推能力不好,输入长度一旦超过预训练文本长度,大模型就会“胡言乱语”。所

python - 将 Flask models.py 迁移到 MySQL

我是新来的。忍受我。我正在开发一个使用SQLAlchemy作为ORM的Flask应用程序,直到今天我一直在使用SQLite以方便使用。我现在将应用程序放在DigitalOcean上并希望使用MySQL而不是SQLite。我在DigitalOcean上的ubuntuVPS上安装了MySQL,它似乎配置正确。但是,显然我必须创建数据库表,这样我才能将数据保存在里面。问题:有没有办法让我迁移我的models.py,这样数据库表是根据我在models.py中编写的内容创建的,还是我必须创建所有数据库表我自己在MySQL中手动?您可以在此处实时查看应用程序:http://workflowforu

mysql - Django 1.1 中大型数据库的 manage.py 数据转储(创建测试数据库)

为了能够进行一些像样的单元测试,我想创建一个测试数据库。阅读Django文档后,我得出结论,执行此操作的最佳方法是使用固定装置从实际数据库创建测试数据库。要创建这样的夹具,一个是运行:./manage.pydumpdataappname--indent2转储后,我想编辑文件,并选择我真正要使用的数据。然而,倾倒它几乎让我的电脑崩溃(我认为脚本开始破坏)。还有,好像是先把所有的数据都放到内存里,然后一次性全部打印出来。我使用的数据库是MySQL有没有一种方法可以在不让我的PC崩溃的情况下以可用作固定装置的格式从数据库中取出数据?(我正在考虑的替代方案是为具有大量行的对象重新定义默认数据管

mysql - 使用 py2neo 的 neo4j 中的多个数据库

是否可以在neo4j中创建多个数据库或实例,类似于在mysql中创建多个数据库的方式?我在下面的链接中找到了评论,但尽管标题很有前途,但它似乎并没有回答我的问题。我在带有py2neoREST接口(interface)的Mac上运行neo4j的社区版本1.9.5。对于其他上下文,我可能想创建一个数据库(或图形实例)来映射工作电子邮件/联系人列表中的节点和关系,并为个人家谱创建一个完全独立的实例。我尝试将文件名添加到GraphDatabaseService方法的实例化中,如下所示:graph_db=neo4j.GraphDatabaseService("http://localhost:7

python manage.py makemigrations 没有检测到任何变化?

我只是从github克隆现有项目,并将mysql数据库转储到我的本地机器。一切正常。我在myapp/model.py中做了一些更改,比如添加新表。之后运行1.python./manage.pymakemigrationsmyapp。然后它使迁移文件像Migrationsfor'myapp':0001_initial.py:-CreatemodelAndroidRegkey-CreatemodelApkVersion..............................................pythonmanage.pymigratemyapp它给出以下消息Operati

将 Qt Designer 的 ui 文件转换为 PySide2 使用的.py 文件

20201206修订:在Pyside2的5.15.2版本中,从ui生成py文件过程,命令从“uic”变为“pyside2-uic”QtDesigner设计的ui文件,就是一个xml文件,通过pyside-uic可以转换成标准的.py文件。通过QtDesigner创建的ui如图:我们切入正题:1:首先要保证将pyside2-uic.exe加到环境变量Path中。根据我的Python,PySide2安装路径。设置具体如下图:2:使用PySide2中的QtDesigner工具创建具体的ui文件。QtDesigner路径如下:3:将创建的ui文件使用命令生成对应的.py文件。先从系统的cmd进入到ui