草庐IT

Chatglm2-6B微调

全部标签

从零开始部署ubuntu+Anaconda3+langchain-chatchat+chatglm3-6b大模型,本地知识库(一)

零、教程简介     本教程主要实现在ubuntu系统部署chatglm3-6b大模型+本地知识库问答,同时也支持百川,千问,羊驼等主流大模型。     文中会涉及Anaconda3(python多版本环境),langchainchatchatwebui(大模型webui),chagtlm3-6b(智谱大模型),bge-large-zh(向量库) 等内容大语言模型对话效果:本地知识库问答效果:一、操作系统安装操作系统:ubuntu23.10liveserver分区:/根分区40G/data数据盘挂载点150G下载地址:https://releases.ubuntu.com/22.04.3/ub

Gemma谷歌(google)开源大模型微调实战(fintune gemma-2b)

Gemma-SFTGemma-SFT(谷歌,Google),gemma-2b/gemma-7b微调(transformers)/LORA(peft)/推理项目地址https://github.com/yongzhuo/gemma-sft全部weights要用fp32/tf32,使用fp16微调十几或几十的步数后大概率loss=nan;(即便layer-norm是fp32也不行,LLaMA就没有这个问题,原因暂时未知)备注1.非常重要:全部weights要用fp32/tf32,使用fp16微调十几或几十的步数后大概率loss=nan;(即便layer-norm是fp32也不行,LLaMA就没有这

谷歌发布开源大模型 Gemma,评测+最佳微调实践来啦!

Gemma是由Google推出的一系列轻量级、先进的开源模型,他们是基于GoogleGemini模型的研究和技术而构建。它们是一系列textgeneration,decoder-only的大型语言模型,对英文的支持较好,具有模型权重开源、并提供预训练版本(base模型)和指令微调版本(chat模型)。本次Gemma开源提供了四个大型语言模型,提供了2B和7B两种参数规模的版本,每种都包含了预训练版本(base模型)和指令微调版本(chat模型)。官方除了提供pytorch版本之外,也提供了GGUF版本,可在各类消费级硬件上运行,无需数据量化处理,并拥有高达8Ktokens的处理能力,Gemma

(2024,提示优化,监督微调,强化学习,近端策略优化)用于安全生成文本到图像的通用提示优化器

UniversalPromptOptimizerforSafeText-to-ImageGeneration公和众和号:EDPJ(进Q交流群:922230617或加VX:CV_EDPJ进V交流群)目录0.摘要2.相关工作3.提议的框架4.实验0.摘要文本-图像(Text-to-Image,T2I)模型在基于文本提示生成图像方面表现出色。然而,这些模型对于不安全的输入以生成不安全的内容,如性、骚扰和非法活动图像,存在脆弱性。现有的基于图像检查器、模型微调和嵌入阻止的研究在实际应用中是不切实际的。因此,我们提出了第一个在黑盒情景中用于安全T2I生成的通用提示优化器。我们首先通过GPT-3.5Tur

大模型微调

微调在深度学习和自然语言处理(NLP)领域,大规模语言模型如BERT、GPT-3等通过在大量数据上进行预训练获得了强大的语言理解和生成能力。这些预训练模型通常需要进行微调(Fine-tuning),以便在特定的下游任务上表现更好。微调可以采取不同的形式,包括full、LoRA和Q-LoRA。Full微调(FullFine-tuning)Full微调是最传统的微调方法,指的是在特定任务上对整个预训练模型的所有参数进行更新。这种方法简单直接,可以使模型完全适应新任务,但它有两个缺点:一是参数量大,更新所有参数需要大量的计算资源;二是容易过拟合,特别是当下游任务数据量不足时。LoRA(Low-Ran

【ChatGLM2-6B】小白入门及Docker下部署

【ChatGLM2-6B】小白入门及Docker下部署一、简介1、ChatGLM2是什么2、组成部分3、相关地址二、基于Docker安装部署1、前提2、CentOS7安装NVIDIA显卡驱动1)查看服务器版本及显卡信息2)相关依赖安装3)显卡驱动安装2、CentOS7安装NVIDIA-Docker1)相关环境准备2)开始安装3)验证&使用3、Docker部署ChatGLM21)下载对应代码包和模型包2)上传至服务器并进行解压3)下载镜像并启动容器4)等待启动并访问页面5)注意事项三、开发环境搭建1)代码远程编辑配置2)一些基本的说明2、接口调用方式好了,开始你的探索吧~一、简介1、ChatGL

Windows环境下清华ChatGLM3+docker-desktop镜像制作和配置GPU环境docker容器本地运行

仅供学习交流使用,其他任何行为与本博客无关!!1.ChatGLM3的本地部署和docker-desktop的安装(1)下载或git拉取ChatGLM3镜像 拉取镜像,配置环境在此文就不多赘述  gitclone https://github.com/THUDM/ChatGLM3.git(2)docker-desktop的安装这里引用这位大佬的文章,讲的很详细

【AIGC】Stable Diffusion的模型微调

为什么要做模型微调模型微调可以在现有模型的基础上,让AI懂得如何更精确生成/生成特定的风格、概念、角色、姿势、对象。StableDiffusion模型的微调方法通常依赖于您要微调的具体任务和数据。下面是一个通用的微调过程的概述:准备数据集:准备用于微调的数据集。这包括输入图像和相应的标签(如果适用)。确保数据集与您的微调任务相匹配,并且具有足够的样本量和多样性。选择模型:选择要微调的StableDiffusion模型。根据您的任务需求,选择合适的预训练模型。您可以根据任务的复杂性和数据集的大小选择不同的模型规模。冻结部分层(可选):根据您的需求,决定是否冻结预训练模型的一部分层。通常,您可以选

【AIGC】Stable Diffusion之模型微调工具

推荐一款好用的模型微调工具,cybertronfurnace是一个lora训练整合包,提供训练lora模型的工具集或环境。集成环境包括必要的依赖项和配置文件、预训练脚本,支持人物、二次元、画风lora的训练,以简化用户训练lora模型的流程。支持图片预处理、图片的标签编辑,查看训练进度等功能。TensorBoard是TensorFlow提供的一个用于可视化训练过程和模型性能的工具。它可以帮助您更直观地理解模型的训练过程、模型结构、参数变化趋势以及评估指标的变化情况。使用TensorBoard,您可以做以下几件事情:可视化训练过程:您可以查看模型的损失函数随着训练步数的变化趋势,以及其他指标如准

Midjourney基础 | 使用流程 注册,基础文生图,图的放大微调,保存

文章目录1使用流程2生成自己的第一张图3图的放大,微调3.1放大3.2微调变化4图的保存Midjourney是依托于Discord的,但我也是通过Midjourney才了解的Discord维基百科说~~Discord是一款专为社群设计的免费网络实时通话,主要针对游戏玩家、教育人士、朋友及商业人士,用户之间可以在软件的聊天频道通过讯息、图片、视频和音频进行交流。他们在上面创建一个一个服务器,服务器里可以对话聊天,创建机器人,其实有一点像QQ微信群,对应QQ微信群里有着各种各样功能,也可以添加自己的机器人而Midjourney就是Discord的机器人之一,也是非常强大Strong的1使用流程访问