草庐IT

全参微调

全部标签

全球首个AI程序员Devin诞生,能自学新语言、开发迭代 App、自动Debug、自动微调大语言模型

全球首位AI软件工程师Devin问世:能自学新语言、开发迭代App、自动Debug介绍Devin初创公司Cognition近日发布公告,宣布推出全球首个AI软件工程师Devin,并号称会彻底改变人类构建软件的方式。Devin在SWE-bench编码基准测试中取得了突破性的成功,展示了其执行复杂任务的能力,甚至超越了顶尖的人类工程师。Cognition公司介绍了Devin,称他是世界上第一位能够通过单一提示进行编码、创建网站和软件的人工智能软件工程师,旨在与人类工程师一起工作。虽然有多种编码助手,包括著名的GithubCopilot,但据说Devin凭借其端到端处理整个开发项目的能力脱颖而出,从

ChatLaw:基于LLaMA微调的法律大模型

文章目录动机数据组成模型框架模型评估北大团队发布首个的中文法律大模型落地产品ChatLaw,为大众提供普惠法律服务。模型支持文件、语音输出,同时支持法律文书写作、法律建议、法律援助推荐。github地址:https://github.com/PKU-YuanGroup/ChatLawChatlaw官网(体验地址):https://www.chatlaw.cloud/论文地址:ChatLaw:Open-SourceLegalLargeLanguageModelwithIntegratedExternalKnowledgeBases动机ChatGPT带来的LLM浪潮席卷了各个垂直领域,如医疗,金融

【AIGC】AnimateDiff:无需定制化微调的动画化个性化的文生图模型

 前言Animatediff是一个有效的框架将文本到图像模型扩展到动画生成器中,无需针对特定模型进行调整。只要在大型视频数据集中学习到运动先验知识。AnimateDiff就可以插入到个性化的文生图模型中,与Civitai和Huggingface的文生图模型兼容,也可以与自己微调的大模型兼容。摘要  随着文本到图像模型(例如,StableDiffusion[22])和相应的个性化技术的进步DreamBooth[24]和LoRA[13]等产品,每个人都可以以可承受的成本将他们的想象力体现成高质量的图像。因此,对图像动画技术的需求很大,可以进一步将生成的静态图像与运动动态相结合。在本报告中,我们提出

聊聊ChatGLM-6B医疗数据微调

转载请注明出处:https://www.cnblogs.com/zhiyong-ITNote/参考了多个医疗大模型,如扁鹊、灵心等,重新思考了下微调的方案以及数据集的格式;基于ChatGLM/其它LLM整合多种微调方法的非官方实现的框架,审视其数据集格式,以及调试效果,进行微调。最终基于liucongg/ChatGLM-Finetuning开源框架成功的微调出来我想要的结果。服务器环境阿里云PAI平台开源库下载在服务器上通过git一键下载即可:ChatGLM-6B下载直接在服务器上,通过魔塔社区的sdk下载代码一键下载即可:我加了一句代码打印出下载地址,然后通过mv命令拷贝到指定路径下。#模型

聊聊大模型的微调实现及其应用

转载请备注出处:https://www.cnblogs.com/zhiyong-ITNote微调框架概述模型的微调有多种方式,对于入门的来说,一般都是基于官方的文档微调;最近发现很多开源库,其目的就是支持应用多种微调策略来微调模型,简化模型的微调门槛。比如ChatGLM-Efficient-Tuning、LLaMA-Factory。其架构逻辑如下:最近试玩了这两个框架,个人觉得蛮好的,先不说实际的调试效果,这取决于多种因素,总的来说还是很方便快捷的。方便快捷的基于多种微调策略调试LLM;同时支持多种数据集类型。LLaMA-Factory这个开源库相比较其余的库,更全面,更方便。有如下几点我是比

stable diffusion微调总结

stablediffusion微调总结stablediffusion模型类别:SDSD2SDXLSDXLLCM(潜在一致性模型)SDXLDistilledSDXLTurbo安装accelerate通过pip安装配置accelerateconfig查看配置安装diffusers数据处理BLIP模型优化微调方法Dreambooth微调准备数据:模型训练脚本:模型推理:模型转换脚本:Dream+LORA微调模型训练脚本:模型推理脚本:FullFineTune数据格式:训练脚本:推理脚本LORA微调数据格式:训练脚本:推理脚本:stablediffusion模型类别:SDSD是一个基于latent的扩

多模态表征—CLIP及中文版Chinese-CLIP:理论讲解、代码微调与论文阅读

我之前一直在使用CLIP/Chinese-CLIP,但并未进行过系统的疏导。这次正好可以详细解释一下。相比于CLIP模型,Chinese-CLIP更适合我们的应用和微调,因为原始的CLIP模型只支持英文,对于我们的中文应用来说不够友好。Chinese-CLIP很好地弥补了这方面的不足,它使用了大量的中文-文图对进行训练,与CLIP模型架构完全一致。下面我将从4部分对本篇章进行讲解,讲解CLIP的主要内容;讲解Chinese-CLIP的主要内容;CLIP/Chinese-CLIP代码微调;CLIP/Chinese-CLIP论文重点阅读CLIP:https://arxiv.org/abs/2103

自我认知微调

自我认知微调我们期望微调后的大模型是专属于我们自己的。比如询问大模型是谁或由谁训练的,大模型应当回复是由我们训练的。可以使用自我认知微调来实现这一点。自我认知微调与之前实践过的全参微调和LoRA微调并没有本质上的区别,我们既可以使用任意的微调方式来实现自我认知微调。区别在于,自我认知微调需要使用专门制作的自我认知数据集,并且往往需要混合一部分通用领域/垂直领域的数据集。混合数据集的原因是为了尽可能防止模型在进行自我认知学习的过程中遗忘掉之前的知识。在进行以下步骤之前,请先根据全参微调或LoRA微调配置好环境。编写自我认知微调脚本以下是一个使用LoRA进行自我认知微调的脚本:nproc_per_

基于SWIFT和Qwen1.5-14B-Chat进行大模型LoRA微调测试

基于SWIFT和Qwen1.5-14B-Chat进行大模型LoRA微调测试环境准备基础环境操作系统:Ubuntu18.04.5LTS(GNU/Linux3.10.0-1127.el7.x86_64x86_64)Anaconda3:Anaconda3-2023.03-1-Linux-x86_64根据服务器网络情况配置好conda源和pip源,此处使用的是超算山河源服务器硬件配置:CPU96核;GPU8×NVIDIAA10040GB环境安装通过源代码安装SWIFT:创建一个新的conda环境:condacreate--nameswiftpython=3.8激活刚刚创建的conda环境:condaa

整理了上百个开源中文大语言模型,涵盖模型、应用、数据集、微调、部署、评测

自ChatGPT为代表的大语言模型(LargeLanguageModel,LLM)出现以后,由于其惊人的类通用人工智能(AGI)的能力,掀起了新一轮自然语言处理领域的研究和应用的浪潮。尤其是以ChatGLM、LLaMA等平民玩家都能跑起来的较小规模的LLM开源之后,业界涌现了非常多基于LLM的二次微调或应用的案例。本项目旨在收集和梳理中文LLM相关的开源模型、应用、数据集及教程等资料,目前收录的资源已达100+个!目录技术交流1.模型1.1文本LLM模型1.2多模态LLM模型2.应用2.1垂直领域微调医疗法律金融教育科技自媒体电商网络安全2.2LangChain应用2.3其他应用3.数据集预训