草庐IT

指令微调

全部标签

基于SWIFT和Qwen1.5-14B-Chat进行大模型LoRA微调测试

基于SWIFT和Qwen1.5-14B-Chat进行大模型LoRA微调测试环境准备基础环境操作系统:Ubuntu18.04.5LTS(GNU/Linux3.10.0-1127.el7.x86_64x86_64)Anaconda3:Anaconda3-2023.03-1-Linux-x86_64根据服务器网络情况配置好conda源和pip源,此处使用的是超算山河源服务器硬件配置:CPU96核;GPU8×NVIDIAA10040GB环境安装通过源代码安装SWIFT:创建一个新的conda环境:condacreate--nameswiftpython=3.8激活刚刚创建的conda环境:condaa

整理了上百个开源中文大语言模型,涵盖模型、应用、数据集、微调、部署、评测

自ChatGPT为代表的大语言模型(LargeLanguageModel,LLM)出现以后,由于其惊人的类通用人工智能(AGI)的能力,掀起了新一轮自然语言处理领域的研究和应用的浪潮。尤其是以ChatGLM、LLaMA等平民玩家都能跑起来的较小规模的LLM开源之后,业界涌现了非常多基于LLM的二次微调或应用的案例。本项目旨在收集和梳理中文LLM相关的开源模型、应用、数据集及教程等资料,目前收录的资源已达100+个!目录技术交流1.模型1.1文本LLM模型1.2多模态LLM模型2.应用2.1垂直领域微调医疗法律金融教育科技自媒体电商网络安全2.2LangChain应用2.3其他应用3.数据集预训

LLMs之Llama2 70B:使用 PyTorch FSDP 微调 Llama 2 70B实现全部过程讲解之详细攻略

LLMs之Llama270B:使用PyTorchFSDP微调Llama270B实现全部过程讲解之详细攻略目录使用PyTorchFSDP微调Llama270B引言FSDP工作流使用的硬件微调LLaMa270B面临的挑战解决上述挑战,微调出一个70B的模型准备工作微调应对挑战1应对挑战2应对挑战3注意力机制的性能瓶颈算子融合综合运用所有手段训练损失曲线总结使用PyTorchFSDP微调Llama270B地址文章地址:https://huggingface.co/blog/ram-efficient-pytorch-fsdp时间2023年9月13日作者SourabMangrulkarSylvainG

北大具身智能成果入选CVPR'24:只需一张图一个指令,就能让大模型玩转机械臂

只靠一张物体图片,大语言模型就能控制机械臂完成各种日常物体操作吗?北大最新具身大模型研究成果ManipLLM将这一愿景变成了现实:在提示词的引导下,大语言模型在物体图像上直接预测机械臂的操作点和方向。进而,得以操控机械臂直接玩转各项具体的任务:例如打开抽屉、冰箱,揭锅盖、掀马桶盖……作者表示:该方法利用LLM的推理和面对开放世界的泛化能力,成功提升了模型在物体操纵方面的泛化能力。在仿真和真实世界中,ManipLLM在各种类别的物体上均取得了令人满意的效果,证明了其在多样化类别物体中的可靠性和适用性。与谷歌RT2等输出机器人本体动作的策略相比(如下图所示),该方法侧重于以物体为中心(Object

使用直接偏好优化策略微调Mistral-7b模型

译者|朱先忠审校|重楼引言通常,经过预训练的大型语言模型(LLM)只能执行下一个标记预测,这使其无法回答问题。这就解释了为什么这些基本模型还需要根据成对的指令和答案作进一步微调,最终才能够充当真正有用的人工助理。然而,这个过程仍然可能存在缺陷:微调LLM可能存在偏见的甚至是有毒害性的输出结果。这也正是从人类反馈中强化学习(ReinforcementLearningfromHumanFeedback:简称“RLHF”)发挥作用的地方。具体来说,RLHF能够为LLM提供不同的答案,这些答案将按所期待的行为(有益性、毒害性等)进行排序。该模型学习从这些候选者中输出最佳答案,从而模仿我们想要“灌输”的

【STM32 物联网】AT指令与TCP,发送与接收数据

文章目录前言一、连接TCP服务器1.1配置Wifi模式1.2连接路由器1.3查询ESP8266设备IP地址1.4连接TCP服务器二、向服务器接收数据和发送数据2.1发送数据2.2接收数据总结前言随着物联网(IoT)技术的迅速发展,越来越多的设备和系统开始连接到互联网,实现远程监控、数据采集和远程控制等功能。在物联网应用中,STM32微控制器以其强大的性能和丰富的外设功能成为了重要的选择之一。而在STM32与互联网通信中,AT指令与TCP/IP协议成为了两个重要的技术手段。一、连接TCP服务器1.1配置Wifi模式我们可以使用下面这个AT指令进行WIFI模式的设置:AT+CWMODE=3//so

java - Java 9 中的 opens 指令

我正在阅读Java9规范草案,但我不清楚这句话:Theopensdirectivespecifiesthenameofapackagetobeopenedbythecurrentmodule.Thismakespublicandprotectedtypesinthepackage,andtheirpublicandprotectedmembers,beaccessibletocodeinothermodulesatruntimeonly.Italsomakesalltypesinthepackage,andalltheirmembers,beaccessibleviathereflec

基于SWIFT和Qwen1.5-14B-Chat进行大模型全参微调测试

基于SWIFT和Qwen1.5-14B-Chat进行大模型全参微调测试环境准备基础环境操作系统:Ubuntu18.04.5LTS(GNU/Linux3.10.0-1127.el7.x86_64x86_64)Anaconda3:Anaconda3-2023.03-1-Linux-x86_64根据服务器网络情况配置好conda源和pip源,此处使用的是超算山河源服务器硬件配置:CPU96核;GPU8×NVIDIAA10040GB环境安装通过源代码安装SWIFT:创建一个新的conda环境:condacreate--nameswiftpython=3.8激活刚刚创建的conda环境:condaact

探索Linux世界:初次接触和基本指令(文件操作)

文章目录1.基本介绍和准备2.基本指令和Linux的基本操作3.几个重要基本指令3.1`ls`-列出文件和目录3.1.1文件的知识3.1.2`.和..`文件3.2`pwd`-显示当前工作目录3.2.1路径知识3.3`cd`-切换目录3.4`touch`-创建文件或更新时间戳3.5`mkdir`-创建新目录3.6`rm`-删除文件或目录3.7`man`-显示命令手册页面3.7.1手册介绍3.8`cp`-复制文件或目录3.8.1nano介绍3.9`mv`-移动或重命名文件或目录1.基本介绍和准备Linux是一种开源、免费的类Unix操作系统内核,其开发始于1991年,由芬兰计算机科学家LinusT

java - 如何将监听器附加到 JavaFX 微调器?

我遇到了JavaFX微调器似乎(无论如何对我来说)一个奇怪的问题,并且无法将任何类型的监听器附加到它。我习惯了Swing编程,我可以在其中将ChangeListener附加到JSpinner并以这种方式接收事件,但JavaFX似乎没有类似的功能。有问题的代码...IntegerSpinnerValueFactoryspinnerValueFactory=newSpinnerValueFactory.IntegerSpinnerValueFactory(0,Integer.MAX_VALUE);hullPointsSpinner=newSpinner(spinnerValueFactor