LLM-SFT中文大模型微调(LLM-SFT),支持模型(ChatGLM,LlaMA,Bloom),支持(LoRA,QLoRA,DeepSpeed,UI,TensorboardX),支持(微调,推理,测评,接口)等.项目地址https://github.com/yongzhuo/LLM-SFT踩坑LoRA:ChatGLM已经微调比较好了,垂直领域数据继续微调甚至会带来性能下降,建议至多不超过200w-epoch(R=8的情况);QLoRA:不要使用.cuda(),GPU至少为英伟达图灵架构往上【备注】当前(2023.06)QLoRA只是节约显存,并不能加速训练;LoRA权重Bloomz-7B-