LLM-Augmenter_草庐IT

LLM系列 | 26：阿里千问Qwen模型解读、本地部署

引言简介预训练数据来源预处理分词模型设计外推能力模型训练实验结果部署实测对齐监督微调(SFT)RM模型强化学习对齐结果(自动和人工评估)自动评估人工评估部署实测总结引言人生自是有情痴，此恨不关风与月。今天这篇小作文主要介绍中文大模型阿里千问Qwen，具体包括模型细节解读和实战这2部分。如需与小编进一步交流(包括完整代码获取)，可以通过主页添加小编好友。简介Qwen是一个全能的语言模型系列，包含各种参数量的模型，如Qwen（基础预训练语言模型，即基座模型）和Qwen-Chat（聊天模型，该模型采用人类对齐技术进行微调）。基座模型在众多下游任务中始终表现出卓越的性能，而聊天模型，尤其是使用人类反

LLM实践-在Colab上使用免费T4 GPU进行Chinese-Llama-2-7b-4bit推理

一、配置环境1、打开colab，创建一个空白notebook，在[修改运行时环境]中选择15GB显存的T4GPU.2、pip安装依赖python包!pipinstalltransformers!pipinstallsentencepiece!pipinstalltorch!pipinstallaccelerate注意此时，安装完accelerate后需要重启notebook，不然报如下错误：ImportError:Usinglow_cpu_mem_usage=Trueoradevice_maprequiresAccelerate:pipinstallaccelerate注：参考文章内容[1]不

生成式人工智能潜力的释放：软件工程师的MLOps和LLM部署策略

译者|李睿审校|重楼生成式人工智能最近的爆发标志着机器学习模型的能力发生了翻天覆地的变化。像DALL-E2、GPT-3和Codex这样的人工智能系统表明，人工智能系统在未来可以模仿人类独特的技能，例如创作艺术、进行对话，甚至编写软件。然而，有效地部署和管理这些新兴的大型语言模型(LLM)给组织带来了巨大的挑战。本文将为软件工程师提供支持研究的解决方案策略，通过利用机器学习运营(MLOps)最佳实践来顺利集成生成式人工智能，并详细介绍经过验证的技术以部署LLM以优化效率，在生产中对其进行监控，不断更新以提高性能，并确保它们在各种产品和应用程序中协同工作。通过遵循所提出的方法，人工智能从业者可以规

驶向『闭环』| LMDrive：首篇基于LLM的闭环端到端自动驾驶

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解汽车人这两天在arxiv上看到了港中文MMLab&商汤的一篇关于闭环自动驾驶的工作，结合了大语言模型。不幸汤老师于12月15日与世长辞，R.I.P.尽管自动驾驶领域最近取得了重大进展，但当遇到长尾不可预见事件和具有挑战性的城市场景时，现代方法仍然很困难，可能会发生严重事故。一方面，大型语言模型（LLM）已经显示出接近“通用人工智能”的表达推理能力。另一方面，先前的自动驾驶方法往往依赖于有限的格式输入（例如传感器数据和导航路线点），限制了车辆理解语言信息和与人类互动的能力。为此，港中文&MMLab重磅推出LMDrive，这

解密Prompt系列21. LLM Agent之再谈RAG的召回信息密度和质量

话接上文的召回多样性优化，多路索引的召回方案可以提供更多的潜在候选内容。但候选越多，如何对这些内容进行筛选和排序就变得更加重要。这一章我们唠唠召回的信息密度和质量。同样参考经典搜索和推荐框架，这一章对应排序+重排环节，考虑排序中粗排和精排的区分主要是针对低延时的工程优化，这里不再进一步区分，统一算作排序模块。让我们先对比下重排和排序模块在经典框架和RAG中的异同排序模块经典框架：pointwise建模，局部单一item价值最大化，这里的价值可以是搜索推荐中的内容点击率，或者广告中的ecpm，价值由后面使用的用户来决定RAG：基本和经典框架相同，不过价值是大模型使用上文多大程度可以回答问题,价值

LLM、ChatGPT与多模态必读论文150篇

为了写本ChatGPT笔记，我和10来位博士、业界大佬，在过去半年翻了大量中英文资料/paper，读完ChatGPT相关技术的150篇论文，当然还在不断深入。由此而感慨：读的论文越多，你会发现大部分人对ChatGPT的技术解读都是不够准确或全面的，毕竟很多人没有那个工作需要或研究需要，去深入了解各种细节因为半年内150篇这个任务，让自己有史以来一篇一篇一行一行读，之前看的比较散、不系统，抠的也不细比如回顾“Attentionisallyouneed”这篇后，对优化博客内的Transformer笔记便有了很多心得。考虑到为避免上篇文章篇幅太长而影响完读率，故把这些论文的清单抽取出来独立成本文技

AI首次攻克难倒陶哲轩数学难题，DeepMind里程碑算法登Nature！LLM搜代码自我进化

上限集问题，是困扰数学家们多年的开放性问题。著名数学家陶哲轩，就曾将上限集问题描述为自己最喜欢的开放性问题。陶哲轩博客而大语言模型，竟然在这个问题上做出了新发现。今天，GoogleDeepMind、威斯康星大学麦迪逊分校和里昂大学的研究人员联手提出全新方法——FunSearch，竟首次利用LLM发现数学科学中的开放问题！AI通过搜索计算机代码编写的「函数」，因此得名FunSearch。论文地址：https://www.nature.com/articles/s41586-023-06924-6简单来说，FunSearch将预训练的LLM与自动「评估器」配对使用。前者的目标是以计算机代码的形式提

LLM生成3D场景，无限延伸！斯坦福华人提出3D动画生成框架，一句话一幅图创造无限3D世界

斯坦福华人退学博士开发的Pika，让AI技术和艺术迸发出了绚丽的火花。最近，又有斯坦福的华人研究人员提出的新的框架——WonderJourney，可以用一句话或者一张图，自动生成一系列3D场景的连续画面，效果炫酷！图片用一张爱丽丝奇境漫游的图片，就能生成一段真的爱丽丝漫游的梦境经历。或者，用一首陆游的《游山西村》，可以生成一段水墨风格的诗词梦境：莫笑农家腊酒浑，丰年留客足鸡豚。山重水复疑无路，柳暗花明又一村。箫鼓追随春社近，衣冠简朴古风存。从今若许闲乘月，拄仗无时夜扣门图片项目网址：https://kovenyu.com/WonderJourney/图片论文地址：https://arxiv.o

全方位、无死角的开源，邢波团队LLM360让大模型实现真正的透明

开源模型正展现着它们蓬勃的生命力，不仅数量激增，性能更是愈发优秀。图灵奖获得者YannLeCun也发出了这样的感叹：「开源人工智能模型正走在超越专有模型的路上。」专有模型在技术性能和创新能力上展现了非凡的力量，但是它们不开源的性质成为LLM发展的阻碍。一些开源模型虽然为从业者和研究者提供了多样化的选择，但大多数只公开了最终的模型权重或推理代码，越来越多的技术报告将其范围限制在顶层设计和表面统计之内。这种闭源的策略不仅限制了开源模型的发展，而且还在很大程度上阻碍了整个LLM研究领域的进步。这意味着，这些模型需要更全面和深入地共享，包括训练数据、算法细节、实现挑战以及性能评估的细节。Cerebra

用RLHF 2%的算力让LLM停止有害输出，字节提出LLM遗忘学习

随着大型语言模型（LLM）的发展，从业者面临更多挑战。如何避免LLM产生有害回复？如何快速删除训练数据中的版权保护内容？如何减少LLM幻觉（hallucinations，即错误事实）?如何在数据政策更改后快速迭代LLM？这些问题在人工智能法律和道德的合规要求日益成熟的大趋势下，对于LLM的安全可信部署至关重要。目前业界的主流解决方案为LLM对齐(alignment)，即通过建立对比数据（正样本和负样本）用强化学习的方式来对LLM进行微调(Finetuning)，也就是RLHF(ReinforcementLearningfromHumanFeedback)[1]，从而保证LLM输出符合人类预期和