LLaMA-33B_草庐IT

Meta与微软联手推出开源大型语言模型Llama 2；程序员如何优雅地做副业

🦉AI新闻🚀Meta与微软联手推出开源大型语言模型Llama2摘要：Meta和微软近期合作发布了名为Llama2的开源大型语言模型。该模型旨在帮助开发者和组织构建生成式人工智能工具和体验。Azure客户可以更轻松、安全地在Azure平台上微调和部署Llama2模型，也可以优化后在Windows本地运行。此外，Llama2模型与AzureAI的结合，可以使开发者利用AzureAI的工具进行模型训练、微调和推理，尤其支持AI安全功能。微软表示，将Llama2模型加入Windows将有助于推动Windows成为开发者构建AI体验的最佳场所。一个Llama2的在线测试地址：www.llama2.aiA

【AI实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat

【AI实战】开源中文llama2来了，30分钟搭建130亿参数大模型Llama2-Chinese-13b-Chat简介环境配置环境搭建依赖安装代码及模型权重拉取拉取Llama2-Chinese拉取Llama2-Chinese-13b-Chat模型权重及代码终端测试页面测试安装gradio加载模型并启动服务国内Llama2最新下载地址参考简介Llama22023年7月19日：Meta发布开源可商用模型Llama2。Llama2是一个预训练和微调的生成文本模型的集合，其规模从70亿到700亿个参数不等。LLaMA2的详细介绍可以参考这篇文章：【大模型】更强的LLaMA2来了，开源可商用、与Chat

在树莓派中跑迷你Llama2中文模型

OpenAI的Karpathy利用周末搞了一个迷你Llama2项目llama2.c用500行C语言实现无任何依赖项的推理程序，此项目在github发布以来衍生出了基于各种语言的迷你Llama推理实现llama2.go、llama2.java、llama2.py等等；但该项目原本的模型并不支持中文，最近正好看到一个基于llama2的中文训练模型；想着把它跑在树莓派上速度会怎样；使用Go实现进行模型推理，该在树莓派中的Llama2迷你中文模型，模型大小为15M使用的数据集为TinyStories英文翻译后的数据但仅翻译了TinyStories的部分数据目前为1M，中文词表使用UTF-8

读发布！设计与部署稳定的分布式系统（第2版）笔记33_混沌工程

1. 康威定律1.1. 梅尔文·康威1.1.1. MelvinConway1.1.2. 1968年1.1.3. 在设计系统时，组织受制于其自身的沟通结构，这使得它设计的系统结构与沟通结构相一致。1.1.3.1. 社会学现象1.2. 要在系统内部或系统之间构建接口，两个人必须以某种方式沟通有关该接口的规范1.2.1. 没有沟通，就无法建立接口1.3. 如果系统不是用稳定性模式构建的，那么它可能采用了典型的紧耦合架构1.3.1. 发生失效的总体概率，是其中任何一个组件发生失效的概率之和1.4. 应用程序的某些组件是针对QA环境的网络拓扑结构进行设计的，而这与生产环境不匹配2. 负载测试2.1. 并

Llama 2 来袭 - 在 Hugging Face 上玩转它

🤗宝子们可以戳阅读原文查看文中所有的外部链接哟！引言今天，Meta发布了Llama2，其包含了一系列最先进的开放大语言模型，我们很高兴能够将其全面集成入HuggingFace，并全力支持其发布。Llama2的社区许可证相当宽松，且可商用。其代码、预训练模型和微调模型均于今天发布了🔥。通过与Meta合作，我们已经顺利地完成了对Llama2的集成，你可以在Hub上找到12个开放模型(3个基础模型以及3个微调模型，每个模型都有2种checkpoint:一个是Meta的原始checkpoint，一个是transformers格式的checkpoint)。以下列出了HuggingFace支持Llama2

【类ChatGPT】本地CPU部署中文羊驼大模型LLaMA和Alpaca

昨天在github上看到一个在本地部署中文大模型的项目，和大家分享一下。先把地址po出来。项目名称：中文LLaMA&Alpaca大语言模型+本地部署(ChineseLLaMA&AlpacaLLMs)项目地址：https://github.com/ymcui/Chinese-LLaMA-Alpaca以下是原github中给出的体验GIF，可以看到这个模型还是具备一定的指令理解和上下文对话能力的。由于模型使用的是LoRA（一种高效模型训练方法），所以整个模型的参数量是比较小的（压缩包大概不到800M），但是需要和原版Facebook的权重进行结合才能使用。其实Facebook开源了，但又没完全开源

研究完llama.cpp，我发现手机跑大模型竟这么简单

最近在开源社区，很多人都在探索大模型的优化方法。有一个叫llama.cpp的项目用原始C++重写了LLaMa的推理代码，效果极好，获得了人们的广泛关注。通过一些优化和量化权重，它能让我们在各种以前无法想象的硬件上本地运行LLaMa模型。其中：在谷歌Pixel5手机上，它能以1token/s的速度运行7B参数模型。在 M2芯片的MacbookPro上，使用7B参数模型的速度约为16token/s我们甚至于可以在4GBRAM的树莓派上运行7B模型，尽管速度只有0.1 token/sGitHub链接：https://github.com/ggerganov/llama.cpp我们知道，除了通用化能力

聊聊拉长LLaMA的一些经验

SequenceLength是指LLM能够处理的文本的最大长度，越长，自然越有优势：更强的记忆性。更多轮的历史对话被拼接到对话中，减少出现遗忘现象长文本场景下体验更佳。比如文档问答、小说续写等当今开源LLM中的当红炸子鸡——LLaMA，第一版上下文长度是2048，第二版长度是4096。相比之下ChatGPT、GPT4已经支持到16k，Claude甚至支持到了100k。足以见得将LLaMA拉长是如此的任重而道远。本文将会介绍三种在旋转位置编码（RoPE）基础上扩充上下文的高性价比方案，在文末会介绍我的实践经验。线性插值法Kaiokendev的博客[1]中提到了方法，和Meta的一篇工作[2]不谋

Qt音视频开发33-vlc和mpv打开后鼠标打圈圈问题的解决

一、前言如果采用的vlc句柄模式，如果鼠标停留在句柄控件中会发现在打开后鼠标打圈圈，mpv句柄模式是在关闭后鼠标打圈圈，这两者真是一前一后，这种给人的体验其实很不友好的，播放开始后或者播放完成后鼠标指针居然变成了繁忙，但是当你将鼠标位置从句柄控件中移到外面的时候，他又会自动恢复，所以需要有个机制主动恢复鼠标形状，一开始想的办法是模拟移动鼠标位置移来移去，当有几十个上百个通道的时候，这样移来移去看起来就是很傻的感觉，后面想了个办法用系统的api强制将鼠标指针恢复，测试下来还是有点怪怪的，后面发现Qt本身就内置了鼠标指针复位的函数先qApp->setOverrideCursor(Qt::Arrow

羊驼进化成鲸鱼，Meta把对齐「自动化」，Humpback击败现有全部LLaMa模型

这一年来，以ChatGPT和GPT-4为代表的大语言模型（LLM）发展迅速，紧随其后，Meta开源的LLaMa、Llama2系列模型在AI界也引起的了不小的轰动。但随之而来的是争议不断，有人认为LLM存在一些不可控的风险，给人类生存构成一些潜在威胁。为了应对这些挑战，对LLM对齐的研究变得越来越重要，有研究者提出指令跟随（instructionfollowing），但这种方法需要大量的人工注释。然而，注释如此高质量的指令跟随数据集耗费巨大。本文来自 MetaAI的研究者提出了一种可扩展的方法即指令回译（instructionbacktranslation），该方法通过自动注释相应的指令来构建高