草庐IT

羊驼家族

全部标签

【类ChatGPT】中文LLaMA-2、Alpaca-2 二代羊驼大模型体验

前言     Meta发布的一代LLaMA已经掀起了一股开源大模型热潮,也有很多相关工作不断涌现。最近Meta全新发布了Llama-2,效果更上一层楼。而且最重要的是模型可以相对随意分发了,不像一代一样,meta不让开发者发布基于llama模型训练出来的权重(原版当然更不可以)。既然有了Llama-2,国内开发者应该也会很快做出适配的吧。我大概搜索了一下github,以chinesellama2为关键字搜索,能看到已经有一些项目了。不过感觉其中有几个是挺像YX号的,为什么这么说呢,进去之后有卖课的PR(手动狗头)。所以这次还是选择之前一直评测的ChineseLLaMA&Alpaca项目的二代项

从Conti到Akira:解码最新的Linux和ESXi勒索软件家族

勒索软件领域的演变已经从涉及Windows有效载荷的传统方法,转变为针对其他平台(最明显的是Linux)的方法。在这种转变中,勒索软件运营商正在缩短不同有效载荷发布之间的时间间隔,并在不同的平台上实现功能均等。通过有策略地利用Conti、Babuk或Lockbit等知名勒索软件家族的代码,勒索软件运营商正在重用和修改代码库,以创建新的攻击技术。随着越来越多的此类事件曝光,安全团队在防御中保持警惕和适应性变得至关重要。本文将重点介绍最近发现的几个勒索软件家族,它们都在运行后不久就释放了以Linux/ESXi为重点的有效载荷。了解这些有效载荷的能力是衡量未来风险的重要一步,也是帮助安全团队有效应对

UNIX家族?Windows NT家族?一文讲清操作系统繁杂的家族史

关于专栏本专栏更新速度慢,简单讲讲操作系统的那些事,让不是做操作系统开发的同学也能大概认识操作系统这个出现在生活各处的东西浅淡操作系统系列第0篇目录关于专栏贝尔实验室UNIXLinuxBSDWindowsNT结语快捷翻页参考文章贝尔实验室讲操作系统肯定离不开贝尔实验室了,贝尔实验室作为整个星球最伟大的实验室(没有之一),创造出了很多颠覆性的产品这个贝尔,就是著名的亚历山大·格拉汉姆·贝尔,电话专利的获得者1876年,贝尔呈交电话专利申请并获得批准第二年,具有商业头脑的贝尔就创办了贝尔电话公司1895年,贝尔公司将其正在开发的美国长途业务项目分割,建立了一家独立的公司,称为美国电话电报公司,也就

【类ChatGPT】本地CPU部署中文羊驼大模型LLaMA和Alpaca

昨天在github上看到一个在本地部署中文大模型的项目,和大家分享一下。先把地址po出来。项目名称:中文LLaMA&Alpaca大语言模型+本地部署(ChineseLLaMA&AlpacaLLMs)项目地址:https://github.com/ymcui/Chinese-LLaMA-Alpaca以下是原github中给出的体验GIF,可以看到这个模型还是具备一定的指令理解和上下文对话能力的。由于模型使用的是LoRA(一种高效模型训练方法),所以整个模型的参数量是比较小的(压缩包大概不到800M),但是需要和原版Facebook的权重进行结合才能使用。其实Facebook开源了,但又没完全开源

羊驼进化成鲸鱼,Meta把对齐「自动化」,Humpback击败现有全部LLaMa模型

这一年来,以ChatGPT和GPT-4为代表的大语言模型(LLM)发展迅速,紧随其后,Meta开源的LLaMa、Llama2系列模型在AI界也引起的了不小的轰动。但随之而来的是争议不断,有人认为LLM存在一些不可控的风险,给人类生存构成一些潜在威胁。为了应对这些挑战,对LLM对齐的研究变得越来越重要,有研究者提出指令跟随(instructionfollowing),但这种方法需要大量的人工注释。然而,注释如此高质量的指令跟随数据集耗费巨大。本文来自 MetaAI的研究者提出了一种可扩展的方法即指令回译(instructionbacktranslation),该方法通过自动注释相应的指令来构建高

Wannamine家族挖矿病毒处置

wannamine挖矿病毒主要通过入侵计算机来挖取门罗币,对于它的处置建议则是:1.首先断开受感染机器的网络连接,实行网络隔离。2.禁用随开机启动的恶意服务,一般服务名是由三个字符串列表随机组成:Windows、Microsoft、Network、Remote、Function、Secure、Application、Update、Time、NetBIOS、RPC、Protocol、SSDP、UPnP、Service、Host、Client、Event、Manager、Helper、System,并且删除C:\Windows\System32和C:\Windows\SystemWOW64目录下与

Fedora Linux 的家族(三):实验室

根据个人需求,每个人使用计算机的方式都不同。你可能是一位设计师,需要在计算机上安装各种设计软件。或者你可能是一位游戏玩家,所以需要一个支持你喜欢的游戏的操作系统。有时候我们没有足够的时间来准备一个支持我们需求的操作系统。FedoraLinux实验室版本就是为了满足这个需求而存在的。Fedora实验室是由Fedora社区成员精心策划和维护的用于特定目的的软件和内容的集合。本文将对FedoraLinux实验室版本进行更详细的介绍。你可以在我之前的文章《FedoraLinux的各种版本》中找到所有FedoraLinux变种的概述。Fedora天文学版Fedora 天文学Astronomy有关所包含的

Fedora Linux 的家族(二):定制版

使用Linux的一个好处是可以选择多种不同的桌面环境。FedoraLinux官方的Workstation版本默认使用GNOME作为桌面环境,但是你可以通过Fedora 定制版Spin 选择另一个桌面环境作为默认环境。KDEPlasma桌面这个FedoraLinux定制版使用KDEPlasma作为默认的桌面环境。KDEPlasma是一个优雅的桌面环境,非常易于定制。因此,你可以根据自己的喜好自由地定制桌面的外观。你可以定制你喜欢的主题,安装所需的小部件,更换图标、字体,根据个人喜好定制面板,并从社区安装各种扩展功能。FedoraLinuxKDEPlasma桌面预装了许多常用的应用程序。你可以使用

Fedora Linux 的家族(一):官方版本

FedoraLinux提供了多个变体以满足你的需求。你可以在我之前的文章《FedoraLinux的各种版本》中找到所有FedoraLinux变体的概述。FedoraWorkstation如果你是笔记本电脑或台式计算机用户,则FedoraWorkstation是适合你的操作系统。FedoraWorkstation非常易于使用。你可以用它满足日常工作、教育、爱好等需求。例如,你可以使用它创建文档,制作演示文稿,上网冲浪,处理图像,编辑视频等等。这个FedoraLinux版本默认使用GNOME桌面环境。你可以使用这种环境舒适地工作和进行各种活动。你还可以根据个人喜好自定义FedoraWorkstat

训练14分钟,超越Alpaca!华人团队发布「飞天羊驼」,基于LLM的数据过滤新范式

近期,指令微调(IFT)已经被作为预训练大语言模型(LLMs)获得指令遵循能力的关键训练阶段。然而,广泛使用的IFT数据集(例如,Alpaca的52k数据)却包含许多质量低下的实例,这些实例带有错误或无关的回应,对IFT产生了误导和不利影响。先前的处理方法主要依靠人工筛选这些低质量数据,但这既费时费力,又难以扩展。因此,如何以高效、自动化的方式过滤出这些低质量数据,成为提升LLM微调效果的关键所在。现在,来自马里兰大学,三星和南加大的研究人员提出了一种有效的数据过滤策略,使用强大的LLM(例如,ChatGPT)自动识别和移除低质量数据,以改善指令微调(IFT)的效果。图片论文地址:https: