草庐IT

LAION-AI 的新开源 ChatGPT 替代方案:个高端消费类 GPU 上运行的大型语言模型Open Assistant 评测

语言模型近年来取得了长足的进步,其中一个新发布的模型是OpenAssistant和ChatGPT,无需介绍。为了比较这些模型的功能,我们在两个平台上进行了一系列测试,以了解它们在不同类别中的表现。介绍今天(2023年4月12日)Github上的热门话题是OpenAssistant(简称OA),它是由LAION-AI开发的基于聊天的开源助手。该项目的愿景是创建一个可以在单个高端消费类GPU上运行的大型语言模型。通过一些修改,OpenAssistant还应该能够轻松地与其他第三方应用程序交互,以及从数据库和Internet检索信息。OpenAssistant旨在成为一个基于聊天的助手,可以理解任务

数据集-(图像-文本):LAION【史上最大规模多模态图文数据集,包含58.5亿个图像-文本对】

继去年LAION-400M[1]这个史上最大规模多模态图文数据集发布之后,今年又又又有LAION-5B[2]这个超大规模图文数据集发布了。其包含58.5亿个CLIP[5]过滤的图像-文本对的数据集,比LAION-400M大14倍,是世界第一大规模、多模态的文本图像数据集,共80T数据,并提供了色情图片过滤、水印图片过滤、高分辨率图片、美学图片等子集和模型,供不同方向研究。一起来看看。今年大火的DALL·E2再次掀起了多模态图文匹配研究热潮。在图文匹配领域,CLIP[5]模型使得在ImageNet上的zero-shot分类精度从11.5%提升到76.2%,受此启发,ALIGN[3]、BASIC[

首个大规模图文多模态数据集LAION-400M介绍

前言openAI的图文多模态模型CLIP证明了图文多模态在多个领域都具有着巨大潜力,随之而来掀起了一股图文对比学习的风潮。就在前几天(2022年12月),连Kaiming都入手这一领域,将MAE的思路与CLIP的思路结合,推出了FLIP,有兴趣可戳(https://arxiv.org/abs/2212.00794)。对于迷茫的CV研究生,如果你找不到研究方向,justfollowKaiming绝对不会出错。LAION今天要介绍的是一个优秀的图文多模态数据集LAION,跟CLIP原始训练数据集就有相当体量,即400个million。我第一次接触OpenAI的CLIP工作的时候,完全被其zero-

40岁高中老师开源的数据集LAION,改变了生成式AI的未来丨智源大会嘉宾风采

导读如今,拥有超过50亿个图文对的LAION数据集已经成为生成式AI未来的中心ーー而随之而来的关于如何监管人工智能的争论也日益激烈。在德国北部城市汉堡郊区的一栋房屋前,一个信箱上用铅笔潦草地写着一个单词——“LAION”。这唯一的记号表明,这栋房子属于一个特殊的人。正是他,在人工智能繁荣时期在数据收集方面做出了巨大的努力,引起了全世界的关注。这个人就是来自德国的高中老师ChristophSchuhmann,LAION(Large-scaleAIOpenNetwork,“大规模人工智能开放网络”的简称)正是他热衷的项目。近期,Schuhmann接受了美国彭博社的采访,谈到了他关于开放数据集的观点