LAION

LAION-AI 的新开源 ChatGPT 替代方案：个高端消费类 GPU 上运行的大型语言模型Open Assistant 评测

语言模型近年来取得了长足的进步，其中一个新发布的模型是OpenAssistant和ChatGPT，无需介绍。为了比较这些模型的功能，我们在两个平台上进行了一系列测试，以了解它们在不同类别中的表现。介绍今天（2023年4月12日）Github上的热门话题是OpenAssistant（简称OA），它是由LAION-AI开发的基于聊天的开源助手。该项目的愿景是创建一个可以在单个高端消费类GPU上运行的大型语言模型。通过一些修改，OpenAssistant还应该能够轻松地与其他第三方应用程序交互，以及从数据库和Internet检索信息。OpenAssistant旨在成为一个基于聊天的助手，可以理解任务

消费类 Assistant 方面 OpenAssistant 的人工智能 chatgpt 语言模型

数据集-(图像-文本)：LAION【史上最大规模多模态图文数据集，包含58.5亿个图像-文本对】

继去年LAION-400M[1]这个史上最大规模多模态图文数据集发布之后，今年又又又有LAION-5B[2]这个超大规模图文数据集发布了。其包含58.5亿个CLIP[5]过滤的图像-文本对的数据集，比LAION-400M大14倍，是世界第一大规模、多模态的文本图像数据集，共80T数据，并提供了色情图片过滤、水印图片过滤、高分辨率图片、美学图片等子集和模型，供不同方向研究。一起来看看。今年大火的DALL·E2再次掀起了多模态图文匹配研究热潮。在图文匹配领域，CLIP[5]模型使得在ImageNet上的zero-shot分类精度从11.5%提升到76.2%，受此启发，ALIGN[3]、BASIC[

图像文本 xff0c strong xff0 人工智能计算机视觉深度学习

首个大规模图文多模态数据集LAION-400M介绍

前言openAI的图文多模态模型CLIP证明了图文多模态在多个领域都具有着巨大潜力，随之而来掀起了一股图文对比学习的风潮。就在前几天（2022年12月），连Kaiming都入手这一领域，将MAE的思路与CLIP的思路结合，推出了FLIP，有兴趣可戳（https://arxiv.org/abs/2212.00794）。对于迷茫的CV研究生，如果你找不到研究方向，justfollowKaiming绝对不会出错。LAION今天要介绍的是一个优秀的图文多模态数据集LAION，跟CLIP原始训练数据集就有相当体量，即400个million。我第一次接触OpenAI的CLIP工作的时候，完全被其zero-

大规模态 xff xff0c xff0 机器学习 CLIP 多模态 LAION DALL-E

40岁高中老师开源的数据集LAION，改变了生成式AI的未来丨智源大会嘉宾风采

导读如今，拥有超过50亿个图文对的LAION数据集已经成为生成式AI未来的中心ーー而随之而来的关于如何监管人工智能的争论也日益激烈。在德国北部城市汉堡郊区的一栋房屋前，一个信箱上用铅笔潦草地写着一个单词——“LAION”。这唯一的记号表明，这栋房子属于一个特殊的人。正是他，在人工智能繁荣时期在数据收集方面做出了巨大的努力，引起了全世界的关注。这个人就是来自德国的高中老师ChristophSchuhmann，LAION（Large-scaleAIOpenNetwork，“大规模人工智能开放网络”的简称）正是他热衷的项目。近期，Schuhmann接受了美国彭博社的采访，谈到了他关于开放数据集的观点

开源嘉宾 xff0c xff0 xff 人工智能大数据