深度学习常用数据集介绍与下载（附网盘链接）

思绪无限 2023-03-28 原文

摘要：这篇博文总结了博主收集的深度学习常用的数据集，包含常用的分类、目标检测及人脸识别任务，对每个数据集给出了简要介绍、官网下载网站以及公众号获取的关键字。因为有的数据集较大，官网的下载速度可能比较慢，为了方便大家管理，这里我将其整理到了个人公众号平台中，可通过下方卡片“AI技术研究与分享”关注，并在后台回复各数据集关键字即可获取网盘链接。数据集文件均为官方网站下载，仅用于学习交流，博主会持续更新，欢迎关注。

1. 分类数据集

数据集：MNIST

        手写数字数据集，包含一组60,000个示例的训练集和一组10,000个示例的测试集。
        官网地址：MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges
        关键字（建议复制）：Face-Place

数据集：CIFAR-10

包含了10个类别的60,000个图像（每个类在上图中表示为一行）。总共有50,000个训练图像和10,000个测试图像。

官网地址：CIFAR-10 and CIFAR-100 datasets
关键字（建议复制）：CIFAR-10

数据集：Fashion-MNIST

        包含60,000个训练图像和10,000个测试图像。类似MNIST的时尚产品数据库。
        官网地址：GitHub - zalandoresearch/fashion-mnist: A MNIST-like fashion product database. Benchmark
        关键字（建议复制）：fashion-mnist

数据集：Imagenet

        Imagenet数据集有1400多万幅图片，涵盖2万多个类别，关于图像分类、定位、检测等研究工作大多基于此数据集展开。
        官网地址：http://www.image-net.org/about-stats
        关键字（建议复制）：ImageNet

2. 目标检测数据集

数据集：MS-COCO

        COCO是一个规模大且丰富的物体检测，分割和字幕数据集。330K图像，80个物体类别，每幅图像5个字幕，250，000个有关键点的人。
        官网地址：COCO - Common Objects in Context
        关键字（建议复制）：MS-COCO

数据集：PASCAL-VOC

        PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试，提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统，包括20个目录。
        官网地址：The PASCAL Visual Object Classes Homepage
        关键字（建议复制）：PASCAL-VOC

数据集：BDD100K

        自动驾驶常用大型多样化数据集，标注超过100,000张图像，类别包含公共汽车，行人，自行车，卡车，小汽车，火车和骑手等，用于目标检测、全帧分割等。
        官网地址：Berkeley DeepDrive
        关键字（建议复制）：BDD-100K

数据集：Open-Images

        Open Images是一个包含近900万个图像URL的数据集。这些图像已经用数千个类别的图像级标签边框进行了注释。
        官网地址：Open Images V6
        关键字（建议复制）：Open-Images

3. 人脸识别数据集

数据集：CASIA-WebFace

        包含了10575 个人的494414 张图像。CASIA-webface数据库，里面包含了10000个人，一共50万张人脸图片，均来源于网络。
        官网地址：NameBright - Coming Soon
        关键字（建议复制）：CASIA-WebFace

数据集：PubFig

        哥伦比亚大学的公众人物脸部数据集，包含有200个人的58k+人脸图像，主要用于非限制场景下的人脸识别。
        官网地址：Pubfig: Public Figures Face Database
        关键字（建议复制）：PubFig

数据集：CelebA

        香港中文大学汤晓鸥教授实验室公布的大型人脸识别数据集。该数据集包含有200K张人脸图片，人脸属性有40多种，主要用于人脸属性的识别。
        官网地址：CelebA Dataset
        关键字（建议复制）：CelebA

数据集：ColorFeret

        包括了一个通用人脸库以及通用测试标准，它已经包含了1000多人的10000多张照片，每个人包括了不同表情，光照，姿态和年龄的照片。
        官网地址：color FERET Database | NIST
        关键字（建议复制）：ColorFeret

数据集：MTFL

        该数据集包含了将近13000张人脸图片，均采自网络。
        官网地址：Facial Landmark Detection by Deep Multi-task Learning
        关键字（建议复制）：MTFL

数据集：FaceDB

        包含了1521幅分辨率为384x286像素的灰度图像。每一幅图像来自于23个不同的测试人员的正面角度的人脸。
        官网地址：BioID Face Database | Face Detection Dataset | facedb - BioID
        关键字（建议复制）：FaceDB

数据集：LFW

        为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13，000张人脸图像，均采集于Internet。为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13，000张人脸图像，均采集于Internet。
        官网地址：http://vis-www.cs.umass.edu/lfw/
        关键字（建议复制）：LFW

数据集：Person identification in TV series

        该数据集所选用的人脸照片均来自于两部比较知名的电视剧，《吸血鬼猎人巴菲》和《生活大爆炸》。
        官网地址：Semi-supervised Learning with Constraints for Person Identification in Multimedia Data
        关键字（建议复制）：PITVS

数据集：CMUVASC-PIE

        CMU PIE人脸库建立于2000年11月，它包括来自68个人的40000张照片，其中包括了每个人的13种姿态条件，43种光照条件和4种表情下的照片。
        官网地址：http://vasc.ri.cmu.edu/idb/html/face/index.html
        关键字（建议复制）：CMUVASC-PIE

数据集：CASIA-FaceV5

        该数据集包含了来自500个人的2500张亚洲人脸图片。
        官网地址：http://biometrics.idealtest.org/dbDetailForUser.do?id=9
        关键字（建议复制）：CASIA-FaceV5

数据集：The CNBC Face Database

        该数据集采集了200个人在不同状态下（不同的神情，装扮，发型等）的人脸照片。
        官网地址：http://wiki.cnbc.cmu.edu/Face_Place
        关键字（建议复制）：Face-Place

数据集：IMDB-WIKI

        IMDB-WIKI人脸数据库总共523,051张人脸数据库，每张图片都被标注了人的年龄和性别，对于年龄识别和性别识别的研究有着重要的意义。
        官网地址：IMDB-WIKI - 500k+ face images with age and gender labels
        关键字（建议复制）：IMDB-WIKI

数据集：FDDB

        FDDB是UMass的数据集，被用来做人脸检测(Face Detection)。这个数据集比较大，比较有挑战性。
        官网地址：http://vis-www.cs.umass.edu/fddb/index.html
        关键字（建议复制）：FDDB

数据集：Caltech-10K-WebFaces

        10k+人脸，提供双眼和嘴巴的坐标位置。
        官网地址：ttp://www.vision.caltech.edu/Image_Datasets/Caltech_10K_WebFaces/#Description
        关键字（建议复制）：Caltech-10K

数据集：JAFFE

        该数据库是由10位日本女性在实验环境下根据指示做出各种表情。整个数据库一共有213张图像，10个人，全部都是女性，每个人做出7种表情。
        官网地址：The Japanese Female Facial Expression (JAFFE) Dataset | Zenodo
        关键字（建议复制）：JAFFE

数据集：AFLW

        前2000个AFLW样本的拟合3D面，可用于3D面对齐评估。
        官网地址：http://www.cbsr.ia.ac.cn/users/xiangyuzhu/projects/3DDFA/main.htm
        关键字（建议复制）：AFLW

数据集文件均为官方网站下载，仅用于学习交流，博主会持续更新，欢迎关注。

更多分享，敬请期待！

深度学习深度 nbsp font face 人工智能

有关深度学习常用数据集介绍与下载（附网盘链接）的更多相关文章

ruby-on-rails - Rails 常用字符串(用于通知和错误信息等) - 2
大约一年前，我决定确保每个包含非唯一文本的Flash通知都将从模块中的方法中获取文本。我这样做的最初原因是为了避免一遍又一遍地输入相同的字符串。如果我想更改措辞，我可以在一个地方轻松完成，而且一遍又一遍地重复同一件事而出现拼写错误的可能性也会降低。我最终得到的是这样的:moduleMessagesdefformat_error_messages(errors)errors.map{|attribute,message|"Error:#{attribute.to_s.titleize}#{message}."}enddeferror_message_could_not_find(obje
ruby - 解析 RDFa、微数据等的最佳方式是什么，使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2
我主要使用Ruby来执行此操作，但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式，例如使用这个yaml文件，它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
ruby - 如何使用 Ruby aws/s3 Gem 生成安全 URL 以从 s3 下载文件 - 2
我正在编写一个小脚本来定位aws存储桶中的特定文件，并创建一个临时验证的url以发送给同事。(理想情况下，这将创建类似于在控制台上右键单击存储桶中的文件并复制链接地址的结果)。我研究过回形针，它似乎不符合这个标准，但我可能只是不知道它的全部功能。我尝试了以下方法:defauthenticated_url(file_name,bucket)AWS::S3::S3Object.url_for(file_name,bucket,:secure=>true,:expires=>20*60)end产生这种类型的结果:...-1.amazonaws.com/file_path/file.zip.A
ruby - 安装 Ruby 时遇到问题(无法下载资源 "readline--patch") - 2
当我尝试安装Ruby时遇到此错误。我试过查看this和this但无济于事➜~brewinstallrubyWarning:YouareusingOSX10.12.Wedonotprovidesupportforthispre-releaseversion.Youmayencounterbuildfailuresorotherbreakages.Pleasecreatepull-requestsinsteadoffilingissues.==>Installingdependenciesforruby:readline,libyaml,makedepend==>Installingrub
ruby - Ruby 有 `Pair` 数据类型吗？ - 2
有时我需要处理键/值数据。我不喜欢使用数组，因为它们在大小上没有限制(很容易不小心添加超过2个项目，而且您最终需要稍后验证大小)。此外，0和1的索引变成了魔数(MagicNumber)，并且在传达含义方面做得很差(“当我说0时，我的意思是head...”)。散列也不合适，因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题，但我很想知道:Ruby标准库是否已经带有这样一个类？最佳
ruby - 我如何添加二进制数据来遏制 POST - 2
我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_
世界前沿3D开发引擎HOOPS全面讲解——集3D数据读取、3D图形渲染、3D数据发布于一体的全新3D应用开发工具 - 2
无论您是想搭建桌面端、WEB端或者移动端APP应用，HOOPSPlatform组件都可以为您提供弹性的3D集成架构，同时，由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台（桌面/WEB/APP，而且某些客户端是“瘦”客户端）快速、方便地将数据接入到3D应用系统的解决方案，并且当访问数据时，在各个平台上的性能和用户体验保持一致，HOOPSPlatform将帮助您完成。利用HOOPSPlatform，您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品，HOOPSSDK包含的技术有：快速且准确的CAD
Unity 热更新技术 | （三） Lua语言基本介绍及下载安装 - 2
?博客主页：https://xiaoy.blog.csdn.net?本文由呆呆敲代码的小Y原创，首发于CSDN??学习专栏推荐：Unity系统学习专栏?游戏制作专栏推荐：游戏制作?Unity实战100例专栏推荐：Unity实战100例教程?欢迎点赞?收藏⭐留言?如有错误敬请指正！?未来很长，值得我们全力奔赴更美好的生活✨------------------❤️分割线❤️-------------------------
FOHEART H1数据手套驱动Optitrack光学动捕双手运动(Unity3D) - 2
本教程将在Unity3D中混合Optitrack与数据手套的数据流，在人体运动的基础上，添加双手手指部分的运动。双手手背的角度仍由Optitrack提供，数据手套提供双手手指的角度。 01 客户端软件分别安装MotiveBody与MotionVenus并校准人体与数据手套。MotiveBodyMotionVenus数据手套使用、校准流程参照：https://gitee.com/foheart_1/foheart-h1-data-summary.git02 数据转发打开MotiveBody软件的Streaming，开始向Unity3D广播数据；MotionVenus中设置->选项选择Unit
使用canal同步MySQL数据到ES - 2
文章目录一、概述简介原理模块二、配置Mysql使用版本环境要求1.操作系统2.mysql要求三、配置canal-server离线下载在线下载上传解压修改配置单机配置集群配置分库分表配置1.修改全局配置2.实例配置垂直分库水平分库3.修改group-instance.xml4.启动监听四、配置canal-adapter1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步数据同步开关启动4.验证五、配置canal-admin一、概述简介canal是Alibaba旗下的一款开源项目，Java开发。基于数据库增量日志解析，提供增量数据订阅&消费。Git地址：https://github.co