[OpenCV实战]1 基于深度学习识别人脸性别和年龄

liferecords 2023-03-28 原文

本教程中，我们将讨论应用于面部的深层学习的有趣应用。我们将估计年龄，并从单个图像中找出该人的性别。模型由GilLevi和TalHassner训练。本文介绍了如何在OpenCV中使用该模型的步骤说明。Opencv版本3.4.3以上。代码教程代码可以分为四个部分：

1基于CNN的性别分类建模原理

作者使用非常简单的卷积神经网络结构，类似于Caffenet和Alexnet。网络使用3个卷积层、2个全连接层和一个最终的输出层。下面给出了这些层的细节。COV1：第一卷积层具有96个内核大小7的节点。COV2：第二个卷积层Conv层具有256个具有内核大小5的节点。CONV3：第三个CONV层具有384个内核大小为3的节点。两个完全连接的层各自具有512个节点。

训练数据来源：

检测程序主要有四块：检测人脸检测、性别检测、年龄显示和输出。

1.1 人脸识别

我们将使用人脸检测器（tensorflow模型）进行人脸检测。该模型很简单，即使在CPU上也是相当快的。详细见论文：

1.2 性别预测

将性别预测设定为一个分类问题。性别预测网络（caffe模型）中的输出层类型为两类，2个节点表示“男性”和“女性”两类。以这两个输出的最大值作为最终的性别。

1.3 年龄预测

理想情况下，年龄预测应该作为一个回归问题来处理。然而通过回归准确估计年龄是很有挑战性的。即使是人类也无法通过观察一个人来准确预测年龄。但是我们能够知道他们是20多岁还是30多岁。由于这个原因，把这个问题描述为一个分类问题是明智的，因为我们试图估计这个人所处的年龄组。例如，0-2范围内的年龄是一个类，4-6是另一个类，依此类推。因此数据集分为以下8个年龄组[(0-2)、(4-6)、(8-12)、(15-20)、(25-32)、(38-43)、(48-53)、(60-100)]。因此，年龄预测网络在最后一层有8个节点，表示所述年龄范围。

应该记住，从一幅图像中预测年龄并不是一个很容易解决的问题，因为感知到的年龄取决于许多因素，而同龄的人在世界各地可能看起来很不一样。而且，人们非常努力地隐藏他们的真实年龄！

我们加载年龄网络（caffe模型）并使用前向通道获得输出。由于网络结构类似于性别网络，所以我们可以从所有输出中提取出最大值来得到预测的年龄组

1.4 结果

尽管性别预测网络表现良好，但年龄预测网络仍未达到我们的预期。所以添加人脸对齐算法或者数据样本很多时候，可以通过回归的模型来检测。但是性别人脸检测还是很准确的。

2 代码

在VS2017下运行了C++代码，其中OpenCV版本至少要3.4.5以上。不然模型读取会有问题。三个模型文件太大，见下载链接：

如果没有积分（系统自动设定资源分数）看看参考链接。我搬运过来的，大修改没有。

其中tensorflow和caffe模型都可以用opencv中的readnet函数读取，流程很简单。看看代码就会。

代码提供了C++和Python版本，但是python版本没有运行，原因opencv版本太低，不想升级。代码都有详细的注释。

C++版本：

#include &lt;tuple&gt;
#include &lt;iostream&gt;
#include &lt;opencv2/opencv.hpp&gt;
#include &lt;opencv2/dnn.hpp&gt;
#include &lt;iterator&gt;
using namespace cv;
using namespace cv::dnn;
using namespace std;

/**
 * @brief Get the Face Box object 人脸定位
 *
 * @param net 人脸检测网络
 * @param frame 检测图像
 * @param conf_threshold 阈值
 * @return tuple&lt;Mat, vector&lt;vector&lt;int&gt;&gt;&gt; 元组容器，可返回多个值
 */
tuple&lt;Mat, vector&lt;vector&lt;int&gt;&gt;&gt; getFaceBox(Net net, Mat &amp;frame, double conf_threshold)
{
    //图像复制
    Mat frameOpenCVDNN = frame.clone();
    int frameHeight = frameOpenCVDNN.rows;
    int frameWidth = frameOpenCVDNN.cols;
    //缩放尺寸
    double inScaleFactor = 1.0;
    //检测图大小
    Size size = Size(300, 300);
    // std::vector&lt;int&gt; meanVal = {104, 117, 123};
    Scalar meanVal = Scalar(104, 117, 123);

    cv::Mat inputBlob;
    inputBlob = cv::dnn::blobFromImage(frameOpenCVDNN, inScaleFactor, size, meanVal, true, false);
    net.setInput(inputBlob, "data");
    //四维矩阵输出
    cv::Mat detection = net.forward("detection_out");
    //提取结果信息
    cv::Mat detectionMat(detection.size[2], detection.size[3], CV_32F, detection.ptr&lt;float&gt;());

    vector&lt;vector&lt;int&gt;&gt; bboxes;

    for (int i = 0; i &lt; detectionMat.rows; i++)
    {
        //预测概率
        float confidence = detectionMat.at&lt;float&gt;(i, 2);

        if (confidence &gt; conf_threshold)
        {
            //左上角点，坐标被归一化
            int x1 = static_cast&lt;int&gt;(detectionMat.at&lt;float&gt;(i, 3) * frameWidth);
            int y1 = static_cast&lt;int&gt;(detectionMat.at&lt;float&gt;(i, 4) * frameHeight);
            //右下角角点，坐标被归一化
            int x2 = static_cast&lt;int&gt;(detectionMat.at&lt;float&gt;(i, 5) * frameWidth);
            int y2 = static_cast&lt;int&gt;(detectionMat.at&lt;float&gt;(i, 6) * frameHeight);
            vector&lt;int&gt; box = { x1, y1, x2, y2 };
            //人脸坐标
            bboxes.push_back(box);
            //图像框选
            cv::rectangle(frameOpenCVDNN, cv::Point(x1, y1), cv::Point(x2, y2), cv::Scalar(0, 255, 0), 2, 4);
        }
    }

    return make_tuple(frameOpenCVDNN, bboxes);
}

int main(void)
{
    //人脸模型
    string faceProto = "model/opencv_face_detector.pbtxt";
    string faceModel = "model/opencv_face_detector_uint8.pb";

    //年龄模型
    string ageProto = "model/age_deploy.prototxt";
    string ageModel = "model/age_net.caffemodel";

    //性别模型
    string genderProto = "model/gender_deploy.prototxt";
    string genderModel = "model/gender_net.caffemodel";

    //均值
    Scalar MODEL_MEAN_VALUES = Scalar(78.4263377603, 87.7689143744, 114.895847746);

    //年龄段标签
    vector&lt;string&gt; ageList = { "(0-2)", "(4-6)", "(8-12)", "(15-20)", "(25-32)",
        "(38-43)", "(48-53)", "(60-100)" };

    //性别标签
    vector&lt;string&gt; genderList = { "Male", "Female" };

    //导入网络
    Net ageNet = cv::dnn::readNet(ageProto, ageModel);
    Net genderNet = cv::dnn::readNet(genderProto, genderModel);
    Net faceNet = cv::dnn::readNetFromTensorflow(faceModel, faceProto);

    //打开摄像头
    VideoCapture cap;
    cap.open(0);
    if (cap.isOpened())
    {
        cout &lt;&lt; "camera is opened!" &lt;&lt; endl;
    }
    else
    {
        return 0;
    }

    int padding = 20;
    while (waitKey(1) &lt; 0)
    {
        // read frame 读图
        Mat frame;
        cap.read(frame);
        if (frame.empty())
        {
            waitKey();
            break;
        }
        frame = imread("./images/couple1.jpg");
        //人脸坐标
        vector&lt;vector&lt;int&gt;&gt; bboxes;
        //人脸检测结果图
        Mat frameFace;
        //人脸定位
        //tie()函数解包frameFace和bboxes
        tie(frameFace, bboxes) = getFaceBox(faceNet, frame, 0.7);
        //人脸判断
        if (bboxes.size() == 0)
        {
            cout &lt;&lt; "No face detected, checking next frame." &lt;&lt; endl;
            continue;
        }
        //逐个提取人脸检测
        for (auto it = begin(bboxes); it != end(bboxes); ++it)
        {
            //框选人脸
            Rect rec(it-&gt;at(0) - padding, it-&gt;at(1) - padding, it-&gt;at(2) - it-&gt;at(0) + 2 * padding, it-&gt;at(3) - it-&gt;at(1) + 2 * padding);
            //避免人脸框选超过图像边缘
            rec.width = ((rec.x + rec.width) &gt; frame.cols) ? (frame.cols - rec.x - 1) : rec.width;
            rec.height = ((rec.y + rec.height) &gt; frame.rows) ? (frame.rows - rec.y - 1) : rec.height;

            // take the ROI of box on the frame,原图中提取人脸
            Mat face = frame(rec);

            //性别检测
            Mat blob;
            blob = blobFromImage(face, 1, Size(227, 227), MODEL_MEAN_VALUES, false);
            genderNet.setInput(blob);
            // string gender_preds; 获取前向传播softmax结果
            vector&lt;float&gt; genderPreds = genderNet.forward();
            // find max element index max_element用于找寻最大值
            // distance function does the argmax() work in C++ distance返回最大值和第一个值下标的距离
            int max_index_gender = std::distance(genderPreds.begin(), max_element(genderPreds.begin(), genderPreds.end()));
            //获得检测结果
            string gender = genderList[max_index_gender];
            cout &lt;&lt; "Gender: " &lt;&lt; gender &lt;&lt; endl;

            //年龄识别
            ageNet.setInput(blob);
            vector&lt;float&gt; agePreds = ageNet.forward();
            // finding maximum indicd in the age_preds vector 找到年龄预测最大下表
            int max_indice_age = std::distance(agePreds.begin(), max_element(agePreds.begin(), agePreds.end()));
            string age = ageList[max_indice_age];
            cout &lt;&lt; "Age: " &lt;&lt; age &lt;&lt; endl;

            // label 输出标签
            string label = gender + ", " + age;
            //在人脸定位图上显示结果
            cv::putText(frameFace, label, Point(it-&gt;at(0), it-&gt;at(1) - 15), cv::FONT_HERSHEY_SIMPLEX, 0.9, Scalar(0, 255, 255), 2, cv::LINE_AA);
        }
        //保存结果
        imshow("Frame", frameFace);
        imwrite("out.jpg", frameFace);
    }
}

python版本：

# Import required modules
import cv2 as cv
import time
import argparse

def getFaceBox(net, frame, conf_threshold=0.7):
    frameOpencvDnn = frame.copy()
    frameHeight = frameOpencvDnn.shape[0]
    frameWidth = frameOpencvDnn.shape[1]
    blob = cv.dnn.blobFromImage(frameOpencvDnn, 1.0, (300, 300), [104, 117, 123], True, False)

    net.setInput(blob)
    detections = net.forward()
    bboxes = []
    for i in range(detections.shape[2]):
        confidence = detections[0, 0, i, 2]
        if confidence &gt; conf_threshold:
            x1 = int(detections[0, 0, i, 3] * frameWidth)
            y1 = int(detections[0, 0, i, 4] * frameHeight)
            x2 = int(detections[0, 0, i, 5] * frameWidth)
            y2 = int(detections[0, 0, i, 6] * frameHeight)
            bboxes.append([x1, y1, x2, y2])
            cv.rectangle(frameOpencvDnn, (x1, y1), (x2, y2), (0, 255, 0), int(round(frameHeight/150)), 8)
    return frameOpencvDnn, bboxes

parser = argparse.ArgumentParser(description='Use this script to run age and gender recognition using OpenCV.')
parser.add_argument('--input', help='Path to input image or video file. Skip this argument to capture frames from a camera.')

args = parser.parse_args()

faceProto = "age_gender/model/opencv_face_detector.pbtxt"
faceModel = "age_gender/model/opencv_face_detector_uint8.pb"

ageProto = "age_gender/model/age_deploy.prototxt"
ageModel = "age_gender/model/age_net.caffemodel"

genderProto = "age_gender/model/gender_deploy.prototxt"
genderModel = "age_gender/model/gender_net.caffemodel"

MODEL_MEAN_VALUES = (78.4263377603, 87.7689143744, 114.895847746)
ageList = ['(0-2)', '(4-6)', '(8-12)', '(15-20)', '(25-32)', '(38-43)', '(48-53)', '(60-100)']
genderList = ['Male', 'Female']

# Load network
ageNet = cv.dnn.readNet(ageModel, ageProto)
genderNet = cv.dnn.readNet(genderModel, genderProto)
faceNet = cv.dnn.readNet(faceModel, faceProto)

# Open a video file or an image file or a camera stream
cap = cv.VideoCapture(args.input if args.input else 0)
padding = 20
while cv.waitKey(1) &lt; 0:
    # Read frame
    t = time.time()
    hasFrame, frame = cap.read()
    if not hasFrame:
        cv.waitKey()
        break

    frameFace, bboxes = getFaceBox(faceNet, frame)
    if not bboxes:
        print("No face Detected, Checking next frame")
        continue

    for bbox in bboxes:
        # print(bbox)
        face = frame[max(0,bbox[1]-padding):min(bbox[3]+padding,frame.shape[0]-1),max(0,bbox[0]-padding):min(bbox[2]+padding, frame.shape[1]-1)]

        blob = cv.dnn.blobFromImage(face, 1.0, (227, 227), MODEL_MEAN_VALUES, swapRB=False)
        genderNet.setInput(blob)
        genderPreds = genderNet.forward()
        gender = genderList[genderPreds[0].argmax()]
        # print("Gender Output : {}".format(genderPreds))
        print("Gender : {}, conf = {:.3f}".format(gender, genderPreds[0].max()))

        ageNet.setInput(blob)
        agePreds = ageNet.forward()
        age = ageList[agePreds[0].argmax()]
        print("Age Output : {}".format(agePreds))
        print("Age : {}, conf = {:.3f}".format(age, agePreds[0].max()))

        label = "{},{}".format(gender, age)
        cv.putText(frameFace, label, (bbox[0], bbox[1]-10), cv.FONT_HERSHEY_SIMPLEX, 0.8, (0, 255, 255), 2, cv.LINE_AA)
        cv.imshow("Age Gender Demo", frameFace)
        # cv.imwrite("age-gender-out-{}".format(args.input),frameFace)
    print("time : {:.3f}".format(time.time() - t))

OpenCV 实战 quot amp frame ide 人脸检测 scala深度学习人工智能yyds干货盘点

有关[OpenCV实战]1 基于深度学习识别人脸性别和年龄的更多相关文章

报告回顾丨模型进化狂飙，DetectGPT能否识别最新模型生成结果？ - 2
导读语言模型给我们的生产生活带来了极大便利，但同时不少人也利用他们从事作弊工作。如何规避这些难辨真伪的文字所产生的负面影响也成为一大难题。在3月9日智源Live第33期活动「DetectGPT：判断文本是否为机器生成的工具」中，主讲人Eric为我们讲解了DetectGPT工作背后的思路——一种基于概率曲率检测的用于检测模型生成文本的工具，它可以帮助我们更好地分辨文章的来源和可信度，对保护信息真实、防止欺诈等方面具有重要意义。本次报告主要围绕其功能，实现和效果等展开。（文末点击“阅读原文”，查看活动回放。）Ericmitchell斯坦福大学计算机系四年级博士生，由ChelseaFinn和Chri
叮咚买菜基于 Apache Doris 统一 OLAP 引擎的应用实践 - 2
导读：随着叮咚买菜业务的发展，不同的业务场景对数据分析提出了不同的需求，他们希望引入一款实时OLAP数据库，构建一个灵活的多维实时查询和分析的平台，统一数据的接入和查询方案，解决各业务线对数据高效实时查询和精细化运营的需求。经过调研选型，最终引入ApacheDoris作为最终的OLAP分析引擎，Doris作为核心的OLAP引擎支持复杂地分析操作、提供多维的数据视图，在叮咚买菜数十个业务场景中广泛应用。作者｜叮咚买菜资深数据工程师韩青叮咚买菜创立于2017年5月，是一家专注美好食物的创业公司。叮咚买菜专注吃的事业，为满足更多人“想吃什么”而努力，通过美好食材的供应、美好滋味的开发以及美食品牌的孵
Vscode+Cmake配置并运行opencv环境(Windows和Ubuntu大同小异) - 2
之前在培训新生的时候，windows环境下配置opencv环境一直教的都是网上主流的vsstudio配置属性表，但是这个似乎对新生来说难度略高(虽然个人觉得完全是他们自己的问题)，加之暑假之后对cmake实在是爱不释手，且这样配置确实十分简单(其实都不需要配置)，故斗胆妄言vscode下配置CV之法。其实极为简单，图比较多所以很长。如果你看此文还配不好，你应该思考一下是不是自己的问题。闲话少说，直接开始。0.CMkae简介有的人到大二了都不知道cmake是什么，我不说是谁。CMake是一个开源免费并且跨平台的构建工具，可以用简单的语句来描述所有平台的编译过程。它能够根据当前所在平台输出对应的m
[Vuforia]二.3D物体识别 - 2
之前说过10之后的版本没有3dScan了，所以还是9.8的版本或者之前更早的版本。 3d物体扫描需要先下载扫描的APK进行扫面。首先要在手机上装一个扫描程序，扫描现实中的三维物体，然后上传高通官网，在下载成UnityPackage类型让Unity能够使用这个扫描程序可以从高通官网上进行下载，是一个安卓程序。点到Tools往下滑，找到VuforiaObjectScanner下载后解压数据线连接手机，将apk文件拷入手机安装然后刚才解压文件中的Media文件夹打开，两个PDF图打印第一张A4-ObjectScanningTarget.pdf，主要是用来辅助扫描的。好了，接下来就是扫描三维物体。将瓶
基于C#实现简易绘图工具【100010177】 - 2
C#实现简易绘图工具一.引言实验目的:通过制作窗体应用程序(C#画图软件),熟悉基本的窗体设计过程以及控件设计,事件处理等,熟悉使用C#的winform窗体进行绘图的基本步骤,对于面向对象编程有更加深刻的体会.Tutorial任务设计一个具有基本功能的画图软件**·包括简单的新建文件,保存,重新绘图等功能**·实现一些基本图形的绘制,包括铅笔和基本形状等,学习橡皮工具的创建**·设计一个合理舒适的UI界面**注明:你可能需要先了解一些关于winform窗体应用程序绘图的基本知识,以及关于GDI+类和结构的知识二.实验环境Windows系统下的visualstudio2017C#窗体应用程序三.
LC滤波器设计学习笔记（一）滤波电路入门 - 2
目录前言滤波电路科普主要分类实际情况单位的概念常用评价参数函数型滤波器简单分析滤波电路构成低通滤波器RC低通滤波器RL低通滤波器高通滤波器RC高通滤波器RL高通滤波器部分摘自《LC滤波器设计与制作》，侵权删。前言最近需要学习放大电路和滤波电路，但是由于只在之前做音乐频谱分析仪的时候简单了解过一点点运放，所以也是相当从零开始学习了。滤波电路科普主要分类滤波器：主要是从不同频率的成分中提取出特定频率的信号。有源滤波器：由RC元件与运算放大器组成的滤波器。可滤除某一次或多次谐波，最普通易于采用的无源滤波器结构是将电感与电容串联，可对主要次谐波（3、5、7）构成低阻抗旁路。无源滤波器：无源滤波器，又称
CAN协议的学习与理解 - 2
最近在学习CAN，记录一下，也供大家参考交流。推荐几个我觉得很好的CAN学习，本文也是在看了他们的好文之后做的笔记首先是瑞萨的CAN入门，真的通透；秀！靠这篇我竟然2天理解了CAN协议！实战STM32F4CAN！原文链接：https://blog.csdn.net/XiaoXiaoPengBo/article/details/116206252CAN详解（小白教程）原文链接：https://blog.csdn.net/xwwwj/article/details/105372234一篇易懂的CAN通讯协议指南1一篇易懂的CAN通讯协议指南1-知乎(zhihu.com)视频推荐CAN总线个人知识总
ruby-on-rails - 在 heroku 的 .fonts 文件夹中包含自定义字体，似乎无法识别它们 - 2
Heroku支持人员告诉我，为了在我的Web应用程序中使用自定义字体(未安装在系统中，您可以在bash控制台中使用fc-list查看已安装的字体)我必须部署一个包含所有字体的.fonts文件夹里面的字体。问题是我不知道该怎么做。我的意思是，我不知道文件名是否必须遵循heroku的任何特殊模式，或者我必须在我的代码中做一些事情来考虑这种字体，或者如果我将它包含在文件夹中它是自动的......事实是，我尝试以不同的方式更改字体的文件名，但根本没有使用该字体。为了提供更多详细信息，我们使用字体的过程是将PDF转换为图像，更具体地说，使用rghostgem。并且最终图像根本不使用自定义字体。在
深度学习部署：Windows安装pycocotools报错解决方法 - 2
深度学习部署：Windows安装pycocotools报错解决方法1.pycocotools库的简介2.pycocotools安装的坑3.解决办法更多Ai资讯：公主号AiCharm本系列是作者在跑一些深度学习实例时，遇到的各种各样的问题及解决办法，希望能够帮助到大家。ERROR:Commanderroredoutwithexitstatus1:'D:\Anaconda3\python.exe'-u-c'importsys,setuptools,tokenize;sys.argv[0]='"'"'C:\\Users\\46653\\AppData\\Local\\Temp\\pip-instal
微信小程序开发入门与实战（Behaviors使用） - 2
@作者:SYFStrive @博客首页:HomePage📜：微信小程序📌：个人社区（欢迎大佬们加入）👉：社区链接🔗📌：觉得文章不错可以点点关注👉：专栏连接🔗💃：感谢支持,学累了可以先看小段由小胖给大家带来的街舞👉微信小程序（🔥）目录自定义组件-behaviors 1、什么是behaviors 2、behaviors的工作方式 3、创建behavior 4、导入并使用behavior 5、behavior中所有可用的节点 6、同名字段的覆盖和组合规则总结最后自定义组件-behaviors 1、什么是behaviorsbehaviors是小程序中，用于实现