如何识别多个人脸
在开始之前,先解决一个疑问,这个SDK可以识别多个人脸吗。答案当然是可以的。在上一章节中我们实现了识别单个人脸的功能。
如果要识别多个人脸,需要进行下面的设置。
定义人脸的识别数目范围
int nMaxFaceNum = 50;/*定义人脸识别的数目,有效范围为1-50*/
修改人脸识别的程序。
在上一章节中, 我们的方法是只取到识别到的第一个人脸,因此我们只需要一个显示人脸的地方就可以了。要识别多个人脸,首先就是修改视图。
界面截图
然后,修改程序为循环。
//识别每一幅图像for (int i = 0; i < faceRes.nFace; i++) { MRECT rect = (MRECT)Marshal.PtrToStructure(faceRes.rcFace + Marshal.SizeOf(typeof(MRECT)) * i, typeof(MRECT)); Image image = CutFace(bitmap, rect.left, rect.top, rect.right - rect.left, rect.bottom - rect.top); if (i == 0) { /*第一个识别到的人脸保存在原位置*/ this.pictureBox2.Image = image; this.pictureBox2.Tag = faceImageName[i]; } else { /*后面识别到的人脸按顺序并排显示在下面,使用临时创建PictureBox控件的方式显示图片内容*/ PictureBox tempPicture = new PictureBox(); tempPicture.Width = 100; tempPicture.Height = 120; tempPicture.SizeMode = PictureBoxSizeMode.Zoom; tempPicture.Location = new System.Drawing.Point(10 + ((i-1) % 7) * 120, 10 + ((i-1) / 7) * 120); tempPicture.Image = image; tempPicture.Tag =faceImageName[i]; this.panel1.Controls.Add(tempPicture); }
一步步实现人脸识别
先来看一下我们这节的效果
效果图
本节我们主要讲解如何根据识别到的人脸信息提取人脸数据特征,并在此基础上讲解一下如何做人脸识别
在人脸识别领域,首先是检测是否有人脸,人脸的区域是哪里,然后对这个区域进行特征点提取,在提取结束后,告诉计算机,这个人脸是谁。
image
计算机把这些特征信息和人脸的名称保存下来,就形成了人脸库,在识别人脸时,计算机通过一定的算法,检索库中是否有匹配到的人脸结果,给出相似度数据。当人脸的相似度数据达到一定的数值时,就可以认为同一张人脸。
相似度通常是一个0-1的小数。一般来说,数值越大,表示两个人越相近。
注:不同人脸引擎的人脸相似度不具有可比性,例如,我们从Face ++ 拿到的同一个人的人脸相似度可能会在0.8-0.9,虹软的只能在0.6-0.8之间,这并不能说明Face ++ ,它们只是算法的标准不同,例如,虹软在不同人脸0.1-0.2的时候,Face++达到了0.3-0.5
人脸检测并建立人脸库的过程如下
建立人脸库
通过人脸检测或者人脸跟踪,获取到人脸信息并识别人脸的过程如下:
从人脸库中识别
本次教程我们以目录结构作为人脸的存档方式,每张人脸对应一张人脸标识和一个人脸特征。人脸标识和特征使用同一个文件名称来关联,例如人脸a.jpg的特征用a.dat来表示。
好,我们开始我们的课程
集成人脸识别SDK库
我们本次使用到的虹软的SDK包中,提供了人脸识别的库,它的名字叫face_recongnition.dll,我们找到它的SDK文档。
来建立各个结构体和API的C#映射。
首先是结构体
从本节开始,我们不再讲解原始SDK文档中的数据结构和C#数组结构如何映射的,也不再讲解P/Invoke的知识,如果需要了解相关知识,请参考我们上篇文档的相关内容。
AFR_FSDK_FaceInput
public struct AFR_FSDK_FaceInput { public MRECT rcFace; public int lOrient; }
这个结构体是FD识别的输出结构体,我们在上一章节标记人脸时使用了此结构体。
AFR_FSDK_FaceModel
public struct AFR_FSDK_FaceModel { public IntPtr pbFeature; public int lFeatureSize; }
这个结构体是人脸模型数据,也就是我们说的人脸特征。人脸识别就基于这个结构。
参数名 | 说明 |
---|---|
pbFeature | 提取到的脸部特征 |
lFeatureSize | 特征信息长度 |
其中pbFeature是人脸数据,虹软当前版本的人脸数据为一个20K大小的二进制数组,在使用时,我们把它保存为byte[]数组。
AFR_FSDK_Version
public struct AFR_FSDK_Version { public int lCodebase; public int lMajor; public int lMinor; public int lBuild; public int lFeatureLevel; public string Version; public string BuildDate; public string CopyRight; }
定义识别方法类
我们将SDK中的对应方法提取到C#类中,和上面的章节保持一致,我们称之为AFRFunction。
public class AFRFunction { /** *Init Engine */ [System.Runtime.InteropServices.DllImportAttribute("libarcsoft_fsdk_face_recognition.dll", EntryPoint = "AFR_FSDK_InitialEngine", CallingConvention = CallingConvention.Cdecl)] public static extern int AFR_FSDK_InitialEngine(string AppId, string SDKKey, System.IntPtr pMem, int lMemSize, ref System.IntPtr phEngine); /** * 提取人脸特征值 */ [System.Runtime.InteropServices.DllImportAttribute("libarcsoft_fsdk_face_recognition.dll", EntryPoint = "AFR_FSDK_ExtractFRFeature", CallingConvention = CallingConvention.Cdecl)] public static extern int AFR_FSDK_ExtractFRFeature(System.IntPtr hEngine, System.IntPtr pInputImage, System.IntPtr pFaceRes, System.IntPtr pFaceModels); /* * 比较两个人脸特征值之间的相似度 **/ [System.Runtime.InteropServices.DllImportAttribute("libarcsoft_fsdk_face_recognition.dll", EntryPoint = "AFR_FSDK_FacePairMatching", CallingConvention = CallingConvention.Cdecl)] public static extern int AFR_FSDK_FacePairMatching(System.IntPtr hEngine, ref System.IntPtr reffeature, ref System.IntPtr probefeature, ref float pfSimilScore); /** *销毁引擎 */ [System.Runtime.InteropServices.DllImportAttribute("libarcsoft_fsdk_face_recognition.dll", EntryPoint = "AFR_FSDK_UninitialEngine", CallingConvention = CallingConvention.Cdecl)] public static extern int AFR_FSDK_UninitialEngine(System.IntPtr hEngine); /** *获取人脸的版本号 */ [System.Runtime.InteropServices.DllImportAttribute("libarcsoft_fsdk_face_recognition.dll", EntryPoint = "AFR_FSDK_GetVersion", CallingConvention = CallingConvention.Cdecl)] public static extern System.IntPtr AFR_FSDK_GetVersion(System.IntPtr hEngine); }
开始之前的准备
定义人脸库的位置
本次我们使用简单的基于目录存储人脸库
private String FaceLibraryPath = "G:\\Test\\";
定义人脸识别引擎的变量
IntPtr detectEngine = IntPtr.Zero;//新增人脸识别引擎的定义IntPtr recognizeEngine = IntPtr.Zero;
在构造函数中我们对人脸识别引擎进行初始化
int detectSize = 40 * 1024 * 1024;int nScale = 50;int nMaxFaceNum = 50; IntPtr pMem = Marshal.AllocHGlobal(detectSize); IntPtr pMemRecongnize = Marshal.AllocHGlobal(detectSize);
注意:detectSize为人脸识别的内存大小,一般来说,你可以根据你的应用程序的规模来设置一个适当的数值,数值过小会报内存不足的ERROR。
int retCode2 = AFR.AFRFunction.AFR_FSDK_InitialEngine(appId, sdkFRKey, pMemRecongnize, detectSize, ref recognizeEngine); if (retCode2 != 0) { MessageBox.Show("引擎FR初始化失败:错误码为:" + retCode2); this.Close(); }
这里需要注意FR Key,虹软这次开源了1:1和1:N的SDK,不同的SDK,其对应的KEY是不一样的。
提取人脸特征值
我们来提取人脸特征值。打开我们的checkAndMarkFace方法。
人脸特征值是一个二进制的byte数组,其内容对虹软来说是属于技术机密,里面保存了人脸的特征。这里的特征可以在人脸相似度比较时用到,人脸的特征包含了人脸的关键点信息。可惜的是,虹软这方面并没有开源。同样的,人脸的相似度比较算法也没有开源。不过不开源也有不开源的好处,至少我们用起来不用担心这里面的细节。
首先,我们定义一个变量数组,用于保存图片名称的数组。 这里我们简单的对每个识别到的人脸,用GUID命名。
在我们上一节的,输出识别到的人脸数据之前,我们增加一下我们的业务逻辑。找到下面的代码
if (faceRes.nFace > 0)
我们在后面增加定义
//定义用到保存识别到的图片的名称的数组List<string> faceImageName = new List<string>(faceRes.nFace);for (int i = 0; i < faceRes.nFace; i++) { faceImageName.Add(Guid.NewGuid().ToString()); }
在识别到的每个人脸以后,我们把识别到的人脸保存下来
Image image = CutFace(bitmap, rect.left, rect.top, rect.right - rect.left, rect.bottom - rect.top); image.Save(FaceLibraryPath+faceImageName[i]+".jpg",ImageFormat.Jpeg);
如何进行人脸特征值的读取
人脸特征值依赖于人脸识别的结果,其原理是利用识别到的人脸区域信息,在原图中对人脸部分进行运算,输出人脸的特征数据。
通过前面的定义,可以知道人脸特征提取函数的需要的参数信息如下
recognizeEngine:人脸识别引擎
offInputPtr:输入的图像信息,和FD的信息相同。同为ASVLOFFSCREEN结构体,我们可以直接使用上一步已经定义好的这个变量。
faceInputPtr:人脸区域信息,包括人脸的角度信息,以及人脸的坐标范围,对应的参数类型为MRECT,也就是在FD中识别到的人脸的区域坐标,
输出参数为faceModel结构体。包括长度信息和人脸特征数组
我们来一步步解决。
定义faceInput结构体并指定它的引用互操作类型
AFR_FSDK_FaceInput faceinput = new AFR_FSDK_FaceInput(); faceinput.lOrient =(int)Marshal.PtrToStructure( faceRes.lfaceOrient,typeof(int)); MRECT rect = (MRECT)Marshal.PtrToStructure(faceRes.rcFace + Marshal.SizeOf(typeof(MRECT)) * i, typeof(MRECT)); faceinput.rcFace = rect; IntPtr faceInputPtr = Marshal.AllocHGlobal(Marshal.SizeOf(faceinput)); Marshal.StructureToPtr(faceinput, faceInputPtr, false);
定义faceModel变量用于保存识别到的特征值信息
AFR_FSDK_FaceModel faceModel = new AFR_FSDK_FaceModel(); IntPtr faceModelPtr = Marshal.AllocHGlobal(Marshal.SizeOf(faceModel));
调用FR引擎进行特征信息提取
int ret = AFRFunction.AFR_FSDK_ExtractFRFeature(recognizeEngine, offInputPtr, faceInputPtr, faceModelPtr);
如果ret=0,则提取成功,我们再调用Marshal的方法将对应的信息取出来
faceModel = (AFR_FSDK_FaceModel) Marshal.PtrToStructure(faceModelPtr, typeof (AFR_FSDK_FaceModel)); Marshal.FreeHGlobal(faceModelPtr);byte[] featureContent = new byte[faceModel.lFeatureSize]; Marshal.Copy(faceModel.pbFeature, featureContent, 0, faceModel.lFeatureSize);
保存获取到的结果,为了后面的匹配方便,和图片命名保持一致
System.IO.File.WriteAllBytes(FaceLibraryPath+faceImageName[i]+".dat",featureContent);
通过图像库识别图像中的特征
现在我们要做的是人脸识别功能呢,我们想要的功能是,打开一张照片,如果里面有人脸,那么我们就识别这个人脸是否已经在我们的人脸库中出现过,如果已经出现 ,就显示人脸的图像编号。
依然打开项目,增加一个按钮。识别人脸,并增加一个pictureBox用于保存匹配到的人脸的对应的人脸信息。双击刚才新加的按钮进入事件处理代码编辑窗口。
为了不增加重新提取特征脸的工作量,我们将上一步获取到的特征脸重用。在上一步中,对识别到的人脸的第一个保存在了pictureBox中,并把相关的特征信息保存在对应命名的dat文件中。在保存时,使用
this.pictureBox2.Tag = faceImageName[i];
保存图像特征数据的文件名,因此在这里我们使用
string faceFeaturePath = pictureBox2.Tag as string;
获取图像文件名。
这里我们需要读文件,读取这个特征信息。
C# 读取二进制文件和写二进制文件都相当的方便,你可以使用C#的序列化操作把变量保为dat文件,然后使用反操作把文件重新读取以初始化对象。这里使用的是简单的二进制读取的方法,当然你也可以尝试序列化来完成这个操作。
byte[] sourceFeature = System.IO.File.ReadAllBytes(FaceLibraryPath + faceFeaturePath + ".dat");
接下来我们要使用人脸匹配的方法来进行匹配。这里使用的方法是AFR_FSDK_FacePairMatching
方法。再来看一下这个方法的定义
参数名称 | 输入输出 | 说明 |
---|---|---|
hEngine | [in] | 引擎 handle |
reffeature | [in] | 已有脸部特征信息 |
probefeature | [in] | 被比较的脸部特征信息 |
pfSimilScore | [out] | 相似程度数值 |
我们先来定义被比较的脸部信息。这里原来的参数名称有点拗口,我们使用localFaceModel来定义本地的
AFR_FSDK_FaceModel localFaceModels = new AFR_FSDK_FaceModel(); IntPtr sourceFeaturePtr = Marshal.AllocHGlobal(sourceFeature.Length); Marshal.Copy(sourceFeature, 0, sourceFeaturePtr, sourceFeature.Length); localFaceModels.lFeatureSize = sourceFeature.Length; localFaceModels.pbFeature = sourceFeaturePtr;
由于使用了文件保存人脸特征信息,因此我们的人脸遍历算法就变得很简单了。我们这里使用1:1的方法。
我们直接使用存储的人脸信息来进行搜索,方法自然是先遍历读取所有特征数据,提取特征值并进行比较
foreach (var b in System.IO.Directory.GetFiles(FaceLibraryPath,"*.dat")) { byte[] libaryFeature = System.IO.File.ReadAllBytes(b); float result=0f; //TODO:构造AFR_FSDK_FaceModel,调用API,获取比较结果 if (result>0.7&&result<0.99) { // MessageBox.Show(b); Image image = Image.FromFile(b.Replace(".dat",".jpg")); this.pictureBox3.Image = new Bitmap(image); MessageBox.Show(result.ToString()); break; } }
我们来完成TODO的部分
首先我们定义库Model和本地Model的结构体指针
定义库的指针
IntPtr libaryFeaturePtr = Marshal.AllocHGlobal(libaryFeature.Length); Marshal.Copy(libaryFeature, 0, libaryFeaturePtr, libaryFeature.Length); AFR_FSDK_FaceModel libraryFaceModel = new AFR_FSDK_FaceModel(); libraryFaceModel.lFeatureSize = libaryFeature.Length; libraryFaceModel.pbFeature = libaryFeaturePtr; IntPtr firstPtr = Marshal.AllocHGlobal(Marshal.SizeOf(localFaceModels)); Marshal.StructureToPtr(localFaceModels, firstPtr, false);
定义本地Model的指针
IntPtr firstPtr = Marshal.AllocHGlobal(Marshal.SizeOf(localFaceModels)); Marshal.StructureToPtr(localFaceModels, firstPtr, false);
调用方法输出匹配结果
int ret = AFRFunction.AFR_FSDK_FacePairMatching(recognizeEngine, firstPtr, secondPtr, ref result);
从这里可以看出,人脸识别并没有特别高深的地方,其基础理论依然是特征值匹配搜索的理论,
虽然这里面的难点是特征值的提取和匹配算法,但因为虹软已经免费给我们提供了对应的SDK,我们只需要调用相关的接口就可能了。如果要提高人脸匹配的速度,除了可以联系虹软寻找技术支持以外,也可以利用我们在其它算法方面的积累来尝试解决方案。
作者:随风而逝的心情
链接:https://www.jianshu.com/p/ee88d4ff6082
共同学习,写下你的评论
评论加载中...
作者其他优质文章