人脸识别是否是人工智能的第一个“杀手级应用程序”?
每一种转变思维方式的技术都需求杀手级的应用程序。对于人工智能,第一个这样的应用程序可能就是人脸识别。
正如我们今天在许多机场所看到的,安全和门禁控制是基于深度学习的人脸识别功能的主要应用。但是,更高级的用例已经浮出水面。例如,Spod 是一款购物助理机器人原型,它通过人脸识别功能来识别客户的年龄和性别,从而给出产品建议。
更复杂的是具备人工智能的机器人,像剑桥大学的智能机器人原型,“Charles”。这款机器人由学生设计,在下面的视频 Meeting an Emotional Robot(与有情感的机器人会面)中您可以看到,“他”能够读懂人类的面部表情。
“Charles” 只是能够感知人类情感和情绪的众多机器人原型之一,这样的设计使很多应用成为可能,其中包括个人陪伴、健康诊断、紧急干预等。但是,要在这些任务中做到有效和可信,智能机器人需要自然的人类响应速度。
只有直接在边缘位置执行人工智能技术,才能实现这样的实时反应。在华盛顿大学举行的人脸识别算法竞赛 MegaFace 挑战赛中,Cyberlink 公司展示了在上述领域的强大领导力。
适用于边缘位置的高性能人脸识别
MegaFace 挑战赛是一系列基准测试,邀请人脸识别开发人员来测试他们的算法在处理大型训练数据集时的表现。
组织方将名人和年龄差异极大者的图片混在 10 到 1,000,000 张“干扰图片”中,后者是其他人脸图片,甚至还有一些被人工智能训练集错误识别为人脸的照片。
竞争相当激烈,在处理较小的数据集时,谷歌、腾讯和其他一些公司的算法实现了 90% 以上的高识别准确率。但随着干扰图片的增加,它们的表现越来越糟糕(如图 1 所示)。
CyberLink 的 FaceMe 人工智能人脸识别引擎基于 SphereFace 算法,在性能方面优于 Google FaceNet v8 和 SIATMMLAB TencentVision。完全在边缘运行的情况下,其准确率超过了 98.4%。
FaceMe 是一个跨平台的软件开发套件 (SDK),专为人脸识别工程师而设计,能够分析年龄、性别和情感等属性。它的神经网络已利用大型图像数据库进行预训练,并与 TensorFlow 和 Core ML 等框架兼容,因此开发人员可以集成自己的训练数据。
经过训练后的推理引擎与预处理算法相结合,后者会将其压缩到小至 4 MB。这些算法还使 SDK 能与边缘系统(从移动设备到基于 Linux 的数字标牌解决方案,再到 Windows PC)兼容。这种级别的硬件和软件兼容性意味着 FaceMe 适用于智慧城市监控、智能零售营销和个性化智能家用机器人等用例(图 2)。
“现在,大多数的人脸识别解决方案,比如来自 AWS、谷歌和微软的,都在云端运行,” CyberLink 营销总监 Steven Lien 说道,“基于云的人脸识别在某些情况下并不理想,例如门禁系统。当您走到系统前面后,要等上 20 到 30 秒钟,才能让图像或视频上传至云端,并在本地设备上收到回应。”
“FaceMe 已针对边缘设备进行优化。它可以在个人电脑、移动设备(如 Windows、iOS 或 Android 手机)等设备上运行。它还针对不同的硬件进行了优化,如 CPU 和 GPU,” Lien 继续说道。“针对不同的部署,您可以在 FaceMe 环境中调整很多不同的参数,如人脸捕捉的大小(以像素为单位)、帧率和容错率。”
正如 Lien 所指出的,一些人脸识别系统需要更短的响应时间、更高的精度,或者能够同时捕捉更多或更少人脸图像的能力。FaceMe 允许开发人员调整他们的算法,来使用更少的计算能力(在移动应用的情况下),降低延迟(智能门锁)或一次性捕捉很多图像(智慧城市监控)。
在更多的平台上实现更快的识别
为了让推理引擎能与不同的边缘处理器和操作系统兼容,FaceMe SDK 依赖于支持英特尔® Distribution of OpenVINO™ 工具套件等技术(图 3)。OpenVINO 工具套件是一款开发工具,可优化计算机视觉推理算法,用于 CPU、GPU、FPGA 和机器学习加速器(如英特尔® Movidius™ 视觉处理单元 (VPU))。
“市场上有很多用于神经网络处理的不同工具,而且目前还有许多不同的推理引擎,因此 FaceMe 提供它们之间的转换器,” Lien 表示,“由于有如此多的不同组件,英特尔 OpenVINO 工具套件是一个很好的平台,来将它们聚合成一个完整的 SDK。”
当为基于 FaceMe 的算法启用 OpenVINO 工具套件后,人脸识别可以加速达 500%。同时,FaceMe 能保持其准确性,性别检测准确率达 98%,情绪检测高达 86%,而在分析年龄时平均误差为 5.8 岁。
人工智能的杀手级应用程序即将出现
跨这么多不同平台扩展性能和功能利用率的能力意味着人脸识别可能更早得到更大范围的普及。FaceMe SDK 也可轻松移植,因此开发人员可以在开发环境中重复使用应用程序组件来加速部署。
由于能够使用精确度可与技术巨头的相媲美的人脸识别技术,人工智能工程师现在可以直接在边缘位置提供具有商业可行性的人脸识别功能。随着时间的推移,这将实现更精准的零售营销、更好的监控和门禁控制,以及像 “Charles” 这样能与人类进行可信互动的一代机器人。