人脸识别是否是人工智能的第一个“杀手级应用程序”?

June 24, 2019 Brandon Lewis

ai人工智能面部识别

每一种转变思维方式的技术都需求杀手级的应用程序。对于人工智能,第一个这样的应用程序可能就是人脸识别。

正如我们今天在许多机场所看到的,安全和门禁控制是基于深度学习的人脸识别功能的主要应用。但是,更高级的用例已经浮出水面。例如,Spod 是一款购物助理机器人原型,它通过人脸识别功能来识别客户的年龄和性别,从而给出产品建议。

更复杂的是具备人工智能的机器人,像剑桥大学的智能机器人原型,“Charles”。这款机器人由学生设计,在下面的视频 Meeting an Emotional Robot(与有情感的机器人会面)中您可以看到,“他”能够读懂人类的面部表情。

 

“Charles” 只是能够感知人类情感和情绪的众多机器人原型之一,这样的设计使很多应用成为可能,其中包括个人陪伴、健康诊断、紧急干预等。但是,要在这些任务中做到有效和可信,智能机器人需要自然的人类响应速度。

只有直接在边缘位置执行人工智能技术,才能实现这样的实时反应。在华盛顿大学举行的人脸识别算法竞赛 MegaFace 挑战赛中,Cyberlink 公司展示了在上述领域的强大领导力。

适用于边缘位置的高性能人脸识别

MegaFace 挑战赛是一系列基准测试,邀请人脸识别开发人员来测试他们的算法在处理大型训练数据集时的表现。

组织方将名人和年龄差异极大者的图片混在 10 到 1,000,000 张“干扰图片”中,后者是其他人脸图片,甚至还有一些被人工智能训练集错误识别为人脸的照片。

竞争相当激烈,在处理较小的数据集时,谷歌、腾讯和其他一些公司的算法实现了 90% 以上的高识别准确率。但随着干扰图片的增加,它们的表现越来越糟糕(如图 1 所示)。

MegaFace 挑战赛基准测试
图 1. MegaFace 挑战赛基准测试测量人脸识别算法在处理大型数据集时的准确率。(来源: 华盛顿大学

CyberLink 的 FaceMe 人工智能人脸识别引擎基于 SphereFace 算法,在性能方面优于 Google FaceNet v8 和 SIATMMLAB TencentVision。完全在边缘运行的情况下,其准确率超过了 98.4%。

FaceMe 是一个跨平台的软件开发套件 (SDK),专为人脸识别工程师而设计,能够分析年龄、性别和情感等属性。它的神经网络已利用大型图像数据库进行预训练,并与 TensorFlow 和 Core ML 等框架兼容,因此开发人员可以集成自己的训练数据。

经过训练后的推理引擎与预处理算法相结合,后者会将其压缩到小至 4 MB。这些算法还使 SDK 能与边缘系统(从移动设备到基于 Linux 的数字标牌解决方案,再到 Windows PC)兼容。这种级别的硬件和软件兼容性意味着 FaceMe 适用于智慧城市监控、智能零售营销和个性化智能家用机器人等用例(图 2)。

CyberLink 的 FaceMe 人脸识别引擎
图 2。开发人员可以利用 CyberLink 的 FaceMe 人脸识别引擎来感知年龄、性别和情感。(来源:CyberLink

“现在,大多数的人脸识别解决方案,比如来自 AWS、谷歌和微软的,都在云端运行,” CyberLink 营销总监 Steven Lien 说道,“基于云的人脸识别在某些情况下并不理想,例如门禁系统。当您走到系统前面后,要等上 20 到 30 秒钟,才能让图像或视频上传至云端,并在本地设备上收到回应。”

“FaceMe 已针对边缘设备进行优化。它可以在个人电脑、移动设备(如 Windows、iOS 或 Android 手机)等设备上运行。它还针对不同的硬件进行了优化,如 CPU 和 GPU,” Lien 继续说道。“针对不同的部署,您可以在 FaceMe 环境中调整很多不同的参数,如人脸捕捉的大小(以像素为单位)、帧率和容错率。”

正如 Lien 所指出的,一些人脸识别系统需要更短的响应时间、更高的精度,或者能够同时捕捉更多或更少人脸图像的能力。FaceMe 允许开发人员调整他们的算法,来使用更少的计算能力(在移动应用的情况下),降低延迟(智能门锁)或一次性捕捉很多图像(智慧城市监控)。

在更多的平台上实现更快的识别

为了让推理引擎能与不同的边缘处理器和操作系统兼容,FaceMe SDK 依赖于支持英特尔® Distribution of OpenVINO 工具套件等技术(图 3)。OpenVINO 工具套件是一款开发工具,可优化计算机视觉推理算法,用于 CPU、GPU、FPGA 和机器学习加速器(如英特尔® Movidius 视觉处理单元 (VPU))。

英特尔 OpenVINO 工具套件可帮助优化 FaceMe 人脸识别引擎
图 3. 英特尔® OpenVINO 工具套件可帮助针对各种神经网络处理器和加速器优化 FaceMe 人脸识别引擎。(来源:英特尔® 公司

“市场上有很多用于神经网络处理的不同工具,而且目前还有许多不同的推理引擎,因此 FaceMe 提供它们之间的转换器,” Lien 表示,“由于有如此多的不同组件,英特尔 OpenVINO 工具套件是一个很好的平台,来将它们聚合成一个完整的 SDK。”

当为基于 FaceMe 的算法启用 OpenVINO 工具套件后,人脸识别可以加速达 500%。同时,FaceMe 能保持其准确性,性别检测准确率达 98%,情绪检测高达 86%,而在分析年龄时平均误差为 5.8 岁。

人工智能的杀手级应用程序即将出现

跨这么多不同平台扩展性能和功能利用率的能力意味着人脸识别可能更早得到更大范围的普及。FaceMe SDK 也可轻松移植,因此开发人员可以在开发环境中重复使用应用程序组件来加速部署。

由于能够使用精确度可与技术巨头的相媲美的人脸识别技术,人工智能工程师现在可以直接在边缘位置提供具有商业可行性的人脸识别功能。随着时间的推移,这将实现更精准的零售营销、更好的监控和门禁控制,以及像 “Charles” 这样能与人类进行可信互动的一代机器人。

作者简介

Brandon Lewis

Brandon is responsible for Embedded Computing Design’s IoT Design, Automotive Embedded Systems, Security by Design, and Industrial Embedded Systems brands, where he drives content strategy, positioning, and community engagement. He is also Embedded Computing Design’s IoT Insider columnist, and enjoys covering topics that range from development kits and tools to cyber security and technology business models. Brandon received a BA in English Literature from Arizona State University, where he graduated cum laude.

在Twitter上关注 Follow on Linkedin Brandon Lewis 的更多内容
上个文章
准确的人数统计可实现能源节约
准确的人数统计可实现能源节约

实时人数计数和分析使建筑物自动化系统更加智能化,从而降低能耗和成本。

下个文章
为什么英特尔® 至强® 处理器转向人工智能
为什么英特尔® 至强® 处理器转向人工智能

第二代智能英特尔® 至强可扩展处理器家族具有全新的人工智能和深度学习功能,可将推理工作负载的性能提升至最高 11 倍。

×

名字
Company Name
Phone Number
Country/Region
我希望這篇公司聯絡我: -可选
!
谢谢!
Error - something went wrong!
×

随时关注最新物联网新闻。

Country/Region
Subscribe To Intel Updates
Subscribe To Alliance Partner Updates
提交本网站上的表单,即表示你确认你是一个年满18周岁的成人,且你同意受Intel(英特尔)和 Intel® 物联网解决方案联盟成员通过与营销相关的电子邮件或电话与您联络。你可以随时取消订阅。英特尔的网站和通信受制于我们的隐私政策和使用条款
认购。
Error - something went wrong!