Skip to main content

在现实世界中构建人工智能视觉系统

人工智能技术, 机器视觉, 边缘计算

2019 年的一项 IDC 调查发现,25% 部署人工智能的组织存在 50% 的故障率。造成该结果的因素有好几个,但共同点是在收集、集成和管理用于训练人工智能模型的数据方面存在不足。

即难以开发和维护某些模型,这些模型基于精确代表现实世界状况的数据。

“当你身处实验室中,你使用的是固定数据集,但它们无法代表实际部署的复杂性,” Deepomatic 的联合创始人兼首席技术官 Vincent Delaitrent 解释道。“和现实世界的复杂性数据相比,实验室中的数据集极为有限。”

Delaitre 引用了与 Compass Group 的一次合作来说明这一点,后者是全球最大的餐饮服务公司之一,为众多大型企业提供餐饮服务。为了加快午餐时段的付款过程(使用人工销售点系统的耗时高于 5 分钟),Compass Group 希望寻找一款自动化结账系统,利用基于人工智能的对象识别功能,瞬间识别顾客并完成扣款。

当然,这需要系统内运行的神经网络能够识别15,000 多种菜品,这些菜品以不同方式料理、用各式餐具盛放,并在各种照明条件下扫描。更具挑战性的是,因季节性供应以及菜单变更等因素,菜品经常更换。

不幸的是,在实验室中开发和测试人工智能系统所使用的固定数据集无法包含多种此类变量。事实上,它们中的大多数无法在实验室环境中测试,或者被开发人员排除在测试案例外,因为对于现实世界部署而言,这样的案例或事件简直是数不胜数。

如果无法持续应对变化的数据,那么 Compass Group 所设想的自动化结账系统将产生相当高的错误率,使其实际效率低于传统的人工方式。

“A” 代表人工智能 (AI)。同时也代表“敏捷” (Agile)。

基于人工智能的系统适应陌生环境的一个主要障碍是传统的软件开发。人工智能系统需要一种高度灵活、敏捷的开发方法,容许开发人员快速识别意外情况,并对其训练数据集进行适当调整。

矛盾的是,要遇到这些意外情况意味着必须在现场部署系统,这样他们才能将出乎预料的数据记录下来,以便纳入未来更综合、更智能的模型中。

为了帮 Compass Group 启动这一以数据为中心的反馈回路,Deepomatic 基于自己的 Deepomatic Studio 和 Deepomatic Run 解决方案,协助部署了一套基于边缘的人工智能系统 。

Deepomatic Studio 是一种混合的人工智能开发和数据管理平台,允许非技术人员在其自动可扩展的基础架构基础之上训练、测试和视觉化专有算法性能(图 1)。这些算法随后通过 Deepomatic Run(一种基于 Docker 的边缘环境,可使用本地 API 在边缘设备上根据程序执行推断算法)被部署到现实世界的生产环境中。

图 1.Deepomatic Studio 是一种人工智能开发环境,允许非技术人员设计复杂的人工智能推断算法。(资料来源:Deepomatic)
图 1. Deepomatic Studio 是一种人工智能开发环境,允许非技术人员设计复杂的人工智能推断算法。(资料来源:Deepomatic

在 Compass Group 自动结账系统的案例中,由 Deepomatic 生态系统工具开发的算法被部署到来自 AAEON Technology Inc. 公司的 UP Xtreme 主板上。UP Xtreme 是一款经济高效的单主板计算机,搭载第八代智能英特尔® 酷睿 和英特尔® 赛扬® 处理器,支持高达 6 个具有英特尔® Movidius 视觉处理器的模块,以执行基于计算机视觉的对象识别和检测要求苛刻的边缘推理任务( 2)。

图 2.AAEON UP Xtreme 配备了英特尔® 酷睿™ 或英特尔® 赛扬® 处理器,并支持多达 6 个英特尔® Movidius™ 视觉处理器。(资料来源:研扬)
图 2. AAEON UP Xtreme 配备了英特尔® 酷睿 或英特尔® 赛扬® 处理器,并支持多达 6 个英特尔® Movidius 视觉处理器。(资料来源:AAEON

但是在 Deepomatic 环境中开发的算法本质上并未专为 UP Xtreme 目标进行优化,这可能会给 Compass Group 等终端用户带来执行时间长、精度低和功耗高等负面影响。为了避免这些缺陷,Deepomatic 平台利用英特尔® OpenVINO 工具套件,这种跨平台命令行工具可从各种开发框架中导入模型,并实现英特尔® 硬件的理想性能(图 3)。

图 3.英特尔® OpenVINO 工具套件是一款用于准备来自各开发平台的模型,使之适用于边缘应用程序执行的优化平台。(来源:英特尔®)
图 3. 英特尔® OpenVINO 工具套件是一款用于准备来自各开发平台的模型,使之适用于边缘应用程序执行的优化平台。(资料来源:英特尔®

OpenVINO 工具套件包含在 Deepomatic 软件开发套件 (SDK) 内。组合使用,该解决方案堆栈可不断改进边缘人工智能系统所需的双向数据流。

“该 SDK 将自动连接、下载您边缘设备上的应用程序,并开始推断和处理所有信息,” Delaitre 表示。“它会将数据发送回 Deepomatic Studio 平台,帮助您迭代和训练您系统的新版本,并不断循环改进。”

对计算机视觉系统进行持续改进

采用这样的方法论和基础架构,Compass Group 得以训练包含超过 100 万个图像的数据集,以识别 1 万多件不同的物品。现在,该算法已部署在多个 Compass Group 地点的自动结账系统上,将每客等待时间降低至不到 10 秒,并取得高达 92% 的顾客满意度评分。

尽管取得了这样的成绩,Delaitre 紧接着提醒道,这种程度的精准和表现是通过多重部署历经多年才得以实现的。他指出,在新地点部署智能结账系统时,错误率比项目开始时设定的目标高出四倍。花了两年时间才实现了系统的完全优化,这证明了收集反馈的长期重要性。

幸运的是,AAEON 致力于在这种新型实时开发流程和整个长期部署周期中持续为客户提供支持。在与英特尔® 的合作中,该公司提出新计划,将对某些人工智能硬件和软件解决方案堆栈提供长达 15 年的支持。

更智能的系统需要更智能的开发基础架构,并确保当它们需要不断适应所处的环境时,该开发平台随时可供使用。

现在两者皆已实现,要让它们持续学习,您唯一的任务就是保持数据流动。

作者简介

Brandon is responsible for Embedded Computing Design’s IoT Design, Automotive Embedded Systems, Security by Design, and Industrial Embedded Systems brands, where he drives content strategy, positioning, and community engagement. He is also Embedded Computing Design’s IoT Insider columnist, and enjoys covering topics that range from development kits and tools to cyber security and technology business models. Brandon received a BA in English Literature from Arizona State University, where he graduated cum laude.

Profile Photo of Brandon Lewis