计算机视觉 = 出色的服务 + 更低的成本
台湾新竹的雅特烘焙 (RT Baker House) 是该地区最著名的面包店之一。该面包店以一系列令人印象深刻的美味蛋糕和面包闻名,同时也因排队时间长和等待时间长而闻名。仅仅通过增加更多员工无法提高顾客的满意度。由于面包店无法通过使用人来解决问题,因此转而采用 Flytech 和其子公司 Berry AI 开发的基于计算机视觉的 POS 系统(视频 1)。
视频 1。雅特烘焙计算机视觉 POS 系统的实际应用。(来源: Flytech)
结果,雅特烘焙通过实施以下类似的无缝结账流程来大幅提高顾客满意度:
- 面包店顾客只需选择他们的商品,然后放在盘子中并进行结账。
- 盘子放在 K750/K750 计算机视觉系统的视野内,此系统无需人工收银员输入任何数据即可识别商品并将信息传送到 POS 系统中。
- 安全付款由收银员在第三方 POS 系统上处理,但也能通过自助结账完成。
此经过改进且采用计算机视觉的流程能将顾客的等待时间减少 30%。同时,也在改变雅特烘焙的利润。
借助计算机视觉和人工智能缩短排队时间
面包店计算机视觉结账系统的核心是 Flytech K755 无风扇平板电脑。该电容触摸系统基于第六代智能英特尔® 酷睿™ 处理器,并搭载了 4 GB 外部 DDR3L 内存。此外,该系统还配有多个摄像头:前面板上有一个摄像头,挡板底部有两个摄像头,负责扫描顾客选择的烘焙食品。
两个扫描摄像头还配有补光灯和特殊过滤功能,这样即使在面包店内不断变化的照明条件下,也可以确保系统能捕获高分辨率图像(图 1)。
但是,由于卷积神经网络 (CNN) 算法和快速傅立叶变换 (FFT) 能够识别近 100 种不同烘焙食品之间细小的差别,因此智能结账系统才得以实现。
该算法由 Berry AI 花了 10 周以上的时间开发,其使用了由面包店提供的约 10,000 张产品图像所组成的训练数据集。在完成数据标记的一周后,该团队开发了检测精确度高于 99% 的推理算法。换句话说,比人工目标识别更好。
更令人印象深刻的是这些神经网络算法能同时且实时地识别盘子上的不同物品,而且全部在位于边缘的英特尔酷睿处理器上执行,并且只耗费 2GB 内存。
为了优化在无风扇边缘系统上执行计算机视觉算法,该公司采用了英特尔® OpenVINO™ 工具包。深度学习开发套件帮助工程师在包括 CPU、GPU、FPGA 和视觉处理单元 (VPU) 在内的各种计算架构中最大化计算机视觉工作负载的性能表现。
根据 Flytech 的计算机视觉产品经理 Ian Zeng 介绍,OpenVINO 不仅减少了 CNN 算法的总内存占用,而且还能将在英特尔酷睿处理器上运行时的执行时间缩短到 0.1 秒以下。
从饼干到奇异果
高准确性 K750/K760 计算机视觉系统能够减少诸多人工成本。由于需要精通不同烘焙食品的员工越来越少,因此面包店最高消除了 50% 的培训成本。与此同时,由于智能结账系统缩短了排队时间且提高了效率,因此整体人工需求降低了大约 20%。
鉴于该解决方案的成功,人工智能计算机视觉系统现在扩展到了更多食品识别应用中。
随着雅特烘焙在其所有分店内部署智能结账系统,Flytech/Berry AI 技术的新应用也正在付诸实现。例如,在杂货店内,其解决方案能够应用于要求更高的目标识别任务,如区别不同类型的商品。
由于不同品种的苹果或不同类型的橘子具有几乎相同的颜色、形状和大小,因此人们一般都很难进行区分,更不用说计算机视觉算法。但是,Berry AI 提供的先进算法现在能使用相同的 K755 基础设施区分外观几乎一致的土豆、苹果、梨和奇异果。
即使在更大范围内,零售商也能用 K755 平板电脑之类的计算机视觉解决方案来代替任何类型的传统条形码扫描。这样一来,供应商能消除条形码基础设施的开销,通过最大程度降低与食品的身体接触来改善卫生状况,并且可以提高顾客满意度和降低成本,而这一切在台湾这家最著名的面包店中已经成为现实。