机器学习和预测性维护的 5 大步骤

October 31, 2017

Kenton Williston

机器学习对于下一次工业革命至关重要。随着设备和供应链加入工业物联网 (IIoT)，海量数据会淹没本就十分繁忙的人类主管，因此实现自调节自动化迫在眉睫。我们以发电厂为例。每个发电设施都包含一个复杂且相互依存的生态系统，该系统由设备与基础设施构成。这些系统每天共同产生数量庞大的数据，高达 1.5TB。惊人的数据量超出了人类处理能力，但却恰好符合机器学习的专长。我们可以将机器学习看作力量倍增器。机器学习可以接管日常操作，为新分析任务释放宝贵的人力资本。举例来说，机器学习不再依赖常规维护计划，而是可以实时监测设备和预测性维护需求。可以更大规模地考虑整个监控与数据采集 (SCADA) 系统中分布的传感器。大数据系统可以收集和分析所有这些变量，从而创建一个可预测系统范围行为的模型。以这种方式利用批量传感器数据的能力对机器停机时间和维护成本有巨大的影响。

机器学习应用

让我们回到上面讨论的发电厂示例。发电厂故障可能会跨系统迅速扩展，导致超负荷运转和大面积停电。2003 年北美大停电事故一部分原因是跨网络扩展的系统监测故障，最终导致 256 家发电厂瘫痪。为了确保恢复能力并避免这样的结果，发电厂与其接入的电网必须遵守严格的基础设施保护准则。能够执行预测性维护对于这一流程至关重要。通过部署摄像头、振动传感器、流量传感器和其他设备，预测性维护系统可以实时监测设备。出现热点或振动模式细微变化，都可能意味着很快就需要更换泵或电机。而且甚至有可能在设备中检测出不易监测到的问题。例如，严密监测下游设备中的输入流量、流体温度或气穴现象，可能会指出无监控上游设备中的故障。

开发学习系统

预测性维护及其他机器学习算法构建于图 1 所示的五步流程中。首先，收集并净化传感器数据，以提取感兴趣的特征。接下来，开发人员选择学习模型，并用收集的数据训练模型。最后，针对新的真实数据验证模型，并部署至现场。如果模型未能呈现所需的行为，那么此失败事件将反馈到模型中，以提高模型未来的性能。

图 1：机器学习开发包含五个主要阶段。（资料来源：NI）

这种方法体现在 National Instruments 推出的 LabVIEW 机器学习工具包的架构中。该工具包支持一系列算法、协议和程序（虚拟仪器或 VI），可用于训练机器学习模型，发现隐藏在大量数据中的结构。我们利用这个工具包来了解模型开发的五个阶段。

1. 收集数据

显然，此流程是从现场系统收集数据开始的。正如您所期望的，LabView 提供一套强大的数据采集工具，用于针对特定于实例的数据训练模型。但是，收集现场数据并不总是现实的，例如，如果尚未安装现场系统，则无法进行现场数据采集。在这种情况下，机器学习工具包也可使用公开的数据集。（NASA 维护一套可用于训练模型的机器学习数据集。）

若要在采集数据后利用数据，必须对数据进行处理和净化，以检测异常并减少误差和噪声。机器学习系统需要识别和丢弃的特定类型噪声将根据被监测的设备和传感器设计用于记录的内容而变化。例如，设计用于监测特定部件振动的传感器可从另一个来源拾取振动。或者，在某些照明条件下，摄像头可能会出现高水平的图像噪声。根据记录的数据类型，处理噪声的方法有所不同，从简单丢弃离群数据到复杂的分析方法不等。机器学习算法以不同方式处理此问题，具体取决于任务性质和遇到的噪声类型。

2. 提取特征

若要使数据可供下游使用，还需通过特征简化和数据平滑来组织数据。例如，在具有大量变量的系统中，通常需要执行特征提取以识别相关数据点。若使用 LabView，有许多工具可供规范数据和显示模式。数据降维、异常检测、聚类和分类算法协同工作，生成准备好提供给学习系统的有序数据。借助于领域专长，数据净化工具加入了统计驱动的群集有效性指标：

兰德指数
戴维森堡丁 (DB) 指数
杰卡德指数
邓恩指数

此外，还有一些数据分类评估工具：

分类准确率
混淆矩阵

3. 创建模型

机器学习系统通过两种主要方式接受教育：监督式学习和非监督式学习。监督式学习和非监督式学习有两点主要区别。一个是人类是否参与训练模型。另一个是模型可以使用的数据类型。监督式学习模型从具有预定义属性的数据点开始。此类模型尝试预测这些数据点之间的关系。错误的预测会反馈到模型中，以提高未来的性能。机器学习工具包中的监督式学习模型包括：

k 近邻 (k-NN) 算法
后向传播 (BP) 神经网络
学习矢量化 (LVQ)
支持向量机 (SVM)

非监督式学习使用未标记的数据，因此没有错误信号反馈到数据流。这种模式擅长识别相似数据和不同数据的尖峰、模式和群集。工具包中的非监督式学习模型包括：

等距特征映射 (Isomap)
局部线性嵌入 (LLE)
多维定标 (MDS)
主成分分析 (PCA)
核主成分分析
线性判别分析 (LDA)

4. 验证

工具包的多步工作流程可以通过任意复杂的测试案例进行迭代，以构建和验证学习模型，甚至是使用 LabVIEW 面向终端用户的“前面板”功能的模型。对于具有大数据流的系统，验证需要使用工具比较预期行为和实际行为。在此步骤中，工具包加入批量数据的验证和可视化功能：

可视化（2D 和 3D）
Plot SOM（2D 和 3D）

5. 部署

部署需要的不仅仅是一个好的模型，它还需要能够处理计算的硬件。例如，LabView 模型可以部署在 NI 采用双核和四核英特尔凌动® 处理器的 CompactRIO 系列上。部署后，机器学习工具包除了管理预测性系统维护的开销外，还支持边缘实时状态监测。通过此流程的每一步骤时，工具包均支持各种通信协议。它还兼容 Windows 7+ 和 Linux，这意味着用户可以监控和解析传入的新数据。

边缘机器学习

机器学习的优势在于能够快速处理大量数据。在高风险、高吞吐量环境下，模式的成功取决于其信息的摄取。这意味着需要许多传感器才能有效学习。凭借丰富的传感器配置，机器学习可以缩短发生不利事件与形成维护计划、发电厂操作员以及其他数十个行业用例见解之间的时间。机器学习还可以通过执行内联网络诊断和分析来减少数据开销，从而减少在云端移入/移出大量数据进行处理和传播的需要。鉴于这些优势，由机器学习准确率启示的、响应迅速的连接资产支持的模型，能够很好地帮助工程师和领域专家将边缘的大量无序数据转化为可操作性信息。