让物联网边缘自行管理
当今的物联网客户期望以边缘计算的成本和延迟目标,实现集中式云架构的冗余性、灵活性和可扩展性。如果远程解决方案需要较高的可靠性,那么它应该具有很高的应变能力。如果某个端点失去连接,它应能继续运行,直至重新建立连接;断电不应意味着数据丢失。
但是,物联网边缘节点会带来单点故障,因为连接丢失、电源不稳定或硬件故障可以在任何给定时间导致端点停机。与云数据中心不同,物联网边缘节点的分布式特性意味着如果发生故障,IT 人员可能无法在数天或几周内做出响应。
随着企业的期望值继续与边缘的现实情况相结合,物联网系统架构师正在通过超融合基础设施 (HCI) 找到一个中间地带。
云和边缘计算的最大优点
HCI 是一种物联网架构,可将类似数据中心的资源推向边缘(图 1)。通过让类似数据中心的计算、网络和存储资源更靠近边缘应用程序,或将这些资源直接移到边缘节点,HCI 可以在分布式端点中实现云的性能。
HCI 硬件的示例包括基于英特尔® 酷睿™ 或英特尔凌动® 处理器的高性能边缘网关;移动边缘计算基站将在 5G 网络中占主导地位;采用英特尔® 至强® 处理器的 uCPE 服务器已经部署在本地物联网用例中。请阅读 SD-WAN 和 uCPE:简介,了解更多信息。
这些平台由于支持多核处理器、高容量存储和虚拟化技术,在远程物联网部署中越来越受欢迎。它们的优点:
- 通过在虚拟机 (VM) 中托管冗余工作负载来防止硬件故障
- 能够在边缘执行分析,因此即使云连接丢失,也能继续正常操作
- 未来有机会用新的应用程序和服务更新边缘部署
当然,大多数 HCI 平台不支持开箱即用的 OT 要求。例如,远程物联网边缘部署通常需要:
- 如果存在系统故障、增补或变动,能够自动重新配置或自我修复
- 即使整个物理节点出现故障,也能继续操作
- 裸机性能与本机硬件媲美,即使对于在虚拟机中运行的应用程序亦是如此
实现这些可靠性和性能功能需要智能软件。NodeWeaver 边缘集群执行平台是能将这些功能带到在边缘运行的 HCI 系统的解决方案之一。
让节点自行管理
NodeWeaver 是一个编排和管理解决方案,它将多个端点“编织”成一个大型的、虚拟化的边缘计算基础设施。这意味着工作负载可以部署在完全独立的物理节点上的虚拟机中,因此,如果一个端点出现故障,其应用程序可以继续在基础设施中的其他地方运行。
除在 x86 目标上裸机运行的操作系统外,每一个节点还集成了分布式文件系统、软件定义网络 (SDN) 和虚拟化组件(图 2)。整个堆栈只消耗 4 GB 的内存,因此适用于大多数 HCI 系统。
虚拟网络用于将这些节点连接成集群,每个集群可由 2 到 25个节点组成。然后,分布式文件系统从一个节点复制应用程序数据(或“区块”),并将其传输到其他节点上的虚拟机中,在此过程中,文件系统会随机将区块分配给性能最佳且可用存储空间最大的节点。
为了确保区块始终可用,NodeWeaver 会运行一个进程来检查整个集群。如果该进程发现区块丢失或损坏,它会指示文件系统编排程序在集群的其他位置复制一个新的区块。因此,假设存储驱动器出现故障,NodeWeaver 可以通过在另一个正常运行的资源上实例化新区块来“修复”系统。无需用户干预。
通过这一进程,NodeWeaver 还可以发现已添加的新资源或管理员是否对现有资源做出了更改。
自动实时虚拟化
如前所述,NodeWeaver 可以跨物理和地理分布的节点创建完全虚拟化的环境。因此,需要注意的是,应用程序并不会将节点视为单独的资源。相反,它们把整个基础设施视为一个资源池。
但是,这并不意味着每个节点上都有无限的资源可用。
NodeWeaver 使用自主负载平衡程序,确保工作负载在此环境中得到有效执行。负载均衡程序采用了一种称为动态适应的功能,该功能会持续对集群中运行的各种工作负载进行基准测试。然后,根据服务质量 (QoS) 要求,将工作负载安排在最高效的可用硬件上。此硬件可以包括基于 x86 的 CPU、GPU、FPGA,甚至是英特尔® Movidius™ 加速器。
此外,底层 NodeWeaver 操作系统提供软实时保证,允许以近乎裸机的性能执行工作负载。同样,无需人工干预。
人工智能能否进一步实现边缘的自动化?
为了满足物联网客户对冗余性、灵活性和可扩展性的期望,物联网系统架构师必须在设计端点时考虑到云功能。这不仅可以消除单点故障,还能实现即使在没有本地 IT 支持的情况下也能无限运行的自主边缘环境。
但是,如果加入人工智能,这些自主边缘环境还能实现什么呢?平台可以监视硬件一段时间的性能,并预测驱动器或软件何时出现故障,使维护技术人员能够相应地优化其服务安排。像 NodeWeaver 这样的平台已经开始集成能实现这一点的概率引擎。
让边缘自行管理。