沉着应对物联网边缘计算
自动驾驶汽车会生成大量的数据。事实上,一辆自动驾驶测试车每天可生成 5 至 20 TB 的数据。尽管你可能认为这仅限于自动驾驶汽车,但喷气发动机、风力涡轮机、油泵和自动化系统同样会生成大量的信息。
如何处理所有这些信息?例如,自动驾驶汽车的数据对于未来的车辆设计非常有价值,因此不能丢弃该数据。但显然不能通过有线连接将数据传输到数据中心进行存储,而通过无线网络传输如此数量的数据既昂贵又不切实际。
唯一可行的选择是为车辆本身配备高性能嵌入式计算 (HPEC) 数据记录器。
“这必须在车辆上进行,因为无法无线传输如此大量的数据,” Eurotech S.p.A 的产品管理部门高级集团经理 Pierfrancesco Zuccato 说。“这就提出了一些非常苛刻的要求,因为车辆存在冲击和振动,必须符合一定的监管标准,却没有太多空间。”
有限的空间不仅对汽车工程师来说是一个棘手的问题,而且对于任何需要大量性能的系统的设计师来说也是如此。在自动驾驶测试车这样的用例中,不能使用风扇为数据记录器散热,因为活动部件会显著降低系统的可靠性。而且在很多情况下,这些设备被置于车辆内,几乎不接触环境空气。它们通常还会消耗和计算设备本身同样多的能量。
那么,如何将 HPEC 存储在像自动驾驶测试车这样空间受限的恶劣环境中?答案是液体。
“如果使用液体冷却,就可以达到最大的密度水平,因为除了液体,无需留出空间让任何东西在里面流动,液体可以被精准引导到需要散热的部件,” Zuccato 说。“通过液体冷却,你会获得空气冷却无法比拟的效率。”
液体冷却数据中心
多年来,液体冷却已被应用于多种系统。其中包括使用该技术使电池保持在最佳温度的电动汽车 (EV),以及让燃料流经板载电子设备以防止过热的飞机。
但电动汽车和飞机热管理系统是定制设计的,在测试系统或希望使用耐用 CPU、GPU和/或 FPGA 的任何其它空间有限的设计中,液体冷却的实现成本极高。为此,Eurotech 的边缘系统工程师设计了 DynaCOR 40-35,这是一款耐用的液体冷却数据记录器,具有高达 123 TB 的 NVMe 存储容量,具有数据中心级温度控制(图1)。
在自动驾驶测试车中,DynaCOR 40-35 直接接受来自汽车的冷却液,并通过系统内的冷板进行传递。这些冷板当然是紧密耦合的,这可以防止液体干扰任何板载电子元件,同时也符合平台的 ISO 16750-3/LV-124-2 认证合规性。
该系统的 123 TB 焊接 ECC NVMe 存储器分为五个支持 RAID 0 或 RAID 5 架构的盘位,后者通过在多个冗余驱动器上分布所记录的信息来提供数据恢复能力。即使 RAID 5 系统中的一个驱动器出现故障,也可以从其它工作的驱动器拼凑校验信息,以重建原始数据(图2)。
为了支持来自高分辨率汽车传感器的恒定数据流,DynaCOR 40-35 包含一个三层交换机、两个100 GbE,以及四个 10 GbE 接口,总吞吐量超过 200 Gbps。为了有效管理如此大量的数据,该系统能保持 80 Gbps 的内存写入速度,使 DynaCOR 40-35 能作为企业级存储集群,用于车辆中的所有端点。
所有这些部件均为液体冷却,但 DynaCOR 40-35 需要液体冷却的真正原因是需要对其进行管理,而且平台也必须分析所记录的数据。这由 16 核英特尔® 至强® D-2100 系列处理器执行,它集成了英特尔® AVX-512 扩展和一个用于计算阵列的融合乘加运算 (FMA) 块。
至强处理器焊接在主板上,提高了其在恶劣环境下的耐用性和可靠性。尽管如此,该芯片仍然提供诸如英特尔® 虚拟化技术(英特尔® VT)、英特尔® 通信加速技术(英特尔® QAT),以及平台存储扩展的企业级功能,这有助于提高板载存储能力。
这些功能产生的整体热设计功率 (TDP) 低至60 瓦,显著低于其它 GPU 产品。这种低每瓦耗电量 (PPW) 是对 Zuccato 的“在边缘复制数据中心”的愿景的理想补充。
“你可以非常严格地控制设备的运行条件,这意味着你不仅可以部署在车辆内,还可以部署在几乎任何地方,因为你可以有效地将热管理要求与实际环境条件解耦,” Zuccato 解释说。“这意味着,你甚至能以符合设计使用条件的方式部署诸如最新、最好的 CPU 的数据中心硬件,以及诸如 GPU 或 NVMe 存储单元等其它外围设备。”
成品 HPEC
近十年来,HPEC 系统一直被作为一种使边缘计算更智能的方式来推广。但许多尝试都失败了,因为将为数据中心的受控环境设计的技术移植到现实世界的恶劣环境中必然存在困难。成功的尝试通常需要大量定制,因此对于大多数应用程序来说不现实。
如今,诸如 HPEC 和液体冷却等先进技术已经发展到不仅可以广泛使用,而且提供成品。事实上,DynaCOR 40-35 有一个快速对接选项,使设计师能快速将其从测试车辆上移除,在办公环境中提取数据,然后再将其放回原位。如果这还不能说明边缘计算的高性能,那我不知道还有什么能够说明。