为什么制造以外的灾难性场景测试对于关键基础设施安全至关重要

美国联邦航空局史无前例的停运导致所有国内航班停飞,每个人都在问:

这是怎么回事呢?

谁负责?

我们如何防止类似的事情再次发生?

这次中断引起了我们的注意,强调即使是我们认为最安全、最受信任和验证的系统也可能会失败。

虽然这种达到公众意识水平的中断很少见,但当生命攸关的系统中确实发生这种中断时,它可能会导致大量影响安全、安保和经济的灾难性后果。 我们现在看到的是交通中断以及网络/应用程序服务超载的后果,成千上万的乘客争先恐后地到达目的地。

虽然今天的 FAA 中断被认为是系统故障,但它是一种正常的降级故障。 这意味着,幸运的是,没有人因故障而死亡,并且系统在造成更多损坏之前有效地关闭了。

这是幸运的,但并不令人鼓舞。

制造中一直使用测试来检测缺陷——例如,故障模拟是一种人为“破坏”设备的方法,以查看诊断测试是否能检测到故障并将其隔离到根本原因。 在设计软件时,工程师们被教导要按照功能规范进行设计。 在寻找导致系统故障的灾难性场景或需要发生的“完美风暴”条件方面花费的精力要少得多。 预测这些情况可以帮助我们主动建立机制来主动检测和预防灾难性故障。

防止未来中断和其他关键基础设施故障

随着云计算和人工智能解决方案的普及,我们现在拥有足够高效的计算能力来评估数百万个操作场景,以检测哪些情况可能导致灾难性场景。

对于美国联邦航空局,现在应该可以主动分析所有国内机场、空中和地面飞机以及计划未来使用的飞机、控制塔通信和相关基础设施、乘客、天气、和安全性来解决可能导致系统故障的场景。

如果考虑到该系统交互和相互依赖的复杂性,很明显,查看所有故障点是一项艰巨的任务。

人工智能可以帮助分析这些海量数据,以主动寻找可能对 FAA 系统构成挑战的模式和行为。

这并非史无前例,因为人工智能已被用于更好地检查交通模式以优化调度和物流。

该技术还可以部署为一种强大的防御机制,以提供对系统中网络攻击和/或异常行为的早期检测。 有效部署此类系统的关键是隔离那些特定的异常值和条件,以便人类专家对其进行审查。

从美国联邦航空局的故障中可以吸取很多教训,我们将及时对发生的事情有一个更清晰的了解。 但是,就目前而言,很明显,人工智能等新兴技术能够主动检测系统故障和可能出现的其他挑战,在我们如何维护我们的关键基础设施向前发展方面发挥着重要作用。

来源:https://www.forbes.com/sites/karenpanetta/2023/01/11/the-perfect-storm-of-the-faa-outage-why-catastrophic-scenario-testing-beyond-manufacturing-is-至关重要的关键基础设施安全/