Netflix 的 Chaos Monkey 和供应链

我最近与 Zara 母公司 Inditex 的首席运营官 Carlos Crespo 进行了一次对话,他在谈话中提到了 Netflix 十多年前创建的一种软件工具,用于将系统弹性制度化。 这个名字很吸引人,对于试图在动荡时期重塑供应网络的供应链领导者来说,这是不可抗拒的。 然而,谷歌GOOG
搜索“supply chain chaos monkey”,结果正好 一次引用,从 2012 年开始。

为什么我们不将这个想法应用于供应链弹性?

什么是混沌猴子?

这是一个 软件工具,更广泛地说,是一种工程原理,它随机关闭复杂系统的某些部分,迫使操作员恢复运行。 有点像突击消防演习,但每天都在随机的方式和地点进行。 这个想法是,擅长快速解决系统问题是一个学习过程,应该受益于陡峭的学习曲线。

背景故事是关于 Netflix 如何在从运送 DVD 过渡到客户上门的同时扩展其在 Amazon Web Services 上的流媒体业务。 乍一看,这是一种系统冗余规划的合乎逻辑的方法,就像您对 NASA 的期望一样,但实际上它利用了 Netflix 的文化规范,即允许个人贡献者解决他们自己的问题。 正如记载在“混沌工程” 凯西·罗森塔尔 (Casey Rosenthal) 和诺拉·琼斯 (Nora Jones) 在 2020 年出版的一本书中,他们在 Netflix 开创了这种做法,归结为五个原则:

  • 围绕稳态行为建立假设
  • 改变现实世界的事件
  • 在生产中运行实验
  • 自动化实验以连续运行
  • 最小化爆炸半径

Netflix 的文化和流程融合很重要,因为它培养并利用了一种开源的问题解决方法,同时系统地转动随机停机的轮子加速了整个扩展团队的学习。

供应链弹性与混沌工程

数字化转型 in supply chain今年很火,因为它帮助供应链支持新的商业模式并推动可持续运营(参见 BCG X 研究),还因为它承诺“弹性”。 不幸的是,供应链弹性数字化转型的实际应用仍然通常归结为更好的“可见性”平台,并得到库存缓冲和双重采购等一系列传统策略的支持。 支撑这种方法的是另一层分析工作 恢复时间 麻省理工学院的 David Simchi-Levi,以及使用数字孪生的一波模拟浪潮。 这一切听起来不错,但缺少任何系统的方法来试验真实的供应链故障,以了解如何在实践中最好地恢复。

将 Chaos Monkey 应用于供应链

医生在切开我们之前宣读希波克拉底誓言,包括著名的“首先不伤害”。 对于任何将 Chaos Monkey 原则应用于供应链的人来说,这都是一个不错的主意,这需要随机关闭某处的真实机器。 这是非常重要的,据我所知,还没有发生在任何地方。

  • 上面引用的第一个原则是关注系统输出而不是内部属性。 验证系统是否正常工作,而不是试图理解其工作的原因。
  • 第二个原则说要以现实的方式打破各种事物。 无需模拟全球热核战争,只需关闭开关或丢失命令,即可了解最有效的解决方案。
  • 第三条原则说,最好的学习场所是在生产中。 在实践中学习比通过模拟学习更好——即,数字双胞胎很棒,但它们可能不足以建立弹性文化。
  • 第四个原则将混沌猴子原则制度化,因为它允许扩展实验过程,从而使您获得更陡峭的学习曲线。 在救火中使用数据科学。
  • 最后,最小化爆炸半径。 这意味着“不伤害”并转化为某种缓冲(库存、交货时间、加急发货)以保护客户免受您的实验的影响。 学习管理受控爆炸。

有人可能会说,过去三年 Covid, 战争, 劳资纠纷,经济动荡对每个人来说都是一场大混乱的猴子演习。 Netflix 的教训是,这种危机不仅仅是需要计划的事情,而是需要作为生活中永恒的事实来掌握的事情。

完美风暴可能永远不会结束,所以也许我们应该学会忍受它。

来源:https://www.forbes.com/sites/kevinomarah/2022/12/22/netflix-chaos-monkey-and-supply-chain/