如何驾驭复杂系统复杂系统应对策略想要优化系统的一个小问题，没想到却造成了更大的麻

如何驾驭复杂系统复杂系统应对策略

想要优化系统的一个小问题，没想到却造成了更大的麻烦？

这就是复杂系统带来的“蝴蝶效应”。

在当今高速演进的技术领域，工程师们越来越频繁地遭遇这样一类难题：它们往往具有高度不确定性、涉及多维度因素交织，且无法通过标准化方案简单套用。

针对这类复杂系统，来自谷歌的工程师Teiva Harsanyi分享了他的经验，或许能够带来一些启发：

一、复杂系统的特征

1. 不可预测的整体行为：系统的整体行为无法通过单独分析其各个组件来预测。

2. 延迟后果：行动的效果并非总是立即显现，可能在数天甚至数周后才出现。

3. 局部优化不等于全局优化：在复杂系统中，优化一个部分并不一定能改善整个系统，甚至可能使情况变得更糟，局部优化可能会产生难以预测的连锁反应。

4. 系统具有滞后性：系统的过去状态会持续影响其行为，即使原始原因已经消除。

5. 小变化可能产生巨大或不可预测的影响：在复杂系统中，小的变化可能会导致巨大的、不可预测的后果。

6. 规模不是复杂性的唯一决定因素：即使是小型系统，也可能表现出涌现、非线性等典型复杂特征

二、如何驾驭复杂系统？

1. 可逆决策

- 尽量选择可逆的决策，以便在出现问题时能够快速回退。

- 例如，亚马逊的“单向门”和“双向门”框架，单向门代表不可逆决策，需要谨慎考虑；双向门代表可逆决策，允许快速迭代。

2. 定义全局和局部指标

- 在做出改变之前，定义全局和局部指标，以全面评估系统健康状况。这有助于避免因过度关注局部指标而忽视系统整体的负面影响。

3. 创新思维

- 面对复杂问题时，要有创新思维，假设问题是可以解决的，然后逐步分解、实验和迭代，直到找到解决方案。

4. 使用最佳实践

- 在部署变化时，使用经过验证的最佳实践，如功能开关、灰度发布、渐进式发布和影子测试，以降低失败的影响范围。

5. 增强可观测性

- 通过高基数、高维度的遥测数据来理解系统的状态，而无需部署新代码。可观测性是复杂系统的主要支柱，有助于减少未知问题、简化调试和加速创新。

6. 系统仿真

- 在实际部署之前，通过历史事件回放或使用确定性仿真测试来验证变化的影响。这有助于在复杂系统中减少不确定性并提高决策质量。

7. 利用机器学习

- 机器学习模型可以根据反馈循环和真实数据动态适应，而不是依赖于固定的逻辑。这有助于系统检测新出现的模式、动态适应变化并做出概率性决策。

8. 团队协作

- 在复杂环境中，团队协作至关重要。清晰传达问题的复杂性、讨论选项和权衡，有助于团队共同应对不确定性并做出更好的决策。

博客原文：

0 阅读：1