从 1980 年阿帕网崩溃到今天的海底电缆中断——按时间顺序记录的事件塑造了我们如何构建弹性网络。
数十年的网络故障揭示了互联网如何崩溃的反复出现的主题。
每次重大中断都会为构建更具弹性的系统留下经验教训。
从 1990 年 AT&T 崩溃到 2021 年 Facebook 宕机,错误配置和操作错误导致的宕机比任何其他因素都多。现代网络的复杂性意味着单个拼写错误可能会在全球范围内连锁。
在网络之间路由流量的边界网关协议是在隐式信任时代设计的。几十年后,由于 RPKI 等安全措施的采用尚未完成,路由泄漏和劫持仍在继续。
海底电缆承载着 95% 的洲际数据,但它们很容易受到抛锚、地震以及越来越多的故意干扰的影响。红海等地理阻塞点仍然是失败的关键点。
当 AWS us-east-1 宕机时,一半的互联网都会感受到。当 Cloudflare 出现问题时,数百万个网站将无法访问。集中化带来的效率提升伴随着巨大的故障模式。