亚马逊科技集团于本周六正式庆祝其 Simple Storage Service 成立 20 周年,标志着云计算存储时代的里程碑。服务主管 Sébastien Stormacq 在官方博客中详细披露了该服务的最新规模数据,展示了惊人的增长轨迹。此次更新不仅回顾了历史,更揭示了云存储基础设施在过去二十年间的巨大演变与成就,为行业提供了重要参考。
2006 年 3 月 14 日,S3 最初仅提供约一 PB 的总存储容量,分布在 15 个机架和三个数据中心中。如今,该服务在全球 39 个 AWS 区域和 123 个可用区中存储超过 500 万亿个对象,规模不可同日而语。每秒处理请求量超过二亿次,数据总量达到数百艾字节级别,带宽能力显著提升,支撑了全球互联网流量。
AWS 用了一个形象的比喻来描述其硬件规模,引发了业界的广泛讨论和关注。如果将 S3 使用的数千万块硬盘堆叠起来,高度将到达国际空间站并几乎返回地球。基于硬盘厚度计算,这大约意味着使用了二点七六亿块硬盘驱动器来维持当前运营,体现了物理存储的庞大体量。
Stormacq 强调 API 向后兼容性是 S3 最显著的成就之一,也是技术稳定性的核心体现。2006 年编写的代码至今仍能正常运行,无需对应用程序进行任何修改或重新编译。尽管底层基础设施经历了多代磁盘和存储系统的迁移,数据依然完整可用,确保了业务连续性。
S3 的 API 设计已成为整个存储行业的参考标准,被多家厂商广泛采纳并实施。许多供应商现在提供兼容 S3 的存储工具,实现了相同的 API 模式与数据访问协议,促进了生态发展。这种标准化使得初创公司在早期就能利用云存储降低数据保护成本,无需自建机房,极大降低了门槛。
流媒体巨头 Netflix 和 Spotify 是 S3 的典型用户,利用该服务实现了快速扩展与全球覆盖。它们利用该服务实现了快速扩展,为行业树立了榜样,推动了内容分发的数字化转型。云存储的可用性确实为视频和音乐行业带来了巨大的文化影响,改变了内容分发的模式和成本结构。
该服务的发展过程中也遇到过安全挑战,尤其是早期默认公开访问的设计存在争议。初始设计允许资源默认公开访问,导致数千个存储桶存在安全隐患,被黑客利用获取敏感数据。2017 年 US-EAST-1 区域的故障曾导致一些主要网站中断数小时,暴露了架构风险与单点故障问题。
可靠性方面,S3 提供了 11 个九的耐用性保证,系统持续检查每个字节以确保数据完整。AWS 通过微服务系统持续检查每个字节,发现退化即触发修复机制,保障数据持久性。过去八年,性能关键代码已逐步用 Rust 语言重写,以提升整体系统效率和安全性。
未来规划显示,S3 旨在成为数据和 AI 工作负载的通用基础,超越单纯存储服务的定位。AWS 希望用户只需存储一次数据即可直接处理,无需在不同系统间迁移,简化了数据架构。这一愿景旨在降低成本并消除复杂性,同时也可能增加客户粘性,形成更深的生态绑定,巩固市场地位。