
Amazon's Cloud Unit Issues Apology, Explains How Rare Software Bug Triggered Global AWS Outage This Week

亚马逊的云计算部门 AWS 为影响超过 1000 个网站(包括 Snapchat 和 Disney+)的重大故障道歉。故障是由于其位于北弗吉尼亚的数据中心出现了一种罕见的软件错误,导致了连锁反应。AWS 表示将从此次事件中吸取教训,并已禁用有问题的自动化系统。此事件引发了人们对大型科技公司权力集中化的担忧,并促使人们呼吁拆分这些公司。埃隆·马斯克指出,X 独立于 AWS 运营。根据 Benzinga 的数据,亚马逊的动量评级为 65.94%,增长评级为 92.76%
亚马逊公司(NASDAQ:AMZN)的云计算部门 AWS 已对此次影响超过 1000 个网站和服务的重大故障表示歉意,并进行了说明。
此次故障影响了大量网站和服务,包括 Snapchat(NYSE:SNAP)、Disney+(NYSE:DIS)、Reddit(NYSE:RDDT)和 Lloyds Bank(NYSE:LYG)。
AWS 将故障归咎于罕见的软件错误
在周四的详细说明中,AWS 表示,此次故障是由公司最关键系统之一中的罕见软件错误引发的级联故障。问题集中在北弗吉尼亚地区,该地区是 AWS 最大的数据库集群 US-EAST-1 的所在地。
“我们对此次事件对客户造成的影响表示歉意……我们知道此次事件对许多客户产生了重大影响,” 该公司表示。
AWS 表示,其内部系统中的 “故障自动化”——两个独立程序开始相互竞争以更新记录——删除了其 DynamoDB 数据库服务的关键网络条目,触发了连锁反应,暂时导致许多其他 AWS 工具出现故障。
虽然像 Roblox(NYSE:RBLX)和 Fortnite 这样的平台在几个小时内恢复了在线,但 Lloyds Bank、美国支付应用 Venmo 和社交媒体网站 Reddit 等则经历了较长时间的停机。
“我们将尽一切努力从此次事件中学习,并利用它进一步改善我们的可用性,” AWS 表示。
AWS 还表示,已在全球范围内关闭了有缺陷的自动化系统,并将在修复该错误后再将其上线。
大型科技公司权力集中引发担忧
此次事件引发了关于大型科技公司权力集中及单一公司的基础设施支持互联网重要部分的潜在风险,以及对替代方案需求的讨论。
伊丽莎白·沃伦(D-Mass)参议员在事件后呼吁拆分大型科技公司。此次故障引发了对依赖单一云服务提供商及其潜在风险的担忧。
与此同时,埃隆·马斯克 宣布,X 独立于 AWS 运营,并且完全加密。
根据 Benzinga 的专有边缘排名,亚马逊的动量评级为 65.94%,增长评级为 92.76%。查看详细报告请点击这里。
接下来阅读:
- 亚马逊会成为下一个大型 AI 赢家吗?一位分析师认为华尔街错了
图片来源于 Shutterstock
