Facebook全球6小时宕机原因查明：一条指令所致，内部工程师所为--IT时代网

Facebook全球6小时宕机原因查明：一条指令所致，内部工程师所为

博雯　2021年10月08日 08:10

最近，Facebook官方针对这次大规模宕机的原因做了回应。

这一新闻已经出现在了微博热榜。

而在回复中，官方也(针对各种神奇的假说)强调：

没有黑客恶意攻击行为，用户的数据也没有受到损害。

在第二天，Facebook又发了另一则声明，详细地说明了这次宕机的技术细节。

那么这场Facebook有史以来持续时间最长，规模最大，造成公司股价蒸发百亿的宕机到底是因为什么?

一起来看看。

日常维护切断网络

一切都开始于日常维护中的一条错误指令。

也就是Facebook engineering平台上的声明中所提到的“配置变化”：

协调数据中心之间网络流量的主干路由器的配置变化导致了通信中断，进而影响了数据中心的的通信方式，最后导致了服务中断。

在日常维护网络基础设施时，工程师经常需要离线维护部分主干网，比如修理一条光纤线路，增加更多容量，或者更新路由器本身的软件。

而上面提到的“配置变化”，就是日常维护工作中主要用于检测Facebook主干网络的可用性的一条命令。

当然肯定有应对这种命令的保护措施，但不巧审计工具(audit tool)中出了个bug……

于是，这个“配置变化”就撒着欢儿，啪一下把Facebook主干网络的所有连接都给切断了。

这一断，应用程序对数据的刷新搜索，上传下载等请求就无法从用户设备传到最近的数据中心了。

而这些数据中心不仅有容纳了数百万台存储数据机器，用于支撑平台运行的大型建筑，还有将主干网络连接到更广泛的互联网和具体应用平台的较小设施。

嗯，差不多就是这样的严重性……

这还没完。

上述数据中心里的小型设施还有一个工作，那就是响应DNS查询。

DNS是互联网的地址簿，能够将浏览器中键入的简单网络名称转换为特定的服务器IP地址。

而这些地址又通过边界网关协议(BGP)向互联网其他地址进行广播，类似一个地图，提供通往各种目的地的线路。

当DNS服务器发现主干网络失去了与互联网的连接时，BGP的“广播”也随之停止。

抹除了存在

相当于Facebook短暂地被从互联网这块地图上。

只有Facebook受伤的世界完成了

当然，在派遣工程师进入现场数据中心进行修复之后，网络服务也在10月4日下午4点左右逐渐恢复。

在官方回复的最后，他们也提到会通过这次的“演习”加强系统故障的测试、训练和整体恢复能力。

而纵观这次全球大宕机，不仅国外热度爆表，就连国内也上了热搜。

国内外的网友们弔图一堆，苦中作乐。

同为社交媒体的Twitter则高傲尽数显现。

甚至连Netflix都过来蹭了把热度，顺带了夹杂了新剧宣传私货：

而Facebook在这次事件中股价暴跌6%，扎克伯格个人财富一日蒸发逾60亿美元。

现在看来，只有小扎受伤的世界完成了(狗头)。【责任编辑/额发】

来源：量子位

Facebook全球6小时宕机原因查明：一条指令所致，内部工程师所为

【特别报道】蹊跷！脸书史无前例大瘫痪前，被多家美媒群批……

扎克伯格道歉！外媒评“6小时宕机”：极不寻常

15亿脸书用户数据在黑客论坛上被出售，总价值可能达750万美元！

: 博雯
关注私信

TA的最新文章

Facebook全球6小时宕机原因查明：一条指令所致，内部工程师所为

精彩评论

小何

华为现在牛的不只是设备商了，，华为的手机现在也是全球销量不错，国内也算是老大了，之前用小米，，现在都改华为了。。产品确实不错。

来自: 美国如此忌惮华为显示出对中国崛起的深层忧虑--IT时代网
小何

三星手机在中国还有市场吗？看看现在满大街的vivo和oppo ，，华为，，小米线下店，，就是知道三星的市场基本没有了。。

来自: 彭博社：六大中国手机品牌在全球挑战三星苹果霸主地位--IT时代网
小何

滴滴打车现在也没有之前那么火了，，补贴也少了。。

来自: 【人物】滴滴创始人程维回顾与Uber竞争：中国互联网从来没有输过--IT时代网
小何

今日头条要把腾讯的地方各频道给霸占了。。

来自: 少年头条对垒中年腾讯：解局两代互联网公司商业之战--IT时代网