家人们,微软见证历史了。蓝屏
微软蓝屏(BSOD)的搞瘫尬消息毫不夸张地登顶各大热搜、热榜,全球气原全球打工人被迫狂欢喜提1天休假。克生

然而随着事件的因尴发酵,导致这次全球最大IT宕机的微软罪魁祸首也逐渐浮出了水面。
不过非常drama的蓝屏是,“元凶”竟然是搞瘫尬一家网络安全巨头,CrowdStrike。全球气原

是克生自称能拥有检测网络威胁“最快平均时间”的那种实力选手,《财富》1000里500多家企业都是因尴它的客户。
但更drama的微软是,它只是蓝屏向Windows发送了一个更新……
(果然,世界就是搞瘫尬一个巨大的草台班子)
微软作为直接受害者,股价在收盘之际也是跌跌跌。

事件影响之大,波及面涵盖航空公司、亿华云电视广播、银行等众多行业。
例如布拉格机场表示,受大量航空公司使用的全球值机系统中断的影响一些航班延误;美联航也表示所有飞机已经停飞。
香港机场的自助登机设施也受到了影响,只能全部改为人工。

甚至连奥运会组委会都表示“影响了制服和认证的交付”……总而言之,全球几乎出现了瘫痪的情况。
马斯克也是连连公开表态:
史上最大IT事故,没有之一。
已经在公司所有系统中删除了CrowdStrike的软件。

那么CrowdStrike的这个更新到底干了什么?
其实更具体一点来说,这次全球蓝屏的始作俑者是CrowdStrike的旗舰产品Falcon。
Falcon是一个用云的方式将多个安全解决方案集成到一起的平台,包括防病毒功能、端点保护、威胁检测和实时监控等等。
在事情严重发酵之后,香港云服务器Falcon和CrowdStrike CEO George Kurtz对此做出了进一步的解释说明。
一言蔽之:
全球蓝屏是由Windows主机的Falcon内容更新bug引起的。

这是一个针对Windows系统的传感器配置更新,是Falcon平台保护机制的一部分。
但触发了一个逻辑错误,导致受影响的系统出现系统崩溃和蓝屏。
George Kurtz强调说“这不是安全事件或网络攻击,我们已经发现并且隔离了这个bug,还部署了修复程序”。
好巧不巧,他还补刀了一句:
Mac和Linux不受影响。
然后微软这边,CEO纳德拉也赶忙出来说明:
我们意识到了这个问题,并正在与CrowdStrike和整个行业密切合作,安全地让他们的系统重新上线。

BUT!
纳德拉的推文立即引来了马斯克的怼怼怼:
这给汽车供应链带来了困境。
至于目前Bug修复的进展,CrowdStrike今天在官网上发布了最新说明。b2b信息网

从声明中来看,受此次影响的系统包括运行Windows 7.11及更高版本,并且在昨天北京时间12:09-13:27期间下载更新了Falcon传感器配置的。
但这个配置的更新频率吧……按照官方的说法是,每天都会更新几次……
这个文件在Windows系统中的路径是:
C:\Windows\System32\drivers\CrowdStrike\
并且文件名以“ C- ”开头,每个通道文件(channel file)都分配了一个编号作为唯一标识符。

而这次出了大bug的文件,则是通道文件“291”,文件名以“ C-00000291- ”开头,以 .sys 扩展名结尾。
也正是因为Mac和Linux系统中不使用“291”通道文件,因此完美避开了这次的大宕机。
至于大家最关心的问题:啥时候能修好啊?
CrowdStrike的回答是:
我们正在进行彻底的根本原因分析。
这项工作将持续进行,并会更新原因分析。

而根据《网络安全哲学》书作者Lukasz Olejnik估计,这个大bug可能还需要几天到几周才能解决:
因为IT管理员可能必须对设备进行物理访问才能让他们重新工作。这种情况发生的速度取决于公司IT团队的规模和资源。
在某些特定情况下,某些系统可能无法恢复,但我认为大多数系统将被恢复。
不过对于这件事情,我们不能仅仅是一个看热闹的态度,还是需要痛定思痛。
正如Lukasz Olejnik追述的那般:
我们的软件具有极其的联系和相互依存性,当一个组织出现软件单一化的时候,就可能会存在大量的单点故障。
即使是像CrowdStrike这样成立了13年、已经跻身网络安全巨头的公司,手握众多公司安全命脉,曾经屡破各种重大网络攻击,也难免马失前蹄犯下如此弥天大错。
也正如环球网在今天发布的社评所述:
网络风险是一种全球性挑战,没有哪个国家能够置身事外、独善其身。
即便是世界性的互联网头部企业,也难以依靠自身力量解决系统性网络风险和危机。

△摘自环球网《“微软蓝屏”揭示出一个严峻现实》
总而言之,在科技日新月异的当下,不论是操作系统,亦或是主流大模型等等,还需谨记一点——
科技道路千万条,安全第一条。
就在这两天,还出现了非常搞笑的一些事儿和段子(暂不论真假)。
例如一位网友分享了他昨天在CrowdStrike第一天上班,然后……就下班了。

更搞笑的是,他被开除了。

还有网传的拉斯维加斯的大球(Sphere),也蓝屏了……

参考链接:[1
]https://www.theverge.com/2024/7/19/24201717/windows-bsod-crowdstrike-outage-issue
[2]https://www.theverge.com/2024/7/19/24201864/crowdstrike-outage-explained-microsoft-windows-bsod
[3]https://x.com/vinceflibustier/status/1814233715641389456
[4]https://x.com/elonmusk/status/1814334171701014848
[5]https://x.com/elonmusk/status/1814251919096811824
[6]https://www.crowdstrike.com/blog/technical-details-on-todays-outage/
[7]https://mp.weixin.qq.com/s/T2Ll9HlUYRCOZ6HkbmDsOw(责任编辑:应用开发)
自动电脑验光仪使用教程(了解自动电脑验光仪的原理与操作,实现便捷的眼部健康护理)
事故描述 老规矩,我们先看下事故过程:某日,从 6 点 32 分开始少量用户访问 app 时会出现首页访问异常,到 7 点 20 分首页服务大规模不可用,7 点 36 分问题解决。整体经
...[详细]
物联网在许多方面让人们工作和生活变得更轻松,人们在技术层面上以前所未有的方式联系在一起。但是人们需要意识到物联网的普及所产生的网络安全盲点,因为大量应用的物联网设备正在打开进入企业网络的虚拟大门。企业
...[详细]
本文介绍在国产化操作系统和服务器上进行ceph集群的安装。基础配置操作系统使用银河kylin v10,CPU为飞腾处理器S2500。复制[root@node1 ~]# cat /etc/kylin-r
...[详细]
前言 有些小伙伴在工作中,可能遇到过这样的场景:老板突然要求统计Redis中所有key的数量,你随手执行了KEYS *命令,下一秒监控告警疯狂闪烁——整个Redis集群彻底卡死,线上服务
...[详细]
概述最近个人使用的windows电脑,C盘很快爆满,又不知道是哪些文件在占用。网上有很多的文章,有的说需要磁盘清理、碎片整理、有的说是windows更新服务造成的等等。但这些无法从根本上解决问题。今天
...[详细]
根据 Omdia 最新的物联网企业调查报告显示,企业正在增加物联网 (IoT) 部署,因为它们达到或超过了投资回报率 (ROI)。这家市场研究公司最近的一项民意调查发现,90% 的企业表示他们的物联网
...[详细]深度解析iPadmini3(探究iPadmini3的关键特性及其与前代产品的差异)
在Web应用开发中,重复提交问题是一个常见的挑战。当用户由于网络延迟、误操作等原因,多次点击提交按钮时,可能会导致相同的数据被多次插入到数据库中,从而引发数据一致性问题。为了解决这个问题,我们可以采用
...[详细]