近期,Cloudflare(简称cf)遭遇了一次严重的系统故障,据最新披露的证据显示,此次故障与数据库操作有关。具体来说,一个名为Bot Management的模块导致了此次系统宕机。当包含超过200个特性的恶意文件被传播到Cloudflare的服务器上时,系统达到了其处理限制,导致系统崩溃。更详细的分析表明,由于用户权限的扩展,响应中包含了r0模式的所有元数据,这实际上使响应中的行数翻倍,进而影响了最终文件输出的行数。此外,查询并未过滤数据库名称,随着对特定ClickHouse集群用户的显式授权逐渐展开,在11:05之后,上述查询开始返回“重复”的列,因为这些列属于存储在r0数据库中的底层表。

此次事件引发了人们对于cf内部运作以及安全防护措施的广泛关注。有用户推测,这与近期某项目成员的行为有关,该成员似乎对cf系统有着深入的了解。例如,有讨论提到一个假设性的情景,即有人潜入cf内部,编写了一个bug,并将其提交到了生产分支。此外,还有讨论提到有人计划将GPL库添加到cf代码中,尽管这引发了关于许可证兼容性的担忧。

值得注意的是,有用户在论坛中表达了对于cf内部运作的深刻理解,甚至表示已经做好了进入cf工作的准备。这些讨论和推测虽然缺乏确凿的证据,但无疑增加了人们对cf系统内部运作和安全性的好奇心。此次事件也提醒我们,对于任何大型系统,持续的安全评估和防护措施都是必不可少的。

参考资料:Cloudflare在2025年11月18日的系统故障博客文章。

标签: none

评论已关闭