Cloudflare CEO诚挚致歉:客户信任与网络未来受损

41 0

Cloudflare核心服务故障引发全球影响

11月19日,全球知名的网络安全公司Cloudflare遭遇了一次严重的核心服务故障,此次故障波及范围之广,甚至影响了包括X、ChatGPT在内的多个知名平台,甚至用于检测故障的Downdetector也受到了影响。有网友调侃称,这次Cloudflare的故障带走了剩下半个互联网。

故障原因及影响

故障始于11月18日协调世界时11:48左右,Cloudflare状态页最初仅显示“内部服务性能下降”,但问题迅速扩大,多地用户反映访问大量由Cloudflare支撑的网站受阻,连Access和WARP也无法正常使用。Cloudflare随后确认,机器人防护工具中的某个依赖是事故源头。 Cloudflare CTO Dane Knecht公开致歉,表示此次事故“不可接受”,并指出一次例行配置调整触发了机器人防护层崩溃。到协调世界时14:42,Cloudflare完成修复并逐步恢复服务。

Cloudflare机器人防护体系的重要性

Cloudflare的机器人防护体系包括Turnstile等挑战流程与JavaScript验证环节,直接串联在大量知名网站与API流量路径上。由于这些组件不仅拦截恶意流量,也负责放行正常用户,一旦出现故障,即便CDN或DNS核心服务完好,也足以造成全网级别的混乱。

连续宕机事件引发质疑

这次Cloudflare的故障并非个例,近一个月内,全球主流平台已经发生了多起重大宕机事故。10月,AWS的US-East-1区域因DNS配置损坏而停摆超过2小时,数天后,微软又遭遇大规模Azure宕机。 这连串事件引发更多质疑:全球主流平台在超大规模运行时,究竟能否有效隔离内部故障和系统依赖。约19%的互联网依靠Cloudflare,而Azure和AWS在云市场的占比分别约为24%与30%。

Cloudflare CEO诚挚致歉:客户信任与网络未来受损