近日,互聯(lián)網(wǎng)行業(yè)遭遇重大挑戰(zhàn),谷歌云、AWS 和 Cloudflare 這三家管理著近 90% 互聯(lián)網(wǎng)活動和應(yīng)用程序的公司,幾乎同時(shí)出現(xiàn)服務(wù)中斷問題,引發(fā)了廣泛關(guān)注。?
此次故障并非局限于美國本土,谷歌云明確表示這是一個(gè)全球性問題。谷歌方面指出,由于身份和訪問管理服務(wù)(IAM)出現(xiàn)問題,導(dǎo)致 GCP(谷歌云平臺)的多個(gè)產(chǎn)品受到影響,其中包括 Gmail、Google Calendar、Google Chat、Google Cloud Search、Google Docs、Google Drive、Google Meet、Google Tasks 以及 Google Voice 等常用服務(wù)。此外,多個(gè) Workspace 產(chǎn)品也未能幸免。?
值得注意的是,這似乎并非互聯(lián)網(wǎng)本身的故障。目前尚未有關(guān)于域名系統(tǒng)(DNS)或邊界網(wǎng)關(guān)協(xié)議(BGP)故障的報(bào)告,互聯(lián)網(wǎng)流量通行基本正常。?
美國東部時(shí)間下午 3 點(diǎn) 41 分,谷歌在谷歌云狀態(tài)頁面發(fā)布消息稱,其工程師已確定了問題的根本原因,但問題尚未得到完全解決。谷歌表示:“雖然我們的工程師已確認(rèn),除 us – central1 之外的所有地方的底層依賴關(guān)系均已恢復(fù),但我們注意到,由于個(gè)別谷歌云產(chǎn)品,客戶仍在受到不同程度的影響。所有相關(guān)工程團(tuán)隊(duì)都積極投入其中,竭力恢復(fù)服務(wù)。我們目前尚無法確定預(yù)計(jì)何時(shí)會全面恢復(fù)服務(wù)?!?
與此同時(shí),AWS 健康狀況儀表板并未顯示任何異常,然而大量用戶卻報(bào)告 AWS 存在問題,且這些故障大多集中在美國東部地區(qū)。不過,AWS 回應(yīng)稱:“目前,AWS 沒有出現(xiàn)廣泛的服務(wù)問題。我們的服務(wù)運(yùn)行正常?;ヂ?lián)網(wǎng)上唯一能夠提供有關(guān)我們服務(wù)可用性的準(zhǔn)確數(shù)據(jù)的資源是 AWS 健康狀況儀表板?!?
Cloudflare 在一份聲明中表示,其許多服務(wù)遭遇了間歇性故障,但目前正在逐步恢復(fù)。受影響的 Cloudflare 服務(wù)包括 Access、WARP、Durable Objects(僅限 SQLite – backed Durable Objects)、Workers KV、Realtime、Workers AI、Stream、Waiting Room、Cloudflare 儀表板的部分、AI Gateway 以及 AutoRAG。Cloudflare 還提到:“由于重試系統(tǒng)處理和填滿緩存,我們預(yù)計(jì)受影響的服務(wù)仍會出現(xiàn)間歇性錯(cuò)誤。我們在繼續(xù)調(diào)查此事,并在評估每個(gè)服務(wù)受到的影響,屆時(shí)會發(fā)布最新消息?!?
到了美國東部時(shí)間下午 5 點(diǎn),谷歌方面?zhèn)鱽矸e極進(jìn)展。谷歌云表示:“我們已在 us – central1 和美國多個(gè)地區(qū)針對該問題實(shí)施了緩解措施,并看到了恢復(fù)的跡象。我們已收到來自內(nèi)部監(jiān)控和客戶的確認(rèn),表明谷歌云產(chǎn)品在多個(gè)地區(qū)也正在恢復(fù),在 us – central1 和美國多個(gè)地區(qū)也出現(xiàn)了一些恢復(fù)的跡象?!?此外,谷歌云預(yù)計(jì)恢復(fù)將在一小時(shí)內(nèi)完成。?
此次三大互聯(lián)網(wǎng)巨頭同時(shí)出現(xiàn)服務(wù)問題,給眾多依賴其服務(wù)的企業(yè)和用戶帶來了極大不便,后續(xù)的恢復(fù)進(jìn)展以及對互聯(lián)網(wǎng)行業(yè)的潛在影響,仍有待進(jìn)一步觀察。