上週,Microsoft 確認發生了數小時的中斷,導致用戶無法訪問 Azure、Microsoft Teams 和其他 Microsoft 365 服務。此後,該公司發布了一份初步事後報告,向客戶更新有關問題的根本原因。
Microsoft 解釋說,中斷是由 1 月 25 日計劃維護更新期間路由器 IP 地址更改引起的。它中斷了客戶端設備和 Azure 之間的連接。該問題影響了 Exchange Online、Teams、Outlook、OneDrive for Business、SharePoint Online、Microsoft Intune、PowerBi、Microsoft Graph、M365 管理門戶、Microsoft Defender for Identity 和 Microsoft Defender for Cloud Apps。
“作為作為更新 WAN 路由器上 IP 地址的計劃更改的一部分,向路由器發出的命令導致它向 WAN 中的所有其他路由器發送消息,這導致所有這些路由器重新計算它們的鄰接關係和轉發表。在此重新計算過程中,路由器無法正確轉發穿過它們的數據包,”微軟在 Azure 狀態歷史記錄頁面上寫道。
微軟採取了防止全球 Microsoft 365 中斷的主動方法
Microsoft 的工程師審查了最近的更改並確定了導致域名服務 (DNS) 和 WAN 問題的有問題的命令。該公司後來回滾了網絡更改,以緩解全球所有 Microsoft 365 租戶的問題。
在停機四個多小時後,Microsoft 的服務於世界標準時間 1 月 25 日 12:43 左右完全恢復在線。該公司證實,全球中斷也影響了 Azure 政府雲服務。
微軟強調,它已經採取了一些措施來防止未來發生類似事件。它已阻止所有影響很大的命令在網絡設備上運行。展望未來,設備上的所有命令執行都必須遵守安全更改指南。 Microsoft 打算在未來幾週內發布最終的事故後報告。