1. 程式人生 > >[2015.5.27]支付寶因杭州機房網路光纖被挖,導致數小時部分使用者業務不可用

[2015.5.27]支付寶因杭州機房網路光纖被挖,導致數小時部分使用者業務不可用

2015年5月27日,支付寶因杭州市政道路建設導致網路光纜被挖斷,使部分使用者在當天下午短時出現無法正常使用的情況,對此,支付寶官方向使用者釋出了致歉宣告,並在宣告中回覆了幾個大家關心的問題。同時,支付寶也表示,以後雖然不能保證100%杜絕此類事件的發生,但支付寶也會繼續推進技術的升級改造,繼續完善異地多活的系統架構。如果再出現類似情況,儘量做到讓使用者最小感知甚至無感知。

支付寶針對故障事件發表宣告,以下為支付寶宣告全文:

1. 5月27日傍晚,支付寶為什麼出現故障?

5月27日傍晚,因市政施工導致杭州市某地光纜被挖斷,導致了支付寶一個主要機房被影響,隨後全國部分使用者無法使用支付寶。事情發生後第一時間,支付寶工程師緊急將使用者請求切換至國內其他機房。到晚上19時左右,支付寶服務恢復正常。

2. 這次故障影響了多少使用者?

在故障時間段內使用支付寶的使用者具體數量無法精確統計,但可以肯定的是,流量通過其他機房的使用者是不受影響的。

3. 為什麼杭州的機房光纜中斷影響到全國其他地區部分使用者?

因為這次受影響的是支付寶部署在杭州的一個主要機房,服務的並不只是杭州地區的使用者,因此網路中斷導致該機房伺服器無法為受影響的使用者提供服務,這些使用者也會包括其他地區。

4. 故障會不會影響到使用者的資金安全?

支付寶有完善的技術和措施保護使用者的資金安全,使用者的資金安全不會受到任何影響。支付寶中的任何一個交易,同時都會有多份記錄,資料可靠性極高。如果有使用者出現交易不同步的情況,後續都會得到妥善解決。

5. 為什麼要這麼久才恢復?

事實上,在當晚支付寶服務恢復時,被挖斷的光纜還沒有修復。支付寶的異地多活的系統架構在此次意外中發揮了巨大作用。一方面,沒有因光纜被挖斷而影響全部使用者;另一方面,緊急將故障機房的流量切換至了其他機房。我們作為一個金融系統,對切換中資料與資金安全性的要求極高,因此切換速度上沒有做到更快。後面我們會不斷提升切換速度。但是,這並不代表我們對這次恢復時間是滿意的,我們希望未來這樣的切換能讓使用者無感知或者最小化感知。

6. 恢復使用之後,有些使用者發現餘額寶資訊顯示不全,支付寶頭像也沒有了。這是為什麼?

支付寶將流量切換至其他機房,資料的核對需要一定時間。相關的功能顯示,會有一點延時,但資料並不會丟失,這一點,請大家放一萬個心。

7. 有什麼預防機制,防止類似的情況發生?

光纜被挖斷可能並不能完全杜絕,但對於支付寶而言,會繼續推進技術的升級改造,繼續完善異地多活的系統架構。未來,即使再次出現光纜被挖斷等意外情況,我們進行異地切換時,也儘量做到讓使用者最小感知甚至無感知。