穩健,是 Gate 持續增長的核心動力。
真正的成長,不是順風順水,而是在市場低迷時依然堅定前行。我們或許能預判牛熊市的大致節奏,但絕無法精準預測它們何時到來。特別是在熊市週期,才真正考驗一家交易所的實力。
Gate 今天發布了2025年第二季度的報告。作爲內部人,看到這些數據我也挺驚喜的——用戶規模突破3000萬,現貨交易量逆勢環比增長14%,成爲前十交易所中唯一實現雙位數增長的平台,並且登頂全球第二大交易所;合約交易量屢創新高,全球化戰略穩步推進。
更重要的是,穩健並不等於守成,而是在面臨嚴峻市場的同時,還能持續創造新的增長空間。
歡迎閱讀完整報告:https://www.gate.com/zh/announcements/article/46117
以太坊共識層連續兩晚短暫異常 網路自愈彰顯PoS韌性
以太坊連續兩晚短暫異常分析
5月11日和12日連續兩個晚上,以太坊共識層出現短暫異常。分析表明,這主要是由於某些以太坊共識層客戶端節點負載過高,導致驗證者節點宕機離線。這直接影響了Epoch投票無法達到2/3的閾值,使得共識層無法確認最終性。不過,以太坊網路在短時間內自我恢復正常,這也體現了以太坊PoS共識算法的韌性和自我修復能力。
事件回顧
通常情況下,以太坊PoS共識網路狀態會在2個Epoch內被敲定。但上周出現了兩次Epoch敲定延遲的情況:
在這期間,以太坊網路仍然持續產生區塊並處理交易。但由於驗證者節點的投票率不足,Epoch無法得到敲定,即無法獲得以太坊PoS網路的共識級別安全保證。這意味着在極端情況下,該epoch內的交易可能被回滾。
實際上,在此期間以太坊網路並未出現分叉,驗證者節點也未進行惡意投票。大量驗證者節點離線導致投票率不足是Epoch無法敲定的直接原因。觀察發現,離線的驗證者節點出現了CPU過載的異常情況。
在第二次事件中,由於敲定延遲超過了4個Epoch,觸發了以太坊共識算法的Inactivity leak機制:
原因分析
造成這一事件的直接原因是某幾種以太坊共識層客戶端節點負載過高,導致驗證者節點宕機離線,無法正常進行共識投票。具體分析如下:
當收到指向陳舊區塊的見證(Attestation)時,節點需要重新計算信標鏈狀態以驗證這些見證,這一過程會消耗大量CPU和內存資源。當同時收到大量指向陳舊區塊的見證時,節點的CPU和內存資源被耗盡,導致這些驗證者節點宕機離線。
理論上這類問題可以通過基於見證指向區塊的緩存來解決。然而,由於驗證者規模增長以及大量此類attestation的出現,導致出問題的客戶端實現的緩存被擊穿,節點不得不消耗大量資源重新計算信標鏈狀態。
共識層客戶端Teku和Prysm已推出補丁版本以解決該問題。補丁版本的客戶端實現會過濾掉這些陳舊的見證,即當滿足以下條件時忽略該見證:
以太坊設計優勢
在此次事件中,以太坊保持了可用性,持續產生區塊並處理交易,僅推遲了Epoch敲定。這主要得益於兩點:
以太坊客戶端的多樣性
雖然Teku和Prysm客戶端出現問題,但不影響其他共識層客戶端的正常運作。例如Lighthouse客戶端本次並不受影響。由於不同客戶端在實現設計上存在差異,因此仍有驗證者節點正常運作。
以太坊客戶端的多樣性確保了:即使某些客戶端出現問題(甚至導致Epoch不能敲定),也不會影響正常客戶端產生區塊並處理交易,保證了以太坊的可用性。
Gasper共識算法對可用性的設計
保證以太坊的可用性是Gasper算法設計的出發點之一,它將區塊生產與敲定分離。因此,即使區塊敲定受阻,區塊的產生並不會停止。考慮到大多數情況下區塊敲定最終會恢復,對用戶的實際影響很小。
相比之下,其他BFT共識算法在區塊敲定失敗時,共識節點會停止產出下一個區塊,導致整個區塊鏈在此期間不可用。
此外,第二次事件還觸發了Inactivity Leak機制,這一機制主要是爲了保證以太坊在極端情況(大量驗證者長時間離線)下仍能重新敲定區塊。
經驗與啓示
以太坊多客戶端的挑戰
當前以太坊客戶端多樣性仍需繼續推廣和宣傳。如果客戶端實現足夠多樣,使得Prysm和Teku的佔比小於1/3,那麼這次事件甚至不會發生(2/3客戶端正常運作足以敲定Epoch)。
此外,當某個客戶端實現出問題時,驗證者節點如何安全地切換到正常的客戶端實現也是一個需要解決的問題。這個過程涉及:
以太坊共識的監控
需要類似Safe Head的服務持續監控以太坊PoS網路的實時狀態,提前發現並預警此類事件,而不是等到Epoch無法按預期敲定才發現網路狀態異常。
以太坊共識算法的科普
這次事件暴露了科普以太坊PoS共識機制的必要性。許多用戶誤以爲"以太坊掛了",造成不必要的恐慌。實際上,以太坊網路一直在持續產生區塊並處理交易。面向用戶的區塊鏈知識科普仍然是從業者需要持續努力的方向。
對以太坊應用的啓示
雖然以太坊網路足夠健壯,但偶爾的不穩定會對應用產生一定影響。應用需要正確處理這些不穩定場景:
總結
這次事件展示了以太坊PoS共識算法的韌性與自我修復能力,以及客戶端團隊的快速響應與錯誤修正能力。對以太坊生態而言,還需在以下方面持續投入:增加客戶端多樣性,優化網路狀態的實時監控與預警,深化用戶教育,完善生態參與者在網路異常時的緊急預案。