今年7月以來,由馬斯克創立并運營的太空探索技術公司(SpaceX)旗下衛星互聯網服務“星鏈”(Starlink)接連發生軟件故障、服務中斷等大規模網絡故障,暴露了其在高速擴張過程中的技術與運營短板。作為全球最大的低軌衛星互聯網服務商,星鏈覆蓋140個國家、擁有600萬用戶,其故障不僅影響民生服務,更對軍事通信和商業合作造成沖擊,折射出巨型星座發展中的“成長陣痛”。
近期,我國在20天內密集發射5批低軌道組網衛星,中國版“星鏈”建設也漸入高潮。衛星互聯網太空組網有哪些風險?應該如何做好保障、確保安全可用?本文就巨型低軌道星座的安全話題,探討相關問題與應對之策。
衛星發射瞬間。圖源 Starlink
星鏈故障追因:核心網軟件問題“重復發作”
7月24日,星鏈因核心網絡軟件服務故障,導致美國、歐洲、烏克蘭等全球6.1萬用戶斷網2.5小時,烏克蘭前線軍事通信全面癱瘓(下簡稱“7月故障”)。星鏈官方承認系“內部關鍵軟件故障”,馬斯克致歉并承諾修復。時隔兩周后,8月19日,全球服務中斷信息聚合平臺Downdetector記錄到數千份中斷報告,影響范圍包括美國達拉斯、舊金山及南美、澳大利亞等地(下簡稱“8月故障”)。此次故障恰逢T-Mobile推出“星鏈直連手機”服務次日,嚴重沖擊了新業務的市場信任。
星鏈采用“衛星—地面站—核心網”三級架構,7月故障根源在于“針對地面計算集群的軟件升級程序”,因流量重分配過載引發全網癱瘓。這一事件暴露了其核心網軟件動態調度能力的不足——低軌衛星過頂時間僅3~5分鐘,需實時切換數千顆衛星,軟件模塊的耦合性缺陷極易引發連鎖反應。
盡管星鏈未官方確認8月故障與7月故障的關聯性,但從表象看,兩次故障均發生在業務高峰期(7月烏克蘭戰事緊張、8月T-Mobile新服務上線),凸顯核心網對突發流量的容錯設計存在缺陷。7月故障后,星鏈承諾進行“根因分析并修復”,但8月故障的重復發生,說明其軟件架構未實現實質性解耦(如仍依賴單一核心服務模塊)。
綜上可以認為,8月故障是7月核心網軟件問題的“重復發作”,暴露了星鏈在巨型星座調度中的軟件架構缺陷。這提示我們,星鏈需從“航天快速迭代”模式轉向“通信級可靠性設計”,才能真正提供電信級服務水平。
如何讓中國版“星鏈”更安全?
中國版“星鏈”的網絡也采用與星鏈一樣的“衛星—地面站—核心網”三級架構,可通俗理解為一個三層協作的“太空信號系統”:天上的衛星是“移動信號塔”(天基基站+傳輸節點),既能發信號又能接力傳數據;地面上的地面站是“超級中轉站”(超級基站+智能網關),負責把衛星信號接到地面;核心網則是整個系統的“大腦中樞”,負責“誰能上網”“數據往哪傳”這些關鍵環節。
馬斯克星鏈接連出現故障,許多人將質疑的目光投向天上,認為太陽活動活躍導致星鏈上的衛星軌道穩定性受到沖擊,進而影響到了通信服務的連續性。其實,考慮到星鏈上的衛星數量多,就算少數幾個“罷工”,一般也不影響整體使用;而且衛星“罷工”墜落是正常的“老化”現象,屬于可預測的硬件生命周期問題,可以提前預判,故而衛星正常隕落不會給通信造成大麻煩。
因此,“星鏈”的安全性,關鍵還是要看核心網和地面站這兩部分。
衛星互聯網示意圖。圖片由AI生成
(一)核心網的安全秘訣:“多備份、能自愈”
先說說“大腦中樞”,核心網怎么保安全?一般來講,核心網的安全秘訣是“多備份、能自愈”。就像給大腦裝了“備用零件”,出問題要能立刻補上。
其一做法是,多地備份“分大腦”。核心網不是一個孤零零的“大腦”,而是拆成了3~5個“分大腦”(區域節點)分管不同地區。它們之間可以用加密專線連起來,實時同步大家的上網信息。哪怕其中一個“分大腦”出故障,毗鄰的馬上接手,就不至于全網癱瘓。而且,“分大腦”下面還有“小大腦”(邊緣核心節點),管著更小的區域。“小大腦”出故障,“分大腦”也能直接頂上,減少問題擴散。
另一手段是,關鍵設備“一主一備”。核心網里分管用戶登錄、數據路線的關鍵設備,都要一主一備,兩套設備實時同步信息。主用的設備“宕機”,備用設備在100毫秒內就能接過來,用戶根本感覺不到。此外,負責存儲用戶信息的數據庫也要“多處備份”,就算一個地方的數據丟了,其他地方的備份能立刻補上,保證登錄、認證等不受影響。
另外,核心網還要做到“智能規劃路線,數據丟了能重傳”。作為系統的大腦中樞,核心網會和衛星系統聯動,能夠提前預知衛星什么時候飛過、從哪里飛過,進而為設備規劃最好的信號路線。要是某個“分大腦”太忙,可以自動把部分任務分給空閑節點,避免擁塞。同時,萬一數據在傳輸中丟了或者被篡改,核心網也要抓住衛星飛過的短暫時間,讓衛星重傳一次,保證數據完整。
(二)地面站安全要靠“三多”
再看地面“超級中轉站”,怎么預防故障發生?
地面站是信號從太空到地面的“第一道關口”,它的安全靠“多站點、多設備、多線路”。一句話,設備、線站“多”了,就不怕單點出問題。
具體而言,有3條原則。一是,一個區域建多個站,避開災害區。同一個地區可建2~3個地面站,分散在不同地方——比如一個在海邊、一個在山里,這樣可避免地震或臺風等極端情況到來時全軍覆沒。另外,重要的“主中轉站”要在不同大區域備份,小范圍的“中轉站”可以一個主用一個備用,主用發生故障,備用設備30秒內就能接過來。
二是,設備出現問題,備用的要立刻頂上。地面站的天線、信號處理器這些關鍵設備,都要有“備胎”。比如主天線設備故障了,備用天線很快就能自動啟動;信號處理器也要“多備一個”,一個發生故障,其他的要能立刻接過來,就像云計算一樣靈活。電源更是要正常電網、不間斷電源(UPS)、柴油發電機“三層保險”,就算停電,也能撐至少72小時設備不停機。
三是,多條數據線,斷一條換一條。地面站連到核心網的數據線,至少接兩條不同運營商的光纖。一條斷了,10秒內就要能切換到另一條;兩條都斷了,也還能靠微波、衛星傳送信號,保證“路”永遠通。
此外,系統也要實時“盯著”地面站狀態,哪個站太忙或者出現故障,就自動讓衛星把信號轉到附近的站,不會讓衛星飛過的時候“沒人接信號”。
總的來說,地面站靠“多地多設備備份”守住信號入口,核心網靠“多區域多備用”穩住全局調度,兩者配合就像給整個網絡裝上了“雙保險”——前端關口斷不了,后端大腦垮不了,共同織成一張“末梢抗斷、中樞抗毀”的安全網,讓大家用起中國版“星鏈”來更踏實。
從星鏈中汲取經驗和教訓
隨著通信事業的飛速發展,我國網絡的人口覆蓋率已超過98%,但網絡對國土面積的覆蓋率據估不超過40%,仍有大量的山地、草原、高原、戈壁、沙漠沒有網絡覆蓋。從1G模擬通信、2G數字通信、3G多媒體通信、4G寬帶多媒體通信到5G擁有的高寬帶、低時延、海量鏈接,留給6G迫切需要解決的就是無所不在的覆蓋問題,而這個問題的最終答案,筆者認為就是“衛星互聯網”。
2020年4月,國家發改委首次明確新型基礎設施的范圍,衛星互聯網被納入通信網絡基礎設施范疇。
而馬斯克的SpaceX 用實際行動向世人證明,火箭發射可以像汽車加油那樣重復使用,衛星制造也可以用流水線作業,衛星的價格可以降到數十萬美元量級,衛星發射可以一箭數十顆星排隊上天……所有一切能夠將衛星拉下“神壇”,真正為普通大眾服務的理想,都是非常有現實意義的。
回過頭來看此番SpaceX星鏈系統故障,給我們的啟發不少。馬斯克的航天實踐,堪稱對傳統思維的顛覆性突破。他以第一性原理為綱,將互聯網快速迭代邏輯注入航天領域,通過可重復使用火箭、巨型低軌星座星鏈等開創性探索,成功構建商業閉環,其成就值得稱道。但面向6G天地一體化無線泛在網絡,要提供電信級服務品質,星鏈在可靠性、穩定性等方面仍需補齊短板。
我國作為“追趕者”,既要深入汲取星鏈快速迭代、商業閉環的成功經驗,也要針對性規避其在網絡安全、服務連續性等方面的教訓,秉持成本與可靠性平衡原則,打造中國版“星鏈”,為我國下一代空天地網絡及“一帶一路”空天信息之路筑牢根基。
(作者謝鷹系互聯網協會特聘專家、宇航學會衛星應用專委會委員、中訊郵電咨詢設計院有限公司首席衛星專家,本報記者趙廣立編輯整理)
本文鏈接:“星鏈”故障連發,對中國衛星互聯網有何啟示?http://www.sq15.cn/show-11-24963-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。