今年10月,港鐵發生信號故障,這是自香港啟用地鐵以來來,第一次發生四大線路同時出現信號故障,導致早高峰時段全城癱瘓近6小時。
?
港鐵于對外透露信號故障起因,經調查,故障與各列車線的電腦互相自行同步數據的程序及設定有關,由于信號系統在各區間的電腦不斷有大量數據傳輸及互相同步情況,占用電腦大量計算資源令區間電腦變得不穩定;此次信號故障與荃灣線信號系統更新測試無關,工程人員已成功將新信號系統轉回現有系統,新系統與現有系統完全分隔;另外,也排除了人為因素。此外,港鐵承認,由確認不能及時修復系統到發出紅色警報有半小時延誤。?
? ? ??至于為什么需要近6小時才完成臨時修復,港鐵解釋,信號系統由中央控制,并在車站區間有計算機運作,當港鐵人員發現系統出現問題后,需逐一跟進各線合計20多個區間計算機,逐一重置恢復自動操作服務。
? ? ?復盤此次港鐵信號故障經過、處置和原因分析,中國軟件評測工業產品系統測評工程中心從管理和技術兩方面提出幾點建議,供相關管理部門、運營單位和評測機構參考。??
1 在管理方面
一是運營單位要做好應急預案和應急演練,尤其是提升對繁忙時段影響人數多、范圍廣的故障響應能力,力爭做到第一時間發現、第一時間處置;二是在故障處置和運營恢復期間,運營單位要分時段及時對外發布故障修復進展,以及當前地鐵運行間隔時間和額外行車時間;三是運營單位要責令設備供應商和集成服務商提供事故分析的詳實報告,明確原因、責任到人,避免出現廠商間互相推諉、故障原因不明、系統帶病運行;四是管理部門做好輿情管控,避免出現“多線故障目的是售票加價”等嚴重偏離事實真相的流言傳播。
2 在技術方面
一是新系統測試環境應與在役系統物理隔離或嚴格邏輯隔離,避免測試影響在役系統的實時歷史數據和通信網絡;二是新系統與在役系統并行運行時,要全面考慮切換過程中的不可預見風險,例如傳輸途中的指令再下達、切換完成時數據的初始化和隨機賦值等;三是針對區間電腦信號系統數據傳輸及同步、大量計算資源占用、磁盤陣列用盡等導致電腦不穩定的問題,需第三方評測機構開展嚴格的專項測評,確認問題、落實整改,避免類似情況的出現;四是重點關注不同廠商信號系統的兼容互通、穩定運行,隨著交控科技、浙江眾合等國產品牌在新線建設市場占有率的上升,與傳統泰雷茲、卡斯柯等廠商系統要實現穩定對接,逐步替換。
作者:陳曦
版權所有:鄭州三中網安科技有限公司 豫ICP備2020036495號-1 ?? | 豫公網安備 41019702002241號 | 站點地圖 | 人才招聘 | 聯系我們 |