系統故障應急預案

才智咖 人氣:2.13W

引導語:應急預案指面對突發事件如自然災害、重特大事故、環境公害及人為破壞的應急管理、指揮、救援計劃等。下面是本站小編為大家精心整理的系統故障應急預案,歡迎閱讀!

系統故障應急預案

資訊系統故障應急預案

第一章 總 則

第一條 為提高應對資訊系統在執行過程中出現的各種突發事件的應急處臵能力,有效預防和最大程度地降低資訊系統各類突發事件的危害和影響,保障資訊系統安全、穩定執行,根據國家《資訊保安事件分類分級指南》、《資訊技術、安全技術、資訊保安事件管理指南》、《國家突發公共事件總體應急預案》及有關法律、法規的規定,結合實際,制定本處理預案。

第二條 本處理預案所稱的資訊系統,由計算機裝置、網路設施、計算機軟體、社會保險資料等組成。

第三條 資訊系統突發事件分為網路攻擊事件、資訊破壞事件、資訊內容安全事件、網路故障事件、軟體系統故障事件、災難性事情、其他事件等八類事件。

(一)網路攻擊事件:通過網路或其他技術手段,利用資訊系統的配臵缺陷、協議缺陷、程式缺陷或使用暴力攻擊對資訊系統實施攻擊,並造成資訊系統異常或對資訊系統當前執行造成潛在危害的事件。

(二)資訊破壞事件:通過網路或其他技術手段,造成資訊系統中的資料被篡改、假冒、洩漏等而導致的事件。

(三)資訊內容安全事件:利用資訊網路釋出、傳播危害國家安全、社會穩定和公共利益的不良資訊內容的事件。

(四)網路故障事件:因電信、網路裝置等原因造成大部分網路線路中斷,使用者無法登入資訊系統的事件。

(五)伺服器故障事件:因系統伺服器故障而導致的資訊系統無法執行的事件。

(六)軟體故障事件:因系統軟體或應用軟體故障而導致的資訊系統無法執行的事件。

(七)災害性事件:因不可抗力對資訊系統造成物理破壞而導致的事件。

(八)其他突發事件:不能歸為以上七個基本分類,並可能造成資訊系統異常或對資訊系統當前執行造成潛在危害的事件。

第四條 按照造成資訊系統的中斷執行時間,將資訊系統突發事件級別劃分為一般(IV級)、較大(III級)、重大(II級)、特別重大(I級)。

(一)一般(IV級):資訊系統發生可能中斷執行2小時以內的故障;

(二)較大(III級):資訊系統發生可能中斷執行2小時以上、12小時以內的故障;

(三)重大(II級):資訊系統發生可能中斷執行12小時以上、24小時以內的故障;

(四)特別重大(I級):資訊系統發生可能中斷執行24小時以上的故障。

第二章 組織機構和工作職責

第五條 預防和處理資訊系統突發事件工作協調小組(以下簡稱“應急小組”)負責資訊系統應急處理工作,決定資訊系統應急處理工作的重大事項,組織實施、業務協調和釋出資訊系統應急指令,釋出資訊系統應急故障級別、決策處理方案。應急小組組長由分管資訊科技工作的領導擔任,成員為資訊科技科全體人員

第三章 預防與預警機制

第七條應急小組針對各種可能發生的資訊系統突發事件,建立和完善預測預警機制。

第八條 預警資訊分為外部預警資訊和內部預警資訊兩類。外部預警資訊指資訊系統外突發的可能需要通訊保障、安全防範,或可能對資訊系統產生重大影響的事件警報。內部預警資訊指資訊系統網內的事故徵兆或區域性資訊系統突發事故可能對其他或整個網路造成重大影響的事件警報。

第九條應急小組要加強對資訊系統的日常監測工作。監測的內容主要包括:

(一)區域網通訊效能與流量;

(二)網路裝置和安全裝置的操作記錄、網路訪問記錄;

(三)伺服器效能、資料庫效能、應用系統性能等執行狀態,以及備份存貯系統狀態等;

(四)伺服器作業系統、資料庫安全審計記錄、業務系統安全審計記錄;

(五)計算機漏洞公告、網路漏洞掃描報告;

(六)病毒公告、防病毒系統報告;

(七)其他可能影響資訊系統的預警內容。

第十條 應急小組獲得外部重大預警資訊或通過監測獲得內部預警資訊後,應對預警資訊加以分析,按照早發現、早報告、早處臵的原則,對可能演變為嚴重事件的情況,部署相應的應對措施,通知相關部門做好預防和保障應急工作的各項準備工作,並及時報告所領導。

第四章 應急響應程式

第十一條 資訊系統使用單位或人員發現資訊系統突發事件後,應及時報告應急小組。應急小組及時組織相關人員查詢故障原因,在短時間內(一般要在半小時以內)依據故障情形和修復時間進行初步判別,確定故障分類級別,較大(III級)及其以上的突發事件應報告所領導。

第十二條 資訊系統突發事件發生後,根據突發事件嚴重程度,由所領導決定並指定特定小組或人員及時向新聞媒體釋出相關資訊,所指定的.小組或人員應嚴格按照所領導規定及要求對外發布資訊,其他部門或個人不得擅自接受新聞媒體採訪或對外發布自己的看法和意見。

第十三條 發生較大(III級)及其以上資訊系統突發事件時,應急小組除向所領導報告外,應立即通知各業務部室。各業務部室應在各業務大廳張貼告示牌,同時做好服務物件的解釋和疏導工作,並儘可能通過電話、網路、簡訊等方式通知參保單位經辦人員。

第十四條 根據不同的事件以及事件的級別,採取相應措施進

行應急處理。突發事件處理過程中,可以根據需要調整故障級別。

(一)網路攻擊事件應急預案:

1.當發現網路被非法入侵、網頁內容被篡改,應用伺服器的資料被非法拷貝、修改、刪除,或有黑客正在進行攻擊等現象時,使用者或管理者應斷開網路,並立即報告應急小組。

2.應急小組立即關閉相關伺服器,封鎖或刪除被攻破的登陸帳號,阻斷可疑使用者進入網路的通道,並及時清理系統、恢復資料和程式,儘快將系統和網路恢復正常。

(二)資訊破壞事件應急預案:

1.當發現資訊被篡改、假冒、洩漏等事件時,資訊系統使用單位或個人應立即通知應急小組。

2.如被篡改或被假冒的資料正在徵繳或發放過程中,應急小組應立即通知代收代發機構中止徵繳或發放工作。

3.應急小組通過跟蹤應用程式、檢視資料庫安全審計記錄和業務系統安全審計記錄查詢資訊被破壞的原因和相關責任人。

4.應急小組提出修正錯誤方案和措施,通知各業務部室進行處理。

(三)資訊內容安全事件應急預案:

1.當發現不良資訊或網路病毒時,系統使用人員立即斷開網線,終止不良資訊或網路病毒傳播,並報告應急小組。

2.應急小組根據情況通告區域網內所有計算機使用者,隔離網路,指導各計算機操作人員進行防毒處理、清除不良資訊,直至網路處於安全狀態。

軟體系統故障應急預案

發生緊急故障時的判斷及處理:

發生伺服器軟體系統故障後,客戶如果未簽訂伺服器系統維護協議,在伺服器重啟未能解決的情況下,通知客戶經理和客戶自行處理。若已經簽訂伺服器系統維護協議的客戶,伺服器管理員應立即對伺服器進行檢視,分析故障原因,採取相應措施;必要時,儲存系統狀態不變,取出系統映象備份磁碟,保持原始資料,進行快速恢復。如果沒有恢復磁碟,應優先檢查故障原因進行解決,如果無效,再客戶同意的情況下以最新資料備份恢復的方式進行或採取其他措施。 伺服器軟體故障

伺服器軟體故障包括:作業系統故障,應用軟體故障,病毒黑客攻擊等。

其他注意事項:

事態或後果嚴重的,及時上報公司領導。

處置結束後, 系統管理員應將事發經過、處置結果等結束後一日內備案存檔。

採取的技術措施:

在故障發生後立即檢視伺服器系統狀態,如果是系統軟體出現故障,並且能進入系統,且可以清晰定位故障原因,並可以立即排除,那麼立即進行排除。如果估計在1小時之內都不能定位故障原因,那麼報告客戶經理和客戶,同時聯絡廠商及技術支援協助排除,或根據技術支援的建議進行重新安裝作業系統和應用系統。排除作業系統故障的方法,檢查作業系統程序是否都正常,有無非法程序,作業系統檔案有無損壞丟失,是否受到病毒和木馬程式侵害,黑客攻擊。

如果不是作業系統故障,應該對應用系統進行仔細檢查,檢查方法,檢視應用系統程式碼和資料是否被破壞,損壞,丟失,如果丟失,從正確的備份進行恢復。

平時需做的準備工作:

A、 作業系統和相關配置定期備份。

B、 相關應用系統及資料定期備份。

C、 必要的情況下準備備用域名。

D、 確保備份資料做到三方備份(本地伺服器,其他伺服器,

異地伺服器)。

E、 做好備用伺服器的搭建及定期測試。

成立應急預案小組成員及分工:

楊勝靈 負責整體技術把控、技術支援及開發人員臨時緊急調配。

孫道斌 負責網站、網站設計相關技術支援及設計人員臨時緊急調配。

宮元 負責客戶、域名及域名解析相關事宜。

李俊 負責機房及伺服器相關技術整體把控,相關維護管理人員的臨時緊急調配。

張尊園負責電信及電信危機公關的處理。