HACMP認證知識:應用程式監視

才智咖 人氣:1.36W

除了資源組管理以外,HACMP 還可以通過以下兩種方法之一監視應用程式:

HACMP認證知識:應用程式監視

應用程式程序監視:使用 RSCT 事件管理功能檢測程序是否終止。

應用程式自定義監視:基於您定義的監視方法(程式或指令碼)來監視應用程式的執行狀況。

注意:不能將應用程式程序監視用於監視通過 Shell 指令碼啟動的應用程式,或那些監視程序無法確定應用程式執行狀況的應用程式。

對於監視 Shell 指令碼應用程式,必須使用自定義監視方法(例如,Apache Web 服務器)。

當應用程式監視處於活動狀態時,HACMP 的行為如下:

對於應用程式程序監視,一個核心 hook 將通知 HACMP 叢集管理器所監視的程序已終止,HACMP 將啟動應用程式恢復過程。

要使恢復操作能夠進行,必須提供某種方法來清理和重新啟動應用程式(可以使用為應用程式伺服器定義提供的應用程式啟動/停止指令碼)。

HACMP 嘗試重新啟動應用程式,並等待應用程式穩定指定的時間,然後傳送通知訊息和/或實際將整個 RG 移動到另一個節點(節點優先順序列表中的下一個節點)。

對於自定義應用程式監視(自定義方法),除了應用程式清理和重新啟動方法以外,還必須提供用於執行定期應用程式測試的程式/指令碼。

要規劃程序監視器的配置,請檢查以下事項:

驗證該應用程式是否可以使用某個程序監視器進行監視。

檢查要監視的程序的名稱。必須使用準確的程序名稱來配置應用程式監視器。

指定擁有程序的使用者名稱,例如 root。請注意,該程序擁有者必須擁有要監視的所有程序。

指定要監視的應用程式的.例項數量(程序數量)。預設為一個例項。

指定在開始監視前的等待時間(以秒為單位)。

注意:在大多數情況下,此值不應該為零。例如,對於資料庫應用程式,您可能希望將監視延遲到啟動指令碼和初始資料庫搜尋已完成之後。

重新啟動數值,表示在採取任何其他操作之前嘗試重新啟動應用程式的次數。

在重置重新啟動數值前應用程式必須保持穩定的間隔(以秒為單位)。

要在應用程式無法在重新啟動數值內重新啟動時採取的操作。預設選擇是通知,即執行一個事件來向叢集通知故障情況。還可以指定故障轉移,在此情況下,包含故障應用程式的資源組將移動到對該資源組擁有下一個最高優先順序的叢集節點。

重新啟動方法(如果希望的話)。(如果“Restart Count”不為零,則這是必需的。)

如果計劃建立自定義監視方法,則還要檢查:

是否已指定了要用於檢查指定應用程式的程式/指令碼。

關於執行該監視方法的頻度的輪詢間隔(以秒為單位)。如果監視器在此間隔內沒有響應,則認為應用程式出錯,並啟動恢復過程。

在使用者定義的監視方法未在輪詢間隔內返回時用於終止該監視器方法的訊號。預設訊號為 SIGKILL。

開始監視前的等待時間(以秒為單位)。例如,對於資料庫應用程式,建議將監視延遲到啟動指令碼和初始資料庫搜尋已完成之後(否則,可能會認為應用程式出錯並啟動恢復過程)。

重新啟動數值,即在採取任何其他操作之前嘗試重新啟動應用程式的次數。

在重置重新啟動數值前應用程式必須保持穩定的間隔(以秒為單位)。

在應用程式無法在重新啟動數值內重新啟動時採取的操作。