使用目標導向 SLA 排程

附註: 此特性已淘汰,並可能在未來版本的 LSF中移除。

目標導向 SLA 排程原則可協助您配置工作量,以便準時完成工作。 它們可讓您專注於專案的「內容及時間」,而不是需要配置資源以滿足各種工作量的低階詳細資料。

LSF 中的服務水準合約

服務等級協定 (SLA) 定義如何交付服務,以及服務交付的參數。 它指定服務提供者與服務收件者同意的內容,定義提供者與收件者之間與許多問題相關的關係,其中包括:

  • 要提供的服務

  • 效能

  • 追蹤和報告

  • 問題管理

LSF 中的 SLA 是「即時」排程原則,定義 LSF 管理者與 LSF 使用者之間的合約。 SLA 排程原則定義應該從每一個 SLA 執行多少工作,以符合所配置的目標。

服務類別

SLA 定義包含以個別服務類別表示的服務水準目標。 服務類別是實際配置的原則,用來設定 LSF 系統的服務水準目標。 SLA 定義工作量 (工作或其他服務) 及需要完成工作的使用者,而處理 SLA 的服務類別則定義個別目標,以及服務類別處於作用中的時間範圍。

服務水準目標可以分成兩個互斥的類型: 保證目標是資源型的,以及時間型目標,包括速度、傳輸量及截止時間目標。 時間型目標可讓您控制在任何時間執行的工作數目,而資源型目標可讓您控制資源配置。

服務水準目標

您可以配置下列類型的目標:

截止時間目標

應在指定時間範圍內完成指定數目的工作。 例如,執行週末提交的所有工作。 截止時間目標以時間為基礎。

速度目標

表示為並行執行中工作。 例如: 在 9:00 a.m之間維護 10 個執行中工作。 及 5:00 p.m。 速度目標非常適合短期工作 (執行時間小於一小時)。 這類工作快速離開系統,且配置速度目標可確保工作在系統中穩定流動。

傳輸量目標

以每小時已完成的工作數表示。 例如: 在 6:00 p.m之間,每小時完成 15 個工作。 及 7:00 a.m。 傳輸量目標適用於中到長時間執行的工作。 這些工作在系統中的停留時間較長,因此您通常想要控制其完成率,而不是其流程。

合併目標

您可能想要設定速度目標,以將白天的快速工作最大化,並設定截止時間及傳輸量目標,以管理夜間及週末執行較長的工作。

服務類別如何執行目標導向排程

目標導向排程會利用其他較低層次的 LSF 原則 (例如佇列及主機分割區) ,來滿足服務類別所表示的服務層次目標。 在任何佇列或主機分割區決策之前,會先考量服務類別的決策。 對於較低層次的排程物件 (例如佇列、主機及使用者) ,仍會施行限制。

執行中工作的最佳數目

提交工作時, LSF 會決定服務類別達到其服務水準目標所需的最佳工作槽數 (或同時執行的工作)。 LSF 排程的工作數目至少等於針對服務類別所計算的最佳時段數目。

LSF 會嘗試以最有效的方式符合 SLA 目標,並使用最佳的工作時段數目,以便叢集中其他服務類別或其他類型的工作仍可進行。 例如,在定義截止時間目標的服務類別中, LSF 會針對目標在整個時間範圍內展開工作,這可避免在截止時間之前開始配置儘可能多的時段來封鎖其他工作。

將工作提交至服務類別

使用 bsub -sla service_class_name 將工作提交至服務類別,以進行 SLA 驅動的排程。

您可以像對佇列一樣向服務類別提交工作,但服務類別是更高層次的排程原則,可利用其他較低層次的 LSF 原則 (例如佇列及主機分割區) 來滿足服務類別所表達的服務層次目標。

例如:

% bsub -W 15 -sla Kyuquot sleep 100

將 UNIX 指令 sleep 及其引數 100 當作工作提交至名為 Kyuquot 的服務類別。

要執行工作的服務類別名稱配置在 lsb.serviceclasses中。 如果 SLA 不存在,或使用者不是服務類別的成員,則會拒絕工作。

在所配置的時間範圍之外, SLA 處於非作用中狀態,且 LSF 會排程工作而不強制執行任何服務水準目標。 即使使用 -sla提交工作,工作也會遵循佇列優先順序來流經佇列。

以執行限制提交

您應該以執行時間限制 (-W 選項) 提交工作,或佇列應該指定執行時間限制 ( lsb.queues中佇列定義內的 RUNLIMIT)。 如果您沒有指定執行時間限制, LSF 會根據觀察到已完成工作的執行時間,自動調整執行中工作的最佳數目。

-sla 和 -g 選項

-g 選項不能與 -sla搭配使用。 工作可以連接至工作群組或服務類別,但不能同時連接兩者。

修改 SLA 工作 (bmod)

請使用 bmod 的 -sla 選項來修改附加工作的服務類別,或將提交的工作附加至服務類別。 使用 bmod -slan 從服務類別分離工作。 例如:

% bmod -sla Kyuquot 2307

將工作 2307 連接至服務類別 Kyuquot。

% bmod -slan 2307

從服務類別 Kyuquot 分離工作 2307。

您無法:

  • -sla 與其他 bmod 選項搭配使用。

  • 修改已連接至工作群組之工作的服務類別。