更換主機板: 2145-DH8

在安裝新主機板期間,重複使用在卸下主機板時卸下的所有元件。

開始之前

機器序號或節點序號位於 SAN Volume Controller 2145-DH8 正面的 MT-M SN 標籤上。在製造節點時,還將其寫入了主機板以及每個啟動磁碟機。系統軟體啟動時,它會從主機板讀取節點序號,並將其用作此節點的面板 ID。在許多位置皆可查看面板 ID,例如,在服務助理 GUI、管理 GUI 以及許多 CLI 指令輸出中。

如果使用 FRU 零件來更換主機板,則主機板的機器序號將為 0000000,SAN Volume Controller 2145-DH8 節點的 panel_id 將為 0000000。這將與每個啟動磁碟機中儲存的節點序號不符,從而導致節點錯誤 545。如果每個啟動磁碟機中的節點序號副本皆不符,則節點錯誤為 543。以下將說明修正這些節點錯誤的程序。

請確定下列項目可用:
  • 可能需要 VGA 監視器及 USB 鍵盤。
  • 適用於節點的電源線,以便在節點離開機架時可將其開啟。
  • 具有乙太網路埠及 Web 瀏覽器的電腦,可直接連接至技術人員埠以便存取服務助理 GUI。需要具有 Ssh 功能的軟體才能存取 CLI (PuTTY)。
  • 需要酒精棉及散熱膏才能正確更換微處理器。更換主機板時必須卸下微處理器。
註: 重新裝配節點中的元件時,請小心拉好所有纜線,避免過度擠壓。
危險
多條電源線。本產品可能配有多條 AC 電源線或多條 DC 電源纜線。若要切斷所有危險電壓,請拔除所有電源線及電源纜線。(L003)
多個插頭:第一組
多個插頭:第二組
多個插頭:第三組

關於這項作業

此維修動作假設:
  • 節點關閉。
  • 電源線已中斷連線。
  • 已從機架中卸下節點。
  • 已卸下上蓋。
  • 已卸下空氣擋板。
  • 已卸下 PCI Express 擴充卡組件。
  • 已拔除連接至電池背板的纜線。
  • 已卸下主機板。
  • 新的主機板來自 FRU 庫存,不得來自其他 SAN Volume Controller 2145-DH8 或任何其他機器。
  • 避免同時更換兩個啟動磁碟機,否則在沒有 IBM 遠端技術支援的協助下,將無法進行回復。

請執行下列步驟來安裝主機板:

程序

  1. 以適當的角度對齊主機板,如圖 1 中所示。
  2. 旋轉並放低主機板以使其水平,然後將其朝伺服器背面滑回。請確定背面的連接器穿過機箱背面。
    圖 1. 更換 SAN Volume Controller 2145-DH8 主機板
    更換 SAN Volume Controller 2145-DH8 主機板
    •  1  插銷
    •  2  翼型螺絲
  3. 重新連接您已拔掉的主機板纜線。
  4. 朝伺服器背面旋轉主機板翼型螺絲,直到閂鎖發出卡嗒聲。
  5. 重新安裝微處理器和散熱槽,如更換微處理器: 2145-DH8 所述。
  6. 重新安裝 DIMM,如更換記憶體模組: 2145-DH8 所述。
  7. 重新安裝風扇托架,如「更換 SAN Volume Controller 2145-DH8 風扇托架」中所述。
  8. 重新安裝熱抽換風扇,如「更換 SAN Volume Controller 2145-DH8 風扇」中所述。
  9. 重新安裝空氣隔板。
  10. 重新安裝電源供應器裝置。
  11. 裝回 PCI Express 擴充卡組件。
  12. 請確定所有纜線、配接卡和其他元件皆已安裝和安置正確,且節點內沒有鬆脫的工具或零件。請確定所有內部纜線的佈設正確。如果拔掉「光纖通道」和乙太網路纜線,請確定每一條纜線要重新連接至原來移除的相同埠。
  13. 裝回上蓋板。請參閱裝回上蓋
  14. 如果已拔除任何光纖通道纜線、SAS 纜線或乙太網路纜線,請利用您貼在每條纜線上的標籤,將纜線連接至先前將其從中拔除的相同埠。
  15. 裝回電源線及纜線固定托架。
  16. 提起滑軌上的鎖定桿(圖 2 中的  1 )並將伺服器  2  一直推入機架直到它卡入到位。
    圖 2. 升起機架滑軌的 SAN Volume Controller 2145-DH8 鎖定桿
    升起機架滑軌的 SAN Volume Controller 2145-DH8 鎖定桿
  17. 開啟節點。等待節點狀態 LED 保持穩定至少 5 分鐘,然後再採取進一步動作。
    如果您是完成此程序的客戶服務代表,則此程序最長可能需要 2 小時才能完成。
    附註:
    • 如果節點狀態、節點故障及電池狀態 LED 保持熄滅超過 5 分鐘,請連接監視器及 USB 鍵盤以變更預設開機順序。
    • 如果修復成功,則節點故障 LED 會亮起,且對於此節點,將會在服務助理 GUI 中看到節點錯誤 545:
      附註:
      • 節點錯誤 545 表示主機板中用於 panel_id 的節點序號,與兩個啟動磁碟機的每個磁碟機中儲存的節點序號皆不符。
      • 使用服務助理 GUI 或 sainfo lsbootdrive CLI 指令進行確認。
        • 主機板中的節點序號是顯示為 panel_id 的 0000000(即七個零)。
        • 每個啟動磁碟機槽的節點序號與此節點正面 MT-M SN 標籤上找到的序號完全相同。
      • 如果符合上述兩個條件,則使用服務助理 GUI 或下列 CLI 指令來變更主機板中的節點序號:

        satask chvpd -type 2145-DH8 -serial <the SN value on the MT-M SN label>

      • 節點會重新開機。
      • 如果沒有節點錯誤,則節點會啟動並重新加入系統(如果它先前是在系統中)。如果節點已重新加入系統,則節點狀態 LED 會亮起。
    • 如果顯示節點錯誤 543 而非節點錯誤 545,請檢查下列各項:
      附註:
      • 當主機板中的節點序號為 0000000 時,節點錯誤 543 表示每個磁碟機中的節點序號副本皆不符。例如,在因為啟動磁碟機遺漏而無法從中讀取節點序號時。
      • 使用服務助理 GUI 或 sainfo lsbootdrive CLI 指令來查看每個啟動磁碟機槽的狀態。請參閱啟動磁碟機問題以決定下一步做什麼。
      • 例如,如果 sainfo lsbootdrive 的輸出顯示:
        • 主機板中的節點號碼是顯示為 panel_id 的 0000000(即七個零)。
        • 有一個啟動磁碟機槽的節點序號與此節點正面 MT-M SN 標籤上找到的序號完全相同。
        • 另一個啟動磁碟機槽的狀態為 uninitialized
      • 如果符合上述三個條件,則僅使用服務助理 GUI 或下列 CLI 指令來起始設定未起始設定的啟動磁碟機:

        satask rescuenode

      • 節點會重新開機
      • 對於此節點,將會在服務助理 GUI 中顯示節點錯誤 545
      • 如上所述,寫入節點序號。
    • 如果修復成功,但節點在關閉之前無法儲存其狀態資料,則節點將顯示節點錯誤 578。請遵循使用管理 GUI 從叢集系統中刪除節點中的程序,從叢集中刪除節點,然後再將其新增回叢集。如果多個節點發生故障,請確保將該節點新增回其原始 I/O 群組。