茫茫網海中的冷日
         
茫茫網海中的冷日
發生過的事,不可能遺忘,只是想不起來而已!
 恭喜您是本站第 1672385 位訪客!  登入  | 註冊
主選單

Google 自訂搜尋

Goole 廣告

隨機相片
IMG_60D_00138.jpg

授權條款

使用者登入
使用者名稱:

密碼:


忘了密碼?

現在就註冊!

硬體園地 : [轉貼]IBM 服務器 ServerRaid 盤組意外失效修復實踐

發表者 討論內容
冷日
(冷日)
Webmaster
  • 註冊日: 2008/2/19
  • 來自:
  • 發表數: 15771
[轉貼]IBM 服務器 ServerRaid 盤組意外失效修復實踐
IBM服務器ServerRaid盤組意外失效修復實踐 [原創 2013-1-9 11:44:18]

在我們實際使用IBM服務器的時候,當ServerRAID發生故障是往往會導致邏輯盤掉線,下面的處理方法為IBM工程師提供,供大家在實際解決陣列時參考,解決問題主要看思路,思路正確,只要不是硬件設備損壞,我想應該是可以解決的,好了我們先來看一下解決的步驟吧。

1、由於邏輯盤已經掉線,如果硬盤數據很重要的話,務必聯繫專業的數據備份公司,替您備份出數據
2、備份好數據之後,您可以嘗試讓邏輯盤強制上線恢復.
a.使用server raid support cd引導,選擇controller 8k-l,右邊您可以看到兩個Logical driver,其中有一個有個紅X,右鍵點擊標示紅X的邏輯盤,選擇force online,讓邏輯盤恢復,稍等,看邏輯盤是否能恢復正常狀態,紅X消失.如果消失,退出,重啟服務器就可以進入操作系統.
3、如果恢復不了,建議您重建您的raid0陣列.
4、重建好陣列之後,建議您更新陣列卡的驅動和微碼至最新,硬盤微碼至最新.
5、請登陸IBM的官方網站查詢相對應的軟件升級程序。

下面的一則實際為在網上搜集整理出來的,大家也可以在實際解決問題的過程中借鑒與參考:

週末朋友打電話求助,說機器Raid完蛋了,趕了過去,開機提示logical driver offline, Ctrl+I進入Raid查看狀態:
0號盤為HSP(熱拔插),1號盤是ONL(在線),其餘兩個他拔過的盤都是DDD(故障)
問朋友機器怎麼壞掉的, 他說打掃衛生時看正在運行服務器上做Raid5的4塊SCSI硬盤(支持熱拔插)有很多灰,就準備拔出來擦灰,擦第一塊沒問題,擦完放回去這個硬盤上警示黃燈亮了,他覺的好奇又順手拔出旁邊一塊SCSI盤, 這下機器完蛋了當掉了,趕緊關閉電源重起提示找不到邏輯盤, 顯示disk reset錯誤,當時就傻眼了,一面讓朋友找IBM的ServerRaid安裝盤,一面給他解釋當機的原因:

雖然盤是支持熱拔插的,但如果不重新配置,重新插進去的盤不會自動變回在線online的,4塊盤做Raid5一般是3塊盤做Raid,一塊做冗余,壞一個盤(包括拔一個盤出來)Raid卡自動會用冗余盤替換,這時候如果再拔一個盤出來,實際上只剩下2個盤在用了,Raid5做不下去機器當然就當掉了。

由於朋友機器安裝時間較早,ServerRaid4Lx卡隨機盤找不到了,只好從其他部門借了一套高版本的ServerRaid7安裝盤,

1、插入ServerRaid7光盤後,開機加電引導:

由於光盤上firmware版本比機器裡Raid卡的版本高,進入ServerRaid管理界面前提示是否Update,選擇Cancel不升級。

原因:升級firmware可能導致機器目前操作系統中驅動和Raid固件版本不符導致不能使用,所以不能隨便就Update

2、進入ServerRaid管理,點localhost打開raid成員, 果然Raid成員中兩個SCSI盤都是錯誤的故障狀態,讓朋友確認最後拔的是3號盤後,在3號盤圖標上點鼠標右鍵選則change to online強制改回為在線狀態。

原因:由於3號盤最後拔的,系統就立即當機了,所以3號盤上內容應該是完整的

而第一個拔掉的4號盤由於Raid卡當時可能會重新組織,上面的數據有效性可能保證不了

3、保存後退出ServerRaid管理重新啟動機器(不取出光盤),重新進入ServerRaid管理,此時管理菜單右下角的進度狀態條提示正在rebuild Raid,0號硬盤狂閃,耐心等待0到3號盤重做Raid吧!

等了大約半個小時後終於做完了,雖然此時0號-3號盤上的圖標上還有!號警示,但邏輯盤肯定是已經恢復了,接著在被朋友第一個拔掉的4號盤圖標上點右鍵選擇replace new drive, 把4號盤作為新的HSP重新加入Raid組,退出ServerRaid管理,取出光盤,重新啟動機器。

系統開機提示logical driver online狀態正常,Ctrl+I看0到3號盤為ONL,4號盤為HSP, 一切正常繼續引導應用系統順利啟動,數據還好未丟失。



原文出處:IBM服务器ServerRaid盘组意外失效修复实践-dgshujwx - dgshujwx- 和讯博客
前一個主題 | 下一個主題 | 頁首 | | |



Powered by XOOPS 2.0 © 2001-2008 The XOOPS Project|