服務(wù)器更換硬盤后同步數(shù)據(jù)的過程中如果有其他硬盤出現(xiàn)故障掉線中斷同步過程,此時(shí)應(yīng)該如何處理才能恢復(fù)原來服務(wù)器內(nèi)的數(shù)據(jù)呢?下面就是DELL POWEREDGE 2850服務(wù)器RAID5硬盤掉線系統(tǒng)癱瘓的數(shù)據(jù)恢復(fù)一個(gè)案例。
DELL POWEREDGE 2850服務(wù)器,
6塊300G SCSI硬盤組成RAID5,
操作系統(tǒng)LINUX REDHAT, EXT3。
最早一塊硬盤離線,管理員沒發(fā)現(xiàn),直到另一塊硬盤掉線導(dǎo)致系統(tǒng)癱瘓才發(fā)現(xiàn)故障。聯(lián)系DELL官方客服,對方建議將其中一塊硬盤強(qiáng)制上線,但同時(shí)指出操作有風(fēng)險(xiǎn)。管理員將某盤強(qiáng)制上線后,發(fā)現(xiàn)操作系統(tǒng)啟動(dòng)異常,于是關(guān)掉服務(wù)器,聯(lián)系北亞數(shù)據(jù)恢復(fù)中心尋求幫助。
RAID5僅支持一塊硬盤掉線的冗余保護(hù),當(dāng)兩塊硬盤先后離線后,RAID5無法通過運(yùn)算提供完整數(shù)據(jù)塊,RAID5便會(huì)下線。控制器為了穩(wěn)定起見,只要有硬盤下線,便不會(huì)自動(dòng)上線,這樣不通過人為干預(yù),RAID會(huì)進(jìn)入癱瘓狀態(tài)。通常情況下,因RAID控制器的敏感性,掉線的硬盤多數(shù)不會(huì)有嚴(yán)重的物理問題,一般情況下硬盤都是完好的(掉線是因?yàn)樾盘柺茏?,電源波?dòng)或控制器BUG等隨機(jī)原因),所以數(shù)據(jù)恢復(fù)的可能性較高。強(qiáng)制上線具有較大的風(fēng)險(xiǎn),如果上線錯(cuò)誤,會(huì)導(dǎo)致控制器自動(dòng)做出一些不可逆操作,如果再進(jìn)入操作系統(tǒng),因文件系統(tǒng)不一致,會(huì)啟動(dòng)修復(fù),繼而導(dǎo)致全部硬盤數(shù)據(jù)不一致,本案例即是屬于此類問題。
1、北亞數(shù)據(jù)恢復(fù)工程師備份所有硬盤,在備份后發(fā)現(xiàn)有多塊硬盤已經(jīng)存在壞道,只是RAID沒有讀到,暫時(shí)沒有下線。
2、北亞數(shù)據(jù)恢復(fù)工程師在備份中分析原來RAID的組成結(jié)構(gòu),構(gòu)建虛擬RAID環(huán)境。
3、驗(yàn)證RAID結(jié)構(gòu)正確,修正部分后期破壞的結(jié)構(gòu)后將數(shù)據(jù)導(dǎo)出到另一中間存儲(chǔ)。
4、北亞數(shù)據(jù)恢復(fù)工程師重新用完好硬盤搭建DELL 2950上的新RAID5,將數(shù)據(jù)遷移至新RAID。
歷時(shí)2天完成數(shù)據(jù)恢復(fù)。從上千萬文件中抽樣檢測,絕大多數(shù)沒有問題。
您的電子郵件地址不會(huì)被公開,必填項(xiàng)已用 * 標(biāo)注。
? ? ? ? ? ? ? ?Copyright 2020-2026 同袍存儲(chǔ) 粵ICP備2021121885號網(wǎng)站地圖