所有硬件都可能發(fā)生故障。大多數(shù)情況下,如果操作違反要求和標(biāo)準(zhǔn),硬件就會受到影響,負(fù)載過多。為了防止可能出現(xiàn)的問題,您應(yīng)該知道導(dǎo)致問題的原因以及如何解決服務(wù)器問題。
每個數(shù)據(jù)中心都提供一套軟件來監(jiān)控服務(wù)器的正確運行。通過不斷掃描網(wǎng)絡(luò),可以檢測到異常情況和可能的系統(tǒng)故障。
典型的服務(wù)器問題:
頁面加載速度降低,時間超過三秒;
由于病毒或網(wǎng)絡(luò)黑客造成的安全漏洞;
流量過大,導(dǎo)致服務(wù)器損壞;
硬件或軟件故障;
由于不可預(yù)見的事件(火災(zāi)、重大網(wǎng)絡(luò)攻擊、自然災(zāi)害)導(dǎo)致的服務(wù)器完全故障。
故障可能是由于疏忽造成的,即:
設(shè)備的物理損壞;
節(jié)省防電涌設(shè)備的費用;
使用普通PC作為服務(wù)器;
由于服務(wù)器機房缺乏適當(dāng)?shù)睦鋮s而導(dǎo)致過熱;
缺乏備用電源(AVR)。
技術(shù)故障:
服務(wù)器硬盤故障;
超過 ATS 的允許負(fù)載;
廉價電纜的燒毀;
不間斷電源電池的磨損。
人為因素:
硬件連接和配置錯誤;
安裝未經(jīng)許可的軟件、禁用防火墻、未經(jīng)授權(quán)訪問數(shù)據(jù)中心。
為了最大限度地減少服務(wù)器問題的后果,您必須:
定期備份;
創(chuàng)建容錯集群;
實施專的監(jiān)測綜合體;
對設(shè)備進(jìn)行預(yù)防性維護;
保持必要的冷卻水平,使用不間斷電源;
聯(lián)系專業(yè)人士而不是試圖自己解決問題。
此外,為了解決服務(wù)器問題,需要:
查看事件日志;
驗證物理硬件的完整性;
檢查硬盤錯誤,運行防病毒和內(nèi)存測試;
確保正確使用磁盤空間。
當(dāng)服務(wù)器出現(xiàn)問題時,深入了解如何修復(fù)它而不是造成更大的傷害非常重要。服務(wù)器故障排除人員有能力執(zhí)行全方位的修復(fù)工作、數(shù)據(jù)恢復(fù)、服務(wù)維護、防篡改、監(jiān)控、預(yù)防和升級。
在大型數(shù)據(jù)中心,此類問題幾乎不常見。所有服務(wù)都受到監(jiān)管,并創(chuàng)造必要的條件,以確保設(shè)備的容錯能力。
IT 基礎(chǔ)設(shè)施的安全是企業(yè)的首要任務(wù)??煽康臄?shù)據(jù)中心可以解決大多數(shù)問題,確保高容錯性和網(wǎng)絡(luò)安全。所有合作條款均在 SLA 合同中描述。