按照計算機故障性質(zhì)可以將網(wǎng)絡(luò)故障分為硬件故障和軟件故障兩大類。在計算機發(fā)生故障時通常應(yīng)該首先查看硬件,當(dāng)排除了硬件故障后,再查看軟件問題。
故障診斷作為一項比較復(fù)雜的工作,并沒有一個通用的法則可以遵循。但是,許多網(wǎng)絡(luò)管理員在長期與故障打交道的過程中,積累了豐富的經(jīng)驗,并提出了故障診斷的一般步驟,這個步驟如下。
• 分析故障現(xiàn)象。
• 定位故障范圍。
• 隔離故障。
• 排除故障。
下面是具體分析故障排錯的步驟。
(1)認(rèn)清癥狀。仔細(xì)記錄從其他人或系統(tǒng)中學(xué)來的解決問題的方法,并把它放在手頭。
(2)驗證用戶權(quán)限。例如,確保用戶正確輸入了他的口令。
(3)限定問題的范圍。它是全局性的嗎?即網(wǎng)上的所有用戶總是會碰到這個問題嗎?或者問題只發(fā)生在網(wǎng)絡(luò)上某一地理區(qū)域,某一特定的工作組,某一特定的時間段。
(4)重現(xiàn)故障,并且要保證能夠可靠地重新產(chǎn)生這個錯誤。
(5)驗證網(wǎng)絡(luò)物理連接(例如網(wǎng)絡(luò)連線、網(wǎng)絡(luò)接口卡的插槽、供電電源)的完整性。從受到影響的節(jié)點開始,向主干網(wǎng)延伸。
(6)驗證網(wǎng)絡(luò)的軟件連接問題(例如地址、協(xié)議綁定、軟件安裝等)。
(7)考慮近的網(wǎng)絡(luò)變更和可能因此導(dǎo)致的網(wǎng)絡(luò)問題。
(8)實施解決方案。
(9)檢驗解決方案。
根據(jù)自己的觀察,可以從上面列表中的一步跳到另一步,減少所執(zhí)行的檢查步驟。例如,如果檢測到一個網(wǎng)絡(luò)接口卡在工作站系統(tǒng)板上的安裝不正確,就可以直接跳到步驟(8)(在本例中,就是重新安裝網(wǎng)絡(luò)接口卡),而不用分析網(wǎng)絡(luò)的近變化情況??傊?,在排錯時需要利用常識。