一、接口物理Down概念
以太網接口是提供給用戶操作或配置的真實存在、有器件支持的物理接口,主要用于接收和發送數據。接口保持正常UP狀態是設備正常運轉的最基本條件。
當接口處于DOWN狀態時,其指示燈狀態為常滅,接口不能正常收収報文,設備上產生類似如下格式的日志:
IFPDT/4/IF_STATE(l)[3]:Interface GigabitEthe.NET0/0/12 has turned into DOWN state.
您可以通過執行display interface命令查看接口當前物理狀態(回顯中current state字段信息)。
在上圖的示例中,接口GE0/0/12的當前物理狀態為Administratively DOWN ,即設備接口下存在命令 shutdown,可以斷定配置錯誤引發接口DOWN,您需要在對應接口規圖下執行undo shutdown命令。
二、接口物理DOWN原因及處理方法
引起接口物理DOWN的原因主要包括硬件和軟件兩類故障:
- 硬件故障:本端或對端設備硬件故障包括單板、接口、光模塊、光纖、網線等故障
- 軟件故障:主要包括鏈路兩端配置不一致,主要包括端口協商模式、速率、雙工等配置。
如下圖所示,為了更加精確的分析接口物理DOWN的故障原因,本文主要按照故障可能的引入點為線索,具體按照人->機->料->法->環五步驟為排查順序,逐步找到問題根因并排除故障.
接口物理DOWN
1.人--人為因素導致接口物理DOWN
(1) 故障原因描述
當接門由正常UP狀態變為物理DOWN時,需要首先排查近期是查有人為操作當,包括錯誤拔插網線,誤碰設備導致連線松動以及在設備上進行了命令行誤操作等行為。
(2) 故障診斷操作步驟
在對接的兩個設備上的任意視圖下,均執行命令displayinterface interface-type interface-number,查看接口當前運行狀態和接口統計信息。如圖3所示,重點查看如下回顯中紅色字段
- 若current state字段為“Administratively down”,表示接口被人為Shutdown,請在接口下執行undo shutdown命令。
- 若current state字段為“DOWN”,則需要查看速率、雙工、自協商模式是否鏈路兩端保持一致。
- 若Negotiation字段為“ENABLE”,則接口處在自協商模式,速率雙工均是雙方協商的結果,如果鏈路兩端速率雙工協商不一致,可以執行命令restart,重啟接口,使之重新協商。如果仍然協商不成功,可執行命令undonegotiation auto,使之工作在非自協商模式。速率雙工配置可參見下一情況。
- 若Negotiation字段為DISABLE,則接口處在非自協商模式,速率雙率可在接口視圖下執行speed[10|100|1000]以及duplex{fulll half},使鏈路兩端參數保持一致。
- 若current state字段為ERROR DOWN(down-cause),表示接口由于錯誤事件而被Shutdown您需要根據down-cause具體字段信息排查故障常見down-cause字段值如下圖所示
(3) ”故障恢復方法
批量接口物理DOWN:
- 如果多個接口物理DOWN,并且這些接口都屬于同一塊單板,并連接到多個無異常的對端設備,則可能是單板異常,嘗試執行命令reset slot slot-id,復位單板。如果故障仍未解決,需要更換單板
- 如果多個接口物理DOWN,并且這些接口都是屬于本端設備和對端同一設備連接的接口,則可能原因 是對端設備異常,您需要登錄對端設備查看設備單板是否故障,并及時進行復位或更換操作,如果對 端設備處于主備倒換、休眠、重啟等狀態,則可以認為屬于正常現象,待對端設備狀態穩定后,一股 本端設備狀接口狀態即可自動恢復到UP狀杰。該場號下,接口會出現頻UP/DOWN,產生如下所示的大量UP/DOWN日志。
單個接口物理DOWN:僅有單個接口物理DOWN,則需要排查鏈路兩端接口是否有金屬彈片凹陷等硬件故障,如果接口故障可嘗試使用其他空閑接口。
2.料--連接介質故障
(1) 故障原因描述
交換機物理接口有電口和光口,涉及的傳輸介質主要是RJ45-網線,光模塊、光纖。當傳輸介質出現老化、破損或者光模塊收發光異常等故障時,將會導致接口物理DOWN。
(2) 故障診斷操作步驟
電口連接介質故障:
- 檢查連線是否正確:保證對接兩端接口使用同一根網線,如果經過跳線架請檢查跳線是否正確,檢查接口是否連接正確,同時檢查是否存在接觸不好及網線外部損壞的情況
- 檢查網線規格及長度是否符合標準:依據以太網相關標準,網線長度不能超過100m。對于GE電口,如果使用低于五類線的網線將不能夠使GE電口以1000M速率UP,所有電口對接,均推薦使用五類線以上規格的網線對接
- 檢查網線內部線對狀態是否正常:網線中4對線序中有部分出現損壞,將不能保證電口正常UP。檢測網線質量,可以使用測線儀或者接口視圖下執行virtual-cable-test 命令,檢測線序對連接是否正常
如上圖所示,如果回顯中Pair state為OK表示正常;如果為其他狀態(例如Open或short),建議您更換其他網線測試。”
光口連接介質故障:
- 光模塊是否屬于華為認證光模塊:華為公司在交換機產品發貨的光模塊標簽上增加華為logo和相應標識,如圖7所示,在產品電子標簽、光模塊信息里面都更新為“HUAWVEI” 廠家信息 對于非華為認證發貨的光模塊插入交換機設備中,會出現告警信息。告警格式如下:
ENTITYTRAP/3/OPTICALINVALID:OID oid] Optical Module is invalid.(Index=INTEGER),
EntityPhysicalIndex=INTEGER), PhysicalName= "OCTET", EntityTrapFaultID=[INTEGERJ)
檢查光模塊狀態是否正常:執行命令display transceiverinterface,檢查兩端設備上的光模塊工作狀態是否正常,主要查看收光功率、發光功率、電流值等,確定各項指標是否都在正常范圍內。
(3) 故障恢復方法
電口連接介質故障:如果電口網線故障,建議直接更換網線
光口連接介質故障:
- 如果使用的光模塊為非華為認證光模塊,請更換使用華為認證光模塊。非認證光模塊可靠性無法保證,可能導致業務不穩定。由非華為認證光模塊導致的問題,華為將不承擔責任,并在原則上不予以解決。
- 如果執行display transceiverinterface命令查看光模塊工作狀態參數,按照表1所示標準結論判斷參數否超出正常范圍。
- 如果發送光功率過低或過高:請更換光模塊
- 如果收光功率過低或過高:使用光功率計測試鏈路各部分的光功率亮減情況,對異常的部位進行修復。
- 如果仍無法解決問題請更換光模塊或者光纖,確保光模塊傳輸距離和光纖類型符合組網需求.
3.法--連接介質操作方法錯誤
(1) 故障診斷操作步驟
進行設備間連接介質操作時,需要考慮光模塊與光口是否匹配,光模塊是否與光纖型號是否死配,光模塊與光纖連線操作是否正確等、當接口出現物理DOWN時,可以從上述幾個原因進行排查.
(2) 故障診斷操作步驟
- 任意視圖執行命今display device,查看設備型號及部件信息,其中框式設備主要可查看對應單板名稱;
- 登錄硬件查詢工縣,查詢當前使用的光模塊類型是否和對應設備接口匹配以及光模塊是否和光纖型號匹配;
- 兩端設備上均在任意視圖下執行命令display transceiver interface,檢查鏈路兩端光模塊參數是否一致;
- 檢查光纖連線方式是否正確,光模塊一般包含發送端(TX)和接收端(RX)。光接口對接時需要兩根光纖將一端光模塊TX端與另一端RX連接,一端光模塊RX端與另一端TX連接;
- 判斷接口是否為Combo接口,如果是Combo接口,檢查接口使用方法是否正確,即接口當前工作模式是否和您當前接口連線是否一致。
如下圖所示,Combo接口GE1/0/1在設備面板上對應兩個接口: Combo光口和Combo電口。Combo光口和Combo電口不能同時工作。當用戶需要對Combo光口或Combo電口進行屬性配置時,都只需要進入同一接口視圖GE1/0/1進行配置即可
任意視圖下執行命令display interface,查看接口是否為Combo接口,以及當前工作模式是否正常.
圖片
(3) 故障恢復方法
根據硬件查詢工具,確保當前使用的光模塊與光口匹配,光模塊與光纖匹配,如果不一致,請更換相應部件。
如果當前接口為Combo接口,則Combo接口工作模式選定原則如下:
- Combo電口沒有連接網線,當Combo光口插上光模塊時,則Combo接口選擇光口模式
- Combo電口已經連接網線,且Combo接口處于UP狀態,此時即使Combo光口插上光模塊Combo接口仍選擇為電口模式。但是設備重啟后,Combo接口工作模式將變為光口模式
- Combo電口已經連接網線,目Combo接口處于DOWN狀態,此時Combo光口插上光模塊Combo接口將選擇光口模式。
- 當指定Combo接口工作模式為自動選擇模式時(接口視圖下執行comboport auto,默認設備Combo接口工作模式為auto ),系統將檢測Combo光口是否有光模塊插入,進行模式選擇:
綜上所述,Combo接口工作模式為自動選擇模式時,只要Combo光口已插上光模塊,則設備重啟后,Combo接口都將選擇光口模式。
當Combo接口的工作模式設置為強制模式時,需要根據本端與對端設備連接的接口類型進行配置:
- 如果本端Combo電口與對端電口相連,則需要強制指定Combo接口的工作模式為copper,即接視圖下執行combo-port copper.
- 如果本端Combo光口與對端光口相連,則需要制指定Combo接口的工作模式為fber,即接視圖下執行combo-port fiber.
綜上所述,當確定正確的傳輸介質后(光纖或者網線)后,就可以確定Combo口正確的工作模式您可以直接使用命令combo-port{copper|fiber],強制配置接口工作模式和連接介質保持致即可。
4.環--環境因素導致的故障
(1) 原因描述
交換機使用場景復雜多樣,設備可以處于網絡中任意一個層級。當交換機及其連接介質由于環境因素導致異常時接口狀態也可能物理DOWN
(2) 故障診斷操作步驟
- 檢查機房溫度及濕度狀況:S交換機工作環境溫度:0C~45C,對濕度應在5%RH~95%RH之間,不結露
- 檢查線纜布放狀況:電源線與業務線纜分開布放。不能出現強弱電線纜并行的情況,防止干擾。檢查是否有高溫或者機架磨損導致網線破損老化的問題
(3) 恢復方法
- 若機房的環境溫度長期不能滿足要求,應考慮檢修或更換機房的空調系統。若機房的相對濕度過大,應考慮為機房安裝除濕設備;
- 若機房的相對濕度過小,應考慮為機房安裝加濕設備,若出現強弱電線纜并行現象,請重新部署線纜走向,強弱電線纜分離。如因環境因素導致網線損傷老化,請更換網線。