新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述
Metro1000擴(kuò)容42EFS發(fā)現(xiàn)有多臺設(shè)備上報HARD_BAD告警,復(fù)位單板能夠恢復(fù),但是過一段時間后還會上報,主機(jī)從4.2.6.6升級到4.2.6.41P06支持EFS板,業(yè)務(wù)沒有受到任何影響。
告警信息
Hard_Bad,告警參數(shù)為0x11
處理過程
連續(xù)三次采集收發(fā)兩個方向報文統(tǒng)計,發(fā)現(xiàn)端口收發(fā)包都沒有變化,說明該端口在數(shù)據(jù)采集這段時間內(nèi)無流量。
故障單板端口收包統(tǒng)計如下:
Bid Pid Chn GroupId DateTime Eid Data-High4Byte Data-Low4Byte
3 1 ch1 grp1 2010-8-3 4:2:0 rxpkts 0x00000000 0x00006f4d
3 1 ch1 grp1 2010-8-3 4:2:3 rxpkts 0x00000000 0x00006f4d
3 1 ch1 grp1 2010-8-3 4:2:6 rxpkts 0x00000000 0x00006f4d
故障單板端口發(fā)包統(tǒng)計如下:
Bid Pid Chn GroupId DateTime Eid Data-High4Byte Data-Low4Byte
3 1 ch1 grp2 2010-8-3 4:2:0 txbok 0x00000000 0x01ee9326
3 1 ch1 grp2 2010-8-3 4:2:3 txbok 0x00000000 0x01ee9326
3 1 ch1 grp2 2010-8-3 4:2:6 txbok 0x00000000 0x01ee9326
結(jié)合故障單板業(yè)務(wù)正常、端口流量少的現(xiàn)象,懷疑Hard_Bad告警為誤報。
將單板軟件降級至V242版本后,HARDBAD告警消失。
根因
Hard_Bad告警參數(shù)為0x11,表示單板數(shù)通器件異常,單板會在兩種情況下上報數(shù)通器件異常:
1、單板業(yè)務(wù)不通或業(yè)務(wù)單通;
2、單板Hard_Bad告警誤報,單板某個端口流量很小、無流量或網(wǎng)線接口異常都有可能導(dǎo)致該告警誤報。