新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述
因OSN3500設(shè)備新發(fā)貨版本有5.21.18.50P01還有5.21.19.31版本,用戶要求統(tǒng)一版本,從5.21.18.50P01升級(jí)到5.21.19.31,升級(jí)完成后,一臺(tái)OSN3500設(shè)備主備主控板都上報(bào)hard_bad告警,主備主控頻繁倒換、設(shè)備主控板為SSN1GSCC01單板;
告警信息
截取網(wǎng)元部分告警如下:
17 HARD_BAD CR end 2011-06-04 09:53:26 2011-06-04 09:54:25 0xff 0xff 0xff 0x01 0x00
17 HARD_BAD CR end 2011-06-04 09:54:36 2011-06-04 09:55:45 0xff 0xff 0xff 0x01 0x00
18 HARD_BAD CR end 2011-06-04 10:28:50 2011-06-04 10:28:55 0xff 0xff 0xff 0x01 0x00
18 HARD_BAD CR end 2011-06-04 10:40:34 2011-06-04 10:40:38 0xff 0xff 0xff 0x01 0x00
18 HARD_BAD CR end 2011-06-04 10:52:00 2011-06-04 10:52:14 0xff 0xff 0xff 0x01 0x00
處理過程
1、核實(shí)升級(jí)動(dòng)作,一共加載了7個(gè)站點(diǎn)都沒有問題,軟件包問題排除;工程師嚴(yán)格按照指導(dǎo)書操作,升級(jí)過程無(wú)錯(cuò)誤提示,升級(jí)順利,和升級(jí)過程沒有關(guān)系;
2、兩塊單板都上報(bào)hard_bad告警,同時(shí)故障的可能性不大,因上報(bào)告警后主備主控板頻繁發(fā)生倒換,所以單板告警不可能是誤報(bào);
3、現(xiàn)場(chǎng)全量采集數(shù)據(jù)返回分析,核實(shí)結(jié)果如下(詳細(xì)分析過程見附件):
SSN1GSCC01主控在V100R009C04SPC200版本(19.31)下底層dwReadV36接口實(shí)現(xiàn)錯(cuò)誤,讀取到了3.3V電壓的值,從而概率性上報(bào)hard_bad告警。
4、出現(xiàn)此問題可以考慮:
A、版本降級(jí)到R8主流版本V100R008C02SPC200或者V100R008C02SPC300,或升級(jí)到R10版本。
B、更換為非N1GSCC01單板,如N1GSCC02,N4GSCC等單板;現(xiàn)場(chǎng)更換為N4GSCC單板問題解決;
根因
1、主機(jī)軟件升級(jí)過程有問題,沒有正確加載軟件;
2、主控板硬件故障;
3、主機(jī)軟件和主控板配合問題;
4、告警誤報(bào);
建議與總結(jié)
如果有升級(jí)需求,建議核實(shí)下發(fā)布的設(shè)備版本策略,因?yàn)?.21.18.50P01版本就是主流維護(hù)版本,現(xiàn)網(wǎng)運(yùn)行穩(wěn)定,而5.21.19.31版本是針對(duì)有數(shù)據(jù)特性特殊需求局點(diǎn)而使用的版本,此問題站點(diǎn)現(xiàn)網(wǎng)實(shí)際沒有升級(jí)必要;