新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述(故障現(xiàn)象)
對中興S330設(shè)備進(jìn)行NCP板的軟件版本和FPGA版本的升級,升級完成后,給NCP下載數(shù)據(jù)庫時(shí),發(fā)現(xiàn)數(shù)據(jù)項(xiàng)“告警屏蔽”下載失敗,提示“未知錯(cuò)誤”,數(shù)據(jù)項(xiàng)“數(shù)字量性能門限”下載失敗,提示“6#單板的1#CPU超時(shí)”,如圖 101所示。此時(shí)業(yè)務(wù)均正常。
網(wǎng)管上單獨(dú)下載數(shù)據(jù)項(xiàng)“告警屏蔽”、“數(shù)字量性能門限”仍舊失敗。
現(xiàn)場反饋多端ZXMP S330設(shè)備下載NCP數(shù)據(jù)庫時(shí),多個(gè)網(wǎng)元都出現(xiàn)了相同的故障,但業(yè)務(wù)均正常。
升級NCP的軟件/FPGA版本完成后,下載NCP數(shù)據(jù)庫,提示“數(shù)字量性能門限”在第5槽位單板的1#CPU下載失敗。
對NCP數(shù)據(jù)庫進(jìn)行上載比較,發(fā)現(xiàn)網(wǎng)管數(shù)據(jù)庫有“數(shù)字量性能門限”,但NCP數(shù)據(jù)庫中沒有,因此可以確定“數(shù)字量性能門限”的確下載失敗了。
打開E300網(wǎng)管菜單【性能】→【性能設(shè)置】→【數(shù)字量性能門限配置】, 顯示出各個(gè)數(shù)字量性能門限的值,這些數(shù)字量性能門限是針對整個(gè)網(wǎng)元的,不是單獨(dú)對于第5槽單板的。點(diǎn)擊【應(yīng)用】,下發(fā)這些值,結(jié)果仍顯示第5槽位單板的1#CPU下發(fā)失敗。
查詢該網(wǎng)元的當(dāng)前告警,只有DCC連接失敗的告警,并無其他異常告警。
原因分析
“數(shù)字量性能門限”下載失敗會影響數(shù)字量性能越限告警的上報(bào),例如當(dāng)誤碼率越限時(shí)卻不上報(bào)告警,但不會影響業(yè)務(wù)。
下載“數(shù)字量性能門限”時(shí),提示6#板的1#CPU超時(shí)。網(wǎng)管上檢查6#板,發(fā)現(xiàn)是OL4AF板,網(wǎng)管上查詢到該OL4AF 板的軟件版本為V1.01R1P05,F(xiàn)PGA版本為V1.01R1P04。
現(xiàn)場是在升級NCP板的軟件和FPGA版本后,下載NCP數(shù)據(jù)庫時(shí)出現(xiàn)的故障。剛開始時(shí),懷疑是新的NCP板軟件和FPGA版本和OL4AF板存在配合問題。后來排除了這一點(diǎn),確認(rèn)該故障和NCP板無關(guān)。
研發(fā)在實(shí)驗(yàn)室用E300網(wǎng)管和T31網(wǎng)管進(jìn)行反復(fù)驗(yàn)證,故障均未復(fù)現(xiàn)。
研發(fā)要求現(xiàn)場在下載NCP數(shù)據(jù)庫時(shí),采用GDownload軟件抓包。對抓取的GDownload報(bào)文進(jìn)行分析,發(fā)現(xiàn)網(wǎng)管顯示超時(shí)的單板都是配置為4口的OL1板。最終研發(fā)定位是由于OL4AF板的內(nèi)存不足,導(dǎo)致下發(fā)“數(shù)字量性能門限”失敗。因?yàn)椤皵?shù)字量性能門限”與其他的數(shù)據(jù)表相比,需要較多的光板內(nèi)存,因此其他的數(shù)據(jù)表可以下發(fā)成功,但“數(shù)字量性能門限”下發(fā)失敗。
OL4AF板的內(nèi)存不足的原因,是由于OL4AF板插在中興S330設(shè)備的5#、6#、11#、12#這4個(gè)槽位,網(wǎng)管上配置為OL1板或者OL4板時(shí),OL4AF板的軟件版本缺陷導(dǎo)致光板的內(nèi)存出現(xiàn)少量泄漏,隨著光板運(yùn)行時(shí)間的增加,光板內(nèi)存的泄露情況將越來越嚴(yán)重。
解決方案
臨時(shí)解決方案:網(wǎng)管上硬復(fù)位OL4AF板,釋放光板內(nèi)存。
根本解決方案:將OL4AF的軟件升級到V1.01R1P10及之后的版本。