新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述(故障現(xiàn)象)
A-B-C-D四臺中興ZXMP S385設(shè)備組成一個2.5G速率的二纖雙向復(fù)用段保護(hù)環(huán),B站點(diǎn)下掛的的接入環(huán)設(shè)備ET1上報(bào)不可用秒告警,并伴隨有背景塊誤碼和誤塊秒。
組網(wǎng)環(huán)境
A-B-C-D四臺ZXMP S385設(shè)備組成一個2.5G速率的二纖雙向復(fù)用段保護(hù)環(huán),其中A和B分別下掛有幾個接入環(huán)

原因分析
1、線路問題;
2、光板問題;
3、交叉板問題;
4、時鐘板問題;
5、外部環(huán)境溫度過高。
解決方案
從受影響業(yè)務(wù)的經(jīng)過路徑和受影響范圍分析,故障業(yè)務(wù)路由均經(jīng)過A、B和C三個站點(diǎn),因此,故障只可能出現(xiàn)在A、B和C三個站點(diǎn)。
下面以1月13日15:00至15:30時間段做故障分析:
(1)查看故障發(fā)生時A性能和告警,發(fā)現(xiàn)與B相連接的10#OL16光板上檢測到大量的VC4誤碼,但是沒有再生段或復(fù)用段誤碼,說明光路正常;
(2)同時交叉板上檢測到大量的TU12-LOP告警和VC12誤碼率越限告警;
(3)查看故障發(fā)生時C性能和告警,發(fā)現(xiàn)與B相連接的7#OL16光板檢測到大量的VC4誤碼,但是沒有再生段或復(fù)用段誤碼,說明光路也正常,同時C交叉板上檢測到TU12-LOP告警和VC12誤碼率越限告警;
(4)根據(jù)傳輸系統(tǒng)對誤碼的檢測機(jī)制,傳輸設(shè)備只對接收到的信號進(jìn)行檢測,對自身發(fā)送的信號不檢測,所以某個站點(diǎn)出現(xiàn)誤碼,要么是接收過來的信號帶有誤碼,要么是設(shè)備自身產(chǎn)生的誤碼;
(5)從以上告警及性能分析,A檢測到的誤碼如果是在自身產(chǎn)生,誤碼并不會對B下掛的網(wǎng)元造成影響,因?yàn)锽下掛網(wǎng)元的業(yè)務(wù)路徑?jīng)]有經(jīng)過A,故不可能是A導(dǎo)致;
(6)分析C的情況:與C相連的光方向中,有上連核心網(wǎng)絡(luò)的2.5G光路、下掛S200的155M光路、以及某片區(qū)匯聚環(huán)組網(wǎng)的2.5G光路,除了收B的方向7#OL16光板檢測到誤碼外,其他方向都沒有檢測到誤碼。同時檢查C下掛的ZXMP S200網(wǎng)元,也沒有發(fā)現(xiàn)誤碼,所以C的問題導(dǎo)致故障的可能性比較?。?/p>
(7)分析B的情況:查看B的性能,B的各個光方向都沒有檢測到誤碼,同時在B下掛的網(wǎng)元,都檢測到了誤碼,說明B接收到的信號都正常,但其他網(wǎng)元接收來自B的信號帶了誤碼。至此,問題的根源定位在B可能性比較大;
(8)通常情況下,造成傳輸設(shè)備產(chǎn)生VC4誤碼、TU12-LOP告警和VC12誤碼率越限有以下可能原因:
①交叉板故障
②時鐘板故障
中興S385設(shè)備交叉板由空分模塊、時分模塊、時鐘單元模塊共同構(gòu)成。通過檢查全網(wǎng)的時鐘源配置,發(fā)現(xiàn)C從B方向引接線路時鐘,如果B時鐘單元出現(xiàn)問題,肯定也會影響到C以及C下掛網(wǎng)元的業(yè)務(wù),故可以排除B和C時鐘單元故障;
(9)由于B和C中興S385設(shè)備的業(yè)務(wù)均工作在9#槽位交叉時鐘板上,且配置的是分散型業(yè)務(wù),最終將問題定位在B和C的9#槽位的時分板上;
(10)由于B可能性比較大,決定先對B進(jìn)行操作。1-15日零點(diǎn)將B的時鐘總線、開銷、業(yè)務(wù)總線從9#交叉板倒換至8#交叉板,截止1-17日凌晨1點(diǎn),沒再出現(xiàn)誤碼。
注意事項(xiàng)
本次誤碼故障的最終定位為B站點(diǎn)9#交叉板故障,將壞板寄回實(shí)驗(yàn)室后測量時分板電源發(fā)現(xiàn),1.2v電源模塊M1輸出電壓異常,為0.94v,這個電源模塊給時分芯片供電,電壓偏低會導(dǎo)致芯片工作異常,業(yè)務(wù)中斷。而且現(xiàn)網(wǎng)的交叉板版本不支持低電壓倒換機(jī)制,最新的交叉板版本(V3.20R1P04)支持低電壓倒換機(jī)制,當(dāng)M1輸出電壓降低到0.97V左右可以倒換,并上報(bào)“單板運(yùn)行不正常告警”。