新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述
在進(jìn)行OSN3500掉電單站測(cè)試的時(shí)候存在N2PQ1的業(yè)務(wù)不能正常恢復(fù),導(dǎo)致業(yè)務(wù)中斷,N2PQ1在管網(wǎng)上顯示灰色(未開工狀態(tài)),解決的方法是再軟復(fù)位一下PQ1單板。
版本配置:主控版本是:5.21.13.47p01,N2PQ1版本是4.13
處理過程
1、臨時(shí)解決辦法是再次復(fù)位一下PQ1單板,但這不能解決根本問題。
2、用R7版本的N2PQ1版本,升級(jí)到 NGSDH V100R007C02B017(5.21.17.31)+N2PQ1(5.30)版本,這個(gè)版本解決了這個(gè)問題。
根因
1、R3版本主機(jī)代碼的消息隊(duì)列和多板ID單板申請(qǐng)開工存在配合問題。
2、N2PQ1支持雙ID,N2和N1,在主機(jī)R6版本以下只能使用N1 ID。N2PQ1單板支持“單板兼容替換功能”,其物理板ID為SSN2PQ1,邏輯板ID可以配置為N1/N2兩種;
3、R6以下版本,配置有N2PQ1單板的設(shè)備在掉電時(shí)可能會(huì)存在問題:設(shè)備掉電時(shí),N2PQ1將先于GSCC起來,這是N2PQ1無法從GSCC上獲取配置,將自動(dòng)使用N2PQ1的ID,當(dāng)GSCC啟動(dòng)時(shí),這是PQ1的邏輯單板是N1的,但是物理單板是N2的,這樣的話業(yè)務(wù)就會(huì)斷了。
4、咨詢研發(fā)后,給出的解釋是:多板ID在老主機(jī)上的一個(gè)匹配過程,以如下面所講的N2PQ1為例,設(shè)備掉電時(shí),的確N2PQ1會(huì)將先于GSCC起來,首先N2PQ1會(huì)以N2PQ1開工,但這時(shí)主機(jī)還沒有完全起來,這個(gè)時(shí)候的確是不會(huì)匹配成功,但我們單板軟件會(huì)發(fā)現(xiàn)以N2PQ1開工長時(shí)間(12×3s)不能開工,就會(huì)更換為N1PQ1開工,如果以N1PQ1開工還是長時(shí)間(12×3s)不能開工,就更換為N2PQ1進(jìn)行開工,依次這樣循環(huán)更換板類型(N1PQ1和N2PQ1)進(jìn)行開工,對(duì)R6版本,對(duì)這個(gè)循環(huán)更換板類型的板類型的次數(shù)做了限制,N2PQ1單板就為10次,如果匹配次數(shù)到達(dá)了這個(gè)極限值,就不會(huì)輪巡匹配了,由于主機(jī)起來的時(shí)間比較長,如果這個(gè)時(shí)間超過了輪巡10次的時(shí)間,那么這時(shí)有可能是以N2PQ1申請(qǐng)開工,也有可能N1PQ1申請(qǐng)開工,現(xiàn)網(wǎng)這個(gè)現(xiàn)象是以N2PQ1開工的,所以物理板檢測(cè)的是亂碼。對(duì)R7及后續(xù)版本就沒有這個(gè)限制,一直都是輪巡匹配,直到匹配成功。
建議與總結(jié)
1、對(duì)于緊急恢復(fù)措施:
   當(dāng)現(xiàn)網(wǎng)使用R3及以前版本的網(wǎng)元在掉電重啟時(shí)遇到該問題,請(qǐng)對(duì)單板主動(dòng)進(jìn)行軟復(fù)位,就可以解決。 
   對(duì)出現(xiàn)該問題的現(xiàn)場(chǎng)具體判斷如下:    
   1)、確定單板為多板ID單板;
   2)、網(wǎng)管上看不到物理板類型或在Navigator上顯示的物理板類型為亂碼(數(shù)字代號(hào));
   3)、查詢告警存在WRG_BD_TYPE告警;
2、了解OSN的多板ID技術(shù)可以幫助此類問題的理解和解決