新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述
在進(jìn)行環(huán)形MSP倒換的時(shí)候,某條經(jīng)過本環(huán)的一條業(yè)務(wù),總是下游特定的兩個(gè)站點(diǎn)#219、#240閃報(bào)2秒AUAIS告警,其他站點(diǎn)不上報(bào)任何告警。由于在此環(huán)的倒換業(yè)務(wù)中斷并沒有達(dá)到兩秒(經(jīng)過測試,倒換業(yè)務(wù)中斷時(shí)間是70ms(該環(huán)距離超長,屬正?,F(xiàn)象))。需要向用戶解釋問題原因。詳細(xì)的組網(wǎng)圖見附件。
告警信息
AUAIS
處理過程
1、經(jīng)過采集數(shù)據(jù)發(fā)現(xiàn)219和240網(wǎng)元的告警濾抖(:alm-get-condetect)沒有使能,其他網(wǎng)元已經(jīng)全部使能;
2、以下是告警檢測的機(jī)制:
首先單板(STM64)軟件的告警檢測任務(wù)周期是1秒,當(dāng)業(yè)務(wù)中斷的時(shí)候,如果單板告警任務(wù)檢測到了AUAIS,此時(shí)就會(huì)將此告警上報(bào)給平臺(tái),告訴平臺(tái)AUAIS告警開始。
同時(shí)單板上層軟件會(huì)在啟動(dòng)的時(shí)候注冊告警結(jié)束防抖為2,表明主機(jī)平臺(tái)需要在連續(xù)兩次收到告警結(jié)束之后才會(huì)將告警真實(shí)結(jié)束。
由于實(shí)際業(yè)務(wù)只是中斷了70ms,遠(yuǎn)遠(yuǎn)低于1秒,單板上層軟件會(huì)概率性的檢測到此告警,不會(huì)連續(xù)兩次檢測到告警,因此單板上報(bào)給主機(jī)平臺(tái)的告警只有一次,馬上就會(huì)結(jié)束。
對于打開了告警濾抖功能的網(wǎng)元(濾抖2秒),主機(jī)平臺(tái)收到了一次告警開始,因此會(huì)將此告警濾抖掉,并不能上報(bào)給主機(jī)上層軟件,從而主機(jī)不會(huì)顯示出來。
對于沒有打開濾抖功能的網(wǎng)元,一旦單板軟件檢測到了AUAIS,并且上報(bào)給主機(jī)平臺(tái)后,主機(jī)平臺(tái)會(huì)在等待兩秒之后,如果仍然沒有告警上報(bào),才會(huì)自行結(jié)束掉告警。因此告警至少會(huì)上報(bào)給主機(jī)上層軟件兩秒,主機(jī)就將此告警顯示出來。
3、由以上分析可知,未使能告警防抖功能,是問題的根本原因。
4、在219網(wǎng)元和240網(wǎng)元上將告警防抖打開后,再進(jìn)行復(fù)用段倒換測試,AUAIS告警不再上報(bào)。
根因
告警防抖功能未使能