新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問(wèn)題描述
B市電信一基站用Metro1000設(shè)備,在頻繁掉電后網(wǎng)元配置丟失。
告警信息
本站無(wú)告警,對(duì)端站點(diǎn)有hp-uneq告警。另外,在該網(wǎng)元發(fā)生故障當(dāng)天,對(duì)端站點(diǎn)發(fā)生了90余次R_LOS告警,可以判斷該網(wǎng)元當(dāng)時(shí)電源環(huán)境非常惡劣。
處理過(guò)程
將該網(wǎng)元的配置通過(guò)網(wǎng)管重新下載后,恢復(fù)正常。
根因
從黑匣子bb0.log(見(jiàn)附件)中可以看出該網(wǎng)元是在22點(diǎn)剛過(guò)丟的配置(網(wǎng)元時(shí)區(qū)為北京時(shí)區(qū),所以bb0記錄的時(shí)間為網(wǎng)元時(shí)間+8),(22:00加8小時(shí)=凌晨06:00)配置就已經(jīng)丟失,板位信息只剩下主控上自動(dòng)創(chuàng)建的四個(gè)板位,需從數(shù)據(jù)庫(kù)中恢復(fù)的板位全部丟失。
什么會(huì)在這個(gè)時(shí)間點(diǎn)出現(xiàn)配置丟失呢?在網(wǎng)元時(shí)間22點(diǎn)時(shí)網(wǎng)元會(huì)做的一個(gè)動(dòng)作就是數(shù)據(jù)庫(kù)自動(dòng)備份(M1000V3網(wǎng)元默認(rèn)會(huì)在每天的22點(diǎn)時(shí)進(jìn)行數(shù)據(jù)庫(kù)自動(dòng)備份操作)。OSP平臺(tái)專家分析的結(jié)論如下:從重現(xiàn)出來(lái)的故障來(lái)看,并非所有數(shù)據(jù)庫(kù)配置都丟失,只有產(chǎn)品數(shù)據(jù)庫(kù)(包括邏輯板位、交叉等配置數(shù)據(jù)庫(kù))丟失了,而平臺(tái)的數(shù)據(jù)庫(kù)并未丟失;這是由于網(wǎng)元掉電起來(lái),剛好碰到網(wǎng)元自動(dòng)備份時(shí)間22:00,觸發(fā)OSP平臺(tái)對(duì)所有數(shù)據(jù)庫(kù)進(jìn)行自動(dòng)備份,備份的流程是mdb -> drdb -> tdrdb -> fdb,網(wǎng)元啟動(dòng)時(shí),OSP備份任務(wù)(優(yōu)先級(jí)150)先進(jìn)行,做 mdb -> drdb -> tdrdb ,空數(shù)據(jù)備份到 tdrdb,此時(shí)產(chǎn)品任務(wù)開(kāi)始創(chuàng)建產(chǎn)品數(shù)據(jù)庫(kù)(優(yōu)先級(jí)130,優(yōu)先級(jí)比OSP備份任務(wù)高,因此會(huì)搶占OSP備份任務(wù)),此時(shí)fdb還有數(shù)據(jù),產(chǎn)品創(chuàng)建數(shù)據(jù)庫(kù)從fdb中恢復(fù)出配置,然后會(huì)即時(shí)備份到drdb,因此drdb有數(shù)據(jù);最后OSP備份任務(wù)繼續(xù)執(zhí)行,將空配置的tdrdb備份到fdb中,因此fdb數(shù)據(jù)丟失,并且僅僅是產(chǎn)品數(shù)據(jù)庫(kù)丟失。
建議與總結(jié)
1、保持機(jī)房電源穩(wěn)定,避免設(shè)備頻繁掉電;
2、研發(fā)修改版本,修改產(chǎn)品軟件中創(chuàng)建數(shù)據(jù)庫(kù)的時(shí)機(jī),不要在任務(wù)中創(chuàng)建,將其前移至assemble里完成。(OSP數(shù)據(jù)庫(kù)備份任務(wù)是要等assemble完成以后才會(huì)開(kāi)始運(yùn)行,此時(shí)保證所有數(shù)據(jù)庫(kù)都已創(chuàng)建恢復(fù)完成,這樣就可以徹底解決此問(wèn)題) 解決問(wèn)題的軟件版本預(yù)計(jì)在2011年12月前發(fā)布。