新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問(wèn)題描述
某日客戶反饋工行總行至一網(wǎng)點(diǎn)大客戶業(yè)務(wù)丟包,PING包包長(zhǎng)15000字節(jié),丟包率在1%以上。
網(wǎng)絡(luò)拓?fù)?/strong>
工行總行站點(diǎn)使用OSN1500設(shè)備,其他站點(diǎn)為OSN3500,版本為18.50P01
總行OSN1500通過(guò)EGS4單板和工行總行邁普路由器對(duì)接,EGS4單板配置EVPL匯聚各個(gè)網(wǎng)點(diǎn)的業(yè)務(wù),每個(gè)網(wǎng)點(diǎn)帶寬為2*VC12,中間鏈路為華為SDH設(shè)備,組網(wǎng)方式為MSP、SNCP,終端鏈路使用R廠家3500E設(shè)備通過(guò)STM-1/4光口和華為設(shè)備對(duì)接,網(wǎng)點(diǎn)配置R廠家3107等盒式設(shè)備通過(guò)FE電口和網(wǎng)點(diǎn)邁普路由器對(duì)接,連接關(guān)系如下:
工行總行邁普路由器—(EGS4)工行OSN1500(SL16)—傳輸L—傳輸C—傳輸E(SLQ1)—(STM-1)R廠家3500E(STM-1)—R廠家3107(FE)—網(wǎng)點(diǎn)邁普路由器
其中工行OSN1500設(shè)備位于工行總行,傳輸L位于本地網(wǎng)子網(wǎng),傳輸C和傳輸E位于城域網(wǎng)子網(wǎng),R廠家3500E設(shè)備和傳輸E設(shè)備在同一機(jī)房,R廠家3107位于網(wǎng)點(diǎn)。
無(wú)異常告警信息。
處理過(guò)程
1、鏈路誤碼導(dǎo)致丟包
2、對(duì)接路由器端口故障
3、帶寬不足
4、R廠家網(wǎng)點(diǎn)設(shè)備或匯聚EGS4單板故障
5、以太網(wǎng)封裝對(duì)接問(wèn)題
6、其他網(wǎng)絡(luò)配置
根因
時(shí)鐘配置不同步
解決方案
1、通過(guò)網(wǎng)管查詢性能,并未發(fā)現(xiàn)鏈路存在誤碼,而且同一路由其他業(yè)務(wù)正常,排除誤碼原因?qū)е聛G包。
2、配置一條路由相同、兩端使用不同以太網(wǎng)端口的業(yè)務(wù)進(jìn)行測(cè)試,丟包率依然在1%以上,可以排除工行路由器故障。
3、增加帶寬到4*VC12,經(jīng)過(guò)測(cè)試丟包率依然在1%以上,故可以排除帶寬不足原因?qū)е碌膩G包。
4、調(diào)整EGS4單板以太網(wǎng)配置,和其他正常運(yùn)行的業(yè)務(wù)對(duì)調(diào)綁定時(shí)隙和VCtrunk,經(jīng)過(guò)測(cè)試依然丟包,使用同型號(hào)設(shè)備替換R廠家營(yíng)業(yè)網(wǎng)點(diǎn)設(shè)備,經(jīng)過(guò)測(cè)試依然丟包,初步懷疑設(shè)備對(duì)接不匹配問(wèn)題。
5、在和R廠家對(duì)接的傳輸E設(shè)備上增加EFS4以太網(wǎng)單板,測(cè)試EFS4和R廠家設(shè)備對(duì)接情況,分別配置1口到工行總行的EPL業(yè)務(wù),2口到R廠家設(shè)備的EPL業(yè)務(wù),采用分段測(cè)試,測(cè)試結(jié)果為2段都沒(méi)有丟包現(xiàn)象,根據(jù)表面現(xiàn)象初步判斷使用EFS4和R廠家對(duì)接沒(méi)問(wèn)題,使用EGS4對(duì)接存在丟包,但是由于EGS4單板之前已經(jīng)對(duì)調(diào)過(guò)VCtrunk,而且其他營(yíng)業(yè)網(wǎng)點(diǎn)也配置同樣設(shè)備型號(hào),又可以反向證明設(shè)備對(duì)接不存在問(wèn)題。
6、由于之前該客戶網(wǎng)絡(luò)發(fā)生過(guò)R廠家設(shè)備時(shí)鐘模塊批次問(wèn)題導(dǎo)致的故障,客戶要求R廠家研發(fā)現(xiàn)場(chǎng)支持問(wèn)題分析,并且從總部帶來(lái)一臺(tái)其他型號(hào)設(shè)備,使用新設(shè)備替換后經(jīng)過(guò)測(cè)試沒(méi)有丟包,此時(shí)可確定R廠家新、老設(shè)備處理對(duì)接數(shù)據(jù)時(shí)存在差異,為了徹底定位根因,配置一條從傳輸L至傳輸E的VC12級(jí)別的業(yè)務(wù),下在傳輸E設(shè)備一空閑光口,R廠家研發(fā)使用儀表對(duì)該光口進(jìn)行測(cè)試,發(fā)現(xiàn)有指針調(diào)整,測(cè)試10分鐘調(diào)整計(jì)數(shù)為1000,R廠家研發(fā)答復(fù)該數(shù)值已經(jīng)超出R廠家老設(shè)備處理能力,所以會(huì)導(dǎo)致設(shè)備丟包,另外在傳輸E站點(diǎn)查詢?cè)摋l業(yè)務(wù)15分鐘性能值,指針調(diào)整計(jì)數(shù)為1300多塊左右,所以證實(shí)存在指針調(diào)整。由于跨子網(wǎng)的業(yè)務(wù)比較少,而且其他業(yè)務(wù)只是從城域網(wǎng)穿通,所以未受影響。
7、查詢?nèi)A為設(shè)備時(shí)鐘配置,傳輸L設(shè)備位于本地網(wǎng),時(shí)鐘源為BITS外時(shí)鐘,傳輸C和傳輸E設(shè)備位于城域網(wǎng),時(shí)鐘源為傳輸C內(nèi)部時(shí)鐘,兩個(gè)子網(wǎng)的時(shí)鐘源級(jí)別不一致,更改時(shí)鐘配置,使傳輸C和傳輸E跟蹤傳輸L,通過(guò)儀表測(cè)試指針調(diào)整結(jié)束,重新測(cè)試原始業(yè)務(wù),測(cè)試6個(gè)小時(shí)未發(fā)現(xiàn)丟包,最終丟包問(wèn)題解決。
建議與總結(jié)
基于分不同子網(wǎng)管理的傳輸網(wǎng)絡(luò),一般只關(guān)注同一子網(wǎng)的時(shí)鐘配置,沒(méi)有成環(huán)、互跟、有保護(hù)即可,但是子網(wǎng)間的時(shí)鐘級(jí)別往往被忽視,此案例就是不同子網(wǎng)時(shí)鐘級(jí)別不同導(dǎo)致的業(yè)務(wù)丟包,建議每個(gè)子網(wǎng)都配置BITS時(shí)鐘源,即可實(shí)現(xiàn)每個(gè)網(wǎng)元跟蹤相同級(jí)別時(shí)鐘源。