前言:想要寫出一篇引人入勝的文章?我們特意為您整理了有線電視主動式運維管理應用范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:如何主動定位故障并處理,減少故障發(fā)生概率,提高修復時間,避免對用戶業(yè)務產生影響,使網(wǎng)絡更健康、更流暢,從而提高用戶體驗是運維對綜合網(wǎng)管提出的新需求。廣東省網(wǎng)通過主動式運維管理系統(tǒng)的部署并與傳統(tǒng)綜合網(wǎng)管結合使用,極大地提升了用戶體驗。
關鍵詞:PNM;主動式運維;綜合網(wǎng)管;MTR
1主動式運維網(wǎng)管產生背景
1.1網(wǎng)管系統(tǒng)演進之路
綜合網(wǎng)管系統(tǒng)是架構在網(wǎng)絡管理人員與通信網(wǎng)絡之間的一座橋梁。它共經歷了4個階段,主要是集配置、故障、性能、運維、安全等功能模塊于一體,對通信網(wǎng)絡設備進行參數(shù)配置、故障報警、性能分析等網(wǎng)絡管理、業(yè)務管理以及安全管理,同時還負責系統(tǒng)自身的管理及建設,并且結合網(wǎng)管工作的實際流程進行告警處理、工單處理等事務管理,為運行維護、網(wǎng)絡資源管理、網(wǎng)絡性能分析、計劃建設決策、業(yè)務管理等各級人員提供服務。全面的虛擬化技術及標準、共享服務的基礎架構以及新應用程序平臺的出現(xiàn),使得以往的管理模式已經不能滿足云時代數(shù)據(jù)中心全新的管理需求,其管理對象、目標等均出現(xiàn)了鮮明的特色。隨著虛擬化、云計算等技術及應用的進一步發(fā)展、標準化,未來的IT管理系統(tǒng)必將更融合、更智能、更開放。
1.2網(wǎng)管系統(tǒng)現(xiàn)有功能
(1)設備管理對網(wǎng)元級設備具有強大的管理能力,針對多廠家的設備網(wǎng)絡產品線可統(tǒng)一管理及分析,針對較大的網(wǎng)絡規(guī)模也可輕松管理。(2)業(yè)務配置開通支持分離式管理業(yè)務的開通。業(yè)務配置拓撲尋路效率高,業(yè)務配置效率逐步提高。(3)網(wǎng)絡割接提供業(yè)務遷移、網(wǎng)絡調整、批量路由調整及路由回遷等各種業(yè)務場景的割接。(4)拓撲結構對于網(wǎng)絡拓撲可清晰的展示,拓撲分層化顯示。(5)資源統(tǒng)計可統(tǒng)計資源類信息報表,包括鏈路資源、業(yè)務流量統(tǒng)計、網(wǎng)絡物理資源等相關資源的報表。(6)告警實時監(jiān)控設備產生的告警及性能指標告警,對告警進行級別分類和過濾。
1.3主動式運維的產生
綜合網(wǎng)管系統(tǒng)數(shù)據(jù)往往只能反映出網(wǎng)絡中某些節(jié)點的信號指標,因此運維人員需要通過查看多個節(jié)點的指標情況進行定位和排除,也就是被動式維護。被動式維護是用戶感知業(yè)務質量已下降,投訴后才進行維修。另外,被動式維護在維護定位時還有可能中斷用戶網(wǎng)絡,給用戶體驗帶來較大影響。如何做到在某種程度上對故障先知先覺、對問題預先判斷、對故障隱患提前解決、做到未雨綢繆,是目前運維對綜合網(wǎng)管提出的新需求。在此背景下,主動式運維應運而生。PNMP即“基于預均衡的主動網(wǎng)絡運維”,是PNM主動運維的一種技術手段。
2主動式運維管理系統(tǒng)
經過幾年的探索與功能優(yōu)化,基于PNM技術衍生了ComcastScoutFlux、Spectra及Watchtower等應用程序,這些應用程序包括預均衡、頻譜分析、空間定位等功能,可準確定位及判斷出網(wǎng)絡中各設備的健康狀態(tài)。PNM技術主要是通過補償上行信道中的線性失真(包括頻率響應、微反射、群延時等)來保證上行信號質量。簡單來說就是CMTS是根據(jù)CM的測距消息來評估CM的信號質量,生成預均衡參數(shù),下發(fā)給CM。CM的預均衡器會根據(jù)預均衡參數(shù)進行信號增益,抵消上行線路上的損耗。這樣,在CMTS收到信號時,線性失真的問題會大幅緩解,從而有效提升信號質量。根據(jù)PNM原理,衍生出不同的應用角度,主要包括健康指標MTR、頻響曲線分組、故障點位置TDR三類。(1)MTRCM的預均衡器有24個可調節(jié)參數(shù),網(wǎng)絡正常時,主參數(shù)(主抽頭)能量遠大于其他參數(shù),當網(wǎng)絡劣化時,其他參數(shù)能量會大幅增加以補償增益。根據(jù)這一原理,用主參數(shù)與其他參數(shù)的能量比就能衡量網(wǎng)絡健康狀況。主參數(shù)能量越高,其他參數(shù)越低,MTR值越大,網(wǎng)絡越健康。一般建議MTR值保持在20dB以上,小于10dB就說明網(wǎng)絡有明顯故障。(2)頻響曲線針對鏈路問題,可根據(jù)相同分支分配器下不同CM的頻響曲線是否相同來判斷該分支分配器是否出現(xiàn)老化故障。(3)TDRTDR時域反射技術是指一種對反射波進行分析的遙控測量技術。頻率響應可以通過反向傅里葉轉換,推算出一個時域內的時間幅度圖,通過分析圖中駐波間的時間間隔可以計算出一個時間差,通過這個時間差和信號的物理傳輸速度可以計算出一個大概的故障距離,即通過TDR計算出的故障位置僅供排障參考,反映的是距離CM最近的可能故障點。
3我司主動式運維演進之路
我司在2014年年初啟動了全省CMTS運營監(jiān)測系統(tǒng)的搭建,2014年年底完成了全省各單位分平臺的建設部署并正式投入使用。截至2016年6月,CMTS運營監(jiān)測系統(tǒng)已完成全省超過350臺CMTS設備和超過180萬臺CM終端的接入和管理?;诰W(wǎng)絡現(xiàn)狀,我司先后制定了接入網(wǎng)基本指標、較優(yōu)指標、新裝終端合格率等考核標準,并在CMTS運營監(jiān)測系統(tǒng)里實現(xiàn)考核報表的開發(fā),該系統(tǒng)結合移動終端APP程序,成為了一線運維人員上門裝維服務不可缺少的技術工具之一。CMTS運營監(jiān)測系統(tǒng)的部署和推廣使用,大大提高了我司運維工作效率,它與網(wǎng)絡優(yōu)化工作緊密結合,促進了我司網(wǎng)絡運行指標的穩(wěn)步提高,給PNM主動式故障運維系統(tǒng)的部署與推廣奠定了網(wǎng)絡基礎。
3.1OSS工單回單判斷
為了有效支撐寬帶業(yè)務地發(fā)展,合理分配網(wǎng)絡優(yōu)化資源,我司啟動了報障預判斷以及工單回單判斷功能。當用戶報障時,客服人員(技術崗)通過接口調度CMTS運營監(jiān)測系統(tǒng),查看當前用戶CM的發(fā)射電平、接收電平、上行SNR、下行SNR等實時(歷史)數(shù)據(jù)信息來判斷CM設備是否存在故障或網(wǎng)絡指標是否異常,然后根據(jù)實際情況選擇出單。而運維人員接到工單上門維護時便從工單上直接了解到該用戶的具體報障情況及故障預判斷等信息,排查解決故障后,在回單時會再次從CMTS運營監(jiān)測系統(tǒng)上獲取當前CM的發(fā)射電平、接收電平、上行SNR、下行SNR等指標信息,只有各指標達標后才可回單,基本杜絕同一故障多次上門維護或網(wǎng)絡指標較差而未處理的現(xiàn)象的發(fā)生,大大節(jié)約了運維成本。該功能的實現(xiàn),也給各單位運維人員初步帶來了主動維護的概念。
3.2基于高低電平差的故障定位
在雙向網(wǎng)絡的故障中,接頭故障占了70%多。經常出現(xiàn)接頭問題會引發(fā)反向侵入噪聲過高、CM發(fā)射電平和接收電平異常,給用戶的體驗就是網(wǎng)速慢、經常斷網(wǎng)。在實際運維中,我司總結出了高低電平差對比法的經驗,發(fā)現(xiàn)正向輸出電平高頻(H)、輸出端注入低頻反向信號電平(L)、CM正向接收電平(A)、CM反向發(fā)射電平(B)4個值之間有著一定的關系。在有線電視雙向分配網(wǎng)絡設計相對合理的前提下,只要保證樓放調試實行了標準化,那么H、L這兩個值就是固定的。經過大量測試發(fā)現(xiàn),只要(H+L)-(A+B)的值(Z)在一定的范圍內,網(wǎng)絡噪聲就控制的比較好。根據(jù)我司驗證,CM發(fā)射電平B的額定范圍內(30dBmV~55dBmV)對應不同的固定衰減D值得出相關數(shù)據(jù),如圖1所示,結合CM接收電平A的額定范圍(-10dBmV~15dBmV),得出黃色部分才是合理的達標區(qū)間。根據(jù)實際經驗統(tǒng)計,Z<0時,低頻衰減值過大,說明接頭(或鏈路)出現(xiàn)斷路或弱斷路現(xiàn)象;當Z>18.4時,高頻衰減值過大,說明接頭(或鏈路)出現(xiàn)短路或弱短路現(xiàn)象。一線員工只要了解CM的A+B,用固定的H+L,就能算出Z。該理論的證實及實際應用相對較準確地定位了故障原因,大大提高了運維效率。運維人員對此類主動運維的功能的需求越來越迫切。
3.3PNM試點
由于HFC雙向網(wǎng)絡長期暴露在空氣中,容易受到日照和雨水、灰塵等的影響,使得網(wǎng)絡中的設備頭端、終端、光站、放大器、衰減器、分支器、分配器以及電纜都有可能存在問題或隱患。某些存在于網(wǎng)絡中的“小問題”從表面上看對業(yè)務的影響不大,甚至對傳輸信號質量基本上沒有太大的影響,但隨著時間的推移,“小故障”有可能會引起整個系統(tǒng)指標的劣化,最后影響用戶體驗。因此,對于網(wǎng)絡中存在的故障應提前發(fā)現(xiàn)、診斷、定位和排查。在故障診斷方面,當前國內同行的主要方法是基于經驗和故障現(xiàn)象來開展的,其中主要故障現(xiàn)象包括用戶體驗下降、上網(wǎng)慢、上網(wǎng)斷線、點播卡頓等。我司此前建設部署的綜合網(wǎng)管也如行業(yè)的一樣,只呈現(xiàn)出網(wǎng)絡中某些節(jié)點的信號指標,運維人員無法快速排查故障,無法提前預知問題即將發(fā)生。另外,故障發(fā)生后,故障的定位及解決還有可能會中斷用戶網(wǎng)絡,影響用戶體驗。為進一步提升用戶滿意度,我司參考國外有線電視運營商的先進維護經驗,在2017年年初啟動了基于DOCSIS標準預均衡技術的主動式故障維護系統(tǒng)(PNM)試點的建設,探索和推進主動式故障維護。我司在佛山分公司和廣東有線各選擇有代表性的3臺處于不同分前端機房的CMTS設備,共計6臺CMTS設備,接入管理超過40000個CM終端作為試點。本次試點在廣東有線和佛山南海分公司共進行了33處現(xiàn)場驗證,根據(jù)主動式故障維護系統(tǒng)提供的大數(shù)據(jù)分析結果,準確分析故障原因及定位故障,實現(xiàn)了主動式維護的目標。本次試點總結如下。(1)待驗證樣本數(shù)據(jù)與其實際驗證準確率為100%,即抽取出來的33條待驗證樣本數(shù)據(jù)(CM)均為異常CM。(2)精確定位潛在故障所在單條鏈路或共有鏈路。(3)處理方法有效率為100%,即故障處理后較故障處理前的PNM指標均有明顯提升并恢復到PNM指標正常范圍內,同時潛在故障消失。
3.4PNM全省推廣
在對系統(tǒng)有了更深入地理解和對運維流程依托該軟件做了相應優(yōu)化后,我司于2018年在全省進行了PNM系統(tǒng)的全面推廣。我司CMTS運營監(jiān)測系統(tǒng)已經在網(wǎng)穩(wěn)定運行多年,作為各分公司日常運維工具,使用頻率非常高,極大提高了日常運維效率。PNM也是基于對CMTS/CM的采集數(shù)據(jù)進行分析,從而對分配網(wǎng)鏈路質量進行分析和處理。為了降低對設備的采集壓力和對網(wǎng)絡資源的占用比例,也為了減輕運維人員的操作難度,我司對CMTS運營監(jiān)測系統(tǒng)和PNM主動式故障維護系統(tǒng)進行了整合,形成CMTS綜合管理系統(tǒng)。該系統(tǒng)整合內容包括Web端整合、APP端整合、采集端整合。系統(tǒng)開發(fā)了智能故障判斷、故障定位分析功能,融合后的系統(tǒng)將進一步提高運維人員的工作效率。
4總結
積極推進主動式故障維護,在故障影響用戶業(yè)務之前發(fā)現(xiàn)網(wǎng)絡中的故障點、主動定位和排除故障、減少故障對用戶業(yè)務的影響,可以大大提升用戶體驗、提高用戶滿意度、促進ARPU值的增長以及降低網(wǎng)絡維護費用等方面帶來巨大積極的作用,已然成為了現(xiàn)階段廣電運營商一大重點研究方向。
參考文獻
[1]周安.淺談DOCSIS寬帶業(yè)務接入系統(tǒng)的調試與運行維護[J].廣播與電視技術,2012,39(5):96-99.
作者:李名科 余啟林 王斌 蔣曙光 單位:廣東省廣播電視網(wǎng)絡股份有限公司