開篇:“智能+”時(shí)代網絡智能化的必要(yào)性
随著(zhe)人(rén)類社會第四次工業革命的到來,各行(xíng)各業的數(shù)字化和智能化轉型提到了前所未有(yǒu)的高度。2019年中(zhōng)國政府工作(zuò)報告更是(shì)首次提出“智能+”作(zuò)為(wèi)國家戰略。Gartner的技術(shù)曲線(xiàn)也(yě)表明,用(yòng)新一(yī)代智能技術(shù)為(wèi)傳統産業轉型升級進行(xíng)賦能乃大勢所趨,例如(rú)智慧城市和工業4.0等。網絡作(zuò)為(wèi)智能化時(shí)代的基礎設施和支撐底座,其本身(shēn)也(yě)急需進行(xíng)智能化的演進和升級。
數(shù)字化轉型的驅動力和
對網絡管理的挑戰
》數(shù)字化轉型的驅動力
業務(wù)數(shù)據化。企業數(shù)字化轉型意味著(zhe)進行(xíng)業務(wù)、流程和組織再造,把企業的核心資(zī)産、流程和管理等全部上網,即進行(xíng)業務(wù)數(shù)據化。而網絡是(shì)業務(wù)運行(xíng)和數(shù)據承載的基礎,因此網絡平均故障發生間隔(MTTF)面臨更高的要(yào)求;同時(shí),要(yào)求具備一(yī)定的網絡故障預判預測能力,故障後業務(wù)恢複更加迅速。
數(shù)據業務(wù)化。企業的數(shù)據是(shì)企業的重要(yào)資(zī)産,借助數(shù)據綜合分析,更好地發揮價值為(wèi)企業業務(wù)目标服務(wù),即數(shù)據業務(wù)化。數(shù)據業務(wù)化要(yào)求信息系統能夠更好地理解和承載業務(wù)目标。
業務(wù)需求和信息系統之間的縫隙需要(yào)彌合。意圖網絡(IBN,Intent-Based Network)的出現(xiàn)提供了一(yī)種很好的方式,把業務(wù)意圖轉變為(wèi)系統策略,并下(xià)發給網絡等基礎設施執行(xíng)。
》傳統網絡管理的挑戰
傳統網絡管理系統的挑戰來自(zì)于多個方面,主要(yào)表現(xiàn)在(zài):
對于業務(wù)意圖(Intent)的解析和轉化存在(zài)不足。傳統網絡管理系統多是(shì)基于網元的管理操作(zuò)系統,對于意圖的轉化和自(zì)動化處理在(zài)最初的系統設計上欠考慮。
其次,囿于數(shù)據采集和計算(suàn)處理手段有(yǒu)限,傳統網絡管理系統的快速反應能力和大數(shù)據分析處理能力受限,基本上屬于被動反應式(Reactive)處理系統。存在(zài)救火式維護、問(wèn)題定位難、恢複難以閉環等諸多明顯弊端。
數(shù)據驅動智能,數(shù)字化轉型有(yǒu)了數(shù)據,為(wèi)業務(wù)智能化奠定了基礎。ABC技術(shù)(指AI,Big Data,Cloud)的出現(xiàn),為(wèi)綜合性的智能分析洞察提供了支撐。社會各行(xíng)各業,正在(zài)“智能+”思路的指引下(xià)迅猛發展。網絡,也(yě)在(zài)遵循這(zhè)個趨勢進行(xíng)快速革新和演進。
新華三新一(yī)代網絡AI架構和實踐
》基于AI的先知(zhī)網絡管理框架
新華三在(zài)網絡領域對解決方案、技術(shù)創新和運維管理等有(yǒu)近三十年的經驗和積累。正是(shì)基于對網絡行(xíng)業的深厚理解,結合AI和大數(shù)據等技術(shù),創新性地提出了先知(zhī)網絡管理框架。該框架總體(tǐ)上包括三個大的組成部分,即雲端先知(zhī)服務(wù)中(zhōng)心(SeerService Center)、局端(企業本地)先知(zhī)網絡中(zhōng)心(SeerNetwork Architecture Center,簡稱SNA Center)和移動端先知(zhī)精靈App(SeerGenie)。
移動端先知(zhī)精靈App主要(yào)功能包括園區(qū)無線(xiàn)接入診斷、設備版本分析和關鍵信息推送等。其出發點是(shì)基于移動優先策略,給最終用(yòng)戶或者運維人(rén)員(yuán)提供一(yī)個便攜工具,提升使用(yòng)體(tǐ)驗。
局端先知(zhī)網絡架構中(zhōng)心,通(tōng)常安裝在(zài)客戶本地,包括SNA Center、SeerEngine(先知(zhī)控制(zhì)器(qì))和SeerAnalyzer(先知(zhī)分析器(qì))三個組件。主體(tǐ)功能劃分上Center負責意圖翻譯,控制(zhì)器(qì)負責自(zì)動化,分析器(qì)負責智能化。
客戶業務(wù)意圖通(tōng)過控制(zhì)器(qì)轉譯為(wèi)策略,并最終轉換成設備能理解的配置指令。
從系統論的角度,網絡可當作(zuò)一(yī)個動态系統來考慮。動态系統過程包括健康度判斷、問(wèn)題故障定位、修複措施計算(suàn)和配置動作(zuò)關聯等,其後面的關鍵之處在(zài)于基于數(shù)據的AI/ML學(xué)習(xí)和分析。一(yī)個完整的流程包括:數(shù)據感知(zhī)、存儲計算(suàn)、智能分析、可視(shì)化展示和優化閉環;優化後的數(shù)據進行(xíng)新一(yī)輪的感知(zhī),并依此循環,如(rú)圖3所示。對于SNA架構來說(shuō),先知(zhī)分析器(qì)實現(xiàn)從數(shù)據的感知(zhī)到分析洞察,先知(zhī)控制(zhì)器(qì)實現(xiàn)優化閉環動作(zuò)。
新一(yī)代智能網絡分析+動作(zuò)系統,從面向業務(wù)的數(shù)據感知(zhī)到主動智能分析,以及仿真預測和動作(zuò)閉環,提供基于意圖的智能管理能力。
》面向業務(wù)的數(shù)據感知(zhī)
數(shù)據是(shì)新時(shí)代的石油。于網絡而言,數(shù)據是(shì)網絡新時(shí)代—網絡智能化時(shí)代的石油。一(yī)方面,數(shù)據驅動業務(wù)的發展,數(shù)據的重要(yào)性不言而喻;另一(yī)方面,業務(wù)拉動數(shù)據的開采,對于網絡業務(wù)智能化系統而言,需要(yào)兼顧成本和效益,數(shù)據采集并非來者不拒。因此,應更加重視(shì)面向業務(wù)進行(xíng)數(shù)據采集,數(shù)據服務(wù)于業務(wù),從而更好地服務(wù)于用(yòng)戶。結合先知(zhī)網絡架構,從深度、廣度和精度三個方面進行(xíng)闡述。
深度數(shù)據感知(zhī)服務(wù)于業務(wù)。Zoom-In方向,從Underlay物(wù)理管道,到Overlay邏輯管道,到會話應用(yòng),再到報文(wén)隊列。Zoom-Out方向,從鏈路,到設備,到區(qū)域網絡,到企業全局網絡。例如(rú)對于隊列報文(wén)的丢包和時(shí)空信息,綜合分析丢包對客戶具體(tǐ)應用(yòng)的影(yǐng)響,并将影(yǐng)響在(zài)對應的應用(yòng)層、邏輯層和物(wù)理層上呈現(xiàn)出來。
廣度數(shù)據感知(zhī)服務(wù)于業務(wù)。時(shí)間維度從曆史旅程到現(xiàn)在(zài),範圍維度從網絡本身(shēn)到周邊上下(xià)文(wén),過程維度從單一(yī)系統到綜合聯動。通(tōng)過采集5W1H數(shù)據,多維度關聯分析後,對于SeerAnalyzer-Campus場景,實現(xiàn)數(shù)據感知(zhī)。
精度數(shù)據感知(zhī)服務(wù)于業務(wù)。精度可從時(shí)間精度和空間精度兩方面來看。通(tōng)過流式Telemetry/GRPC進行(xíng)高速數(shù)據采集,例如(rú)以毫秒級的速度感知(zhī)芯片buffer的變化,來分析網路的流量擁堵/暢通(tōng)程度,真正明察秋“毫”。Telemetry/GRPC是(shì)先知(zhī)分析器(qì)支持的标配技術(shù)(需芯片支持),而傳統的SNMP做(zuò)不到。通(tōng)過INT(In-Band-Telemetry)方式,對應用(yòng)路徑沿途的時(shí)空(時(shí)間戳和鏈路/端口)信息進行(xíng)精準測量和分析後,可以呈現(xiàn)全路徑,消除路徑盲區(qū),實現(xiàn)沿途時(shí)延的可視(shì)化,有(yǒu)效幫助故障根因分析。
》先知(zhī)分析器(qì)的主動分析
主動(Proactive)智能分析是(shì)指SeerAnalyzer對感知(zhī)和采集到的數(shù)據,基于智能模型和邏輯算(suàn)法在(zài)後台不間斷地進行(xíng)多維綜合計算(suàn),及時(shí)發現(xiàn)網絡當前故障和隐患,并基于時(shí)序數(shù)據的動态學(xué)習(xí),進行(xíng)異常檢測和趨勢預測。
設備健康度是(shì)一(yī)個典型的主動分析計算(suàn)的例子(zi)(zǐ),通(tōng)過對交換機系統平面、控制(zhì)平面和數(shù)據平面關鍵指标的綜合計算(suàn),以打分形式展現(xiàn)單台設備健康度;綜合計算(suàn)可得到整個網絡健康度。系統平面包括常見的CPU、内存、電源、風扇和溫度等子(zi)(zǐ)項指标;數(shù)據平面包括鏈路狀态、轉發表、ACL資(zī)源、芯片Buffer等子(zi)(zǐ)項指标;控制(zhì)平面,包括BGP到RR連通(tōng)狀态等。這(zhè)些(xiē)指标,根據新華三的多年網絡經驗賦予不同的算(suàn)子(zi)(zǐ)權重。同時(shí),這(zhè)是(shì)一(yī)個可擴充的指标體(tǐ)系,針對網絡場景可以增加或更新指标項。
主動分析追求故障發現(xiàn)的及時(shí)性和準實時(shí)性,有(yǒu)别于傳統意義上的被動式事(shì)後處理,一(yī)方面降低MTTK(MeanTime-To-Know),另一(yī)方面增強在(zài)線(xiàn)檢測和預測水平,提升網絡管理智能化水平。
》預測仿真以及先知(zhī)先覺
對網絡中(zhōng)不同網元設備的時(shí)序數(shù)據進行(xíng)周期性采集,基于模型主動計算(suàn),可以建立客戶場景環境相(xiàng)關的動态基線(xiàn),并對異常進行(xíng)檢測;或實現(xiàn)趨勢預測,如(rú)光學(xué)器(qì)件壽命預測,流量趨勢預測,系統容量預測等。
網絡仿真,可在(zài)新業務(wù)上線(xiàn)前仿真對當前在(zài)網業務(wù)的影(yǐng)響,分析出設備和鏈路故障對現(xiàn)有(yǒu)業務(wù)的影(yǐng)響、網絡變更的影(yǐng)響範圍等,從而分析制(zhì)定必要(yào)的應對措施,保證業務(wù)的可靠運行(xíng)。其原理基礎是(shì)whatif分析,作(zuò)為(wèi)一(yī)種統計分析工具,在(zài)網絡中(zhōng)結合控制(zhì)平面和數(shù)據平面變化因素分析,有(yǒu)利于提前做(zuò)好網絡變更的模拟并制(zhì)定預案。
》融合分析器(qì)+控制(zhì)器(qì)的網絡優化機制(zhì)
WAN鏈路的帶寬是(shì)一(yī)種寶貴的資(zī)源,同時(shí)對可靠性也(yě)提出非常高的要(yào)求, WAN鏈路優化是(shì)一(yī)個曆久彌新的關鍵問(wèn)題。在(zài)SD-WAN中(zhōng),可以借助于SNA架構的分析器(qì)SeerAnalyzer和控制(zhì)器(qì)SeerEngine組合提供一(yī)種新的解決方案。
形象地說(shuō),分析器(qì)實現(xiàn)大腦思考過程,控制(zhì)器(qì)實現(xiàn)手眼配合等執行(xíng)過程。
借助于分析器(qì),對WAN鏈路狀态進行(xíng)主動計算(suàn),同時(shí)根據時(shí)序數(shù)據建立鏈路的動态AI基線(xiàn),綜合判斷給出鏈路優化和切換依據。控制(zhì)器(qì)基于分析器(qì)提供的 “依據”自(zì)動化的下(xià)發和調整相(xiàng)關設備 配置;新的鏈路狀态依然會重複這(zhè)個過程,從而實現(xiàn)了一(yī)種負反饋的閉環機制(zhì),園區(qū)的WiFi優化場景等也(yě)是(shì)如(rú)此。
總結起來看,借助于SNA架構,可以從數(shù)據采集開始,到事(shì)前、事(shì)中(zhōng)和事(shì)後不同時(shí)間,到網絡、用(yòng)戶和應用(yòng)不同角度,進行(xíng)多維度分析和洞察,并通(tōng)過可視(shì)化展示和優化聯動,促進網絡智能化管理水平提升。
網絡智能化的演進
網絡智能化的發展是(shì)一(yī)個循序漸進的過程,目前仍然處在(zài)比較初級的階段。面向未來,一(yī)方面,網絡智能運維将借助于相(xiàng)關技術(shù)的發展繼續提升;另一(yī)方面,自(zì)動駕駛網絡是(shì)一(yī)個更加激動人(rén)心和更具業務(wù)價值的方向。這(zhè)裏面包括業務(wù)場景的豐富和技術(shù)的進步,也(yě)包括行(xíng)業标準的建立和客戶價值提升等。
就智能運維來說(shuō),當前更多地是(shì)基于數(shù)據為(wèi)主的感知(zhī)智能的作(zuò)用(yòng),這(zhè)裏的數(shù)據主要(yào)是(shì)指網絡設備軌迹數(shù)據以及相(xiàng)關的周邊上下(xià)文(wén)數(shù)據。從網絡系統的複雜(zá)度、管理效率和人(rén)機友(yǒu)好等角度看,專家知(zhī)識和業務(wù)經驗将是(shì)一(yī)個有(yǒu)待深挖的寶藏,也(yě)預示著(zhe)認知(zhī)智能将在(zài)這(zhè)一(yī)過程中(zhōng)發揮更大的作(zuò)用(yòng)。
就自(zì)動駕駛網絡來說(shuō)将會分階段演進,從輔助駕駛、部分自(zì)動化、有(yǒu)條件自(zì)動化到高度自(zì)動化和最終的全自(zì)動。就像車輛的自(zì)動駕駛,一(yī)輛傳統的車,由于機制(zhì)原理從一(yī)開始不具備智能部件,即使全方位運維保養做(zuò)得再到位,也(yě)實現(xiàn)不了自(zì)動駕駛。網絡的智能運維和網絡自(zì)動駕駛也(yě)是(shì)類似的情況。
“智能+”的浪潮席卷全球,也(yě)在(zài)革新網絡行(xíng)業的發展。新華三希望借助SNA架構,通(tōng)過網絡智能驅動客戶業務(wù)智能化的發展,大力推動智慧城市建設和工業4.0等方向的數(shù)字化轉型。