快速增長的互聯網連接需求給企業改善網絡基礎設施、性能和其他關鍵參數帶來了壓力。網絡管理員總是會遇到運行多個網絡應用程序的不同類型的網絡。每個網絡應用程序都有自己的一組特性和性能參數,這些特性和參數可能會動態變化。由于網絡的多樣性和復雜性,使用為這種網絡場景構建的傳統算法或硬編碼技術是一項具有挑戰性的任務。
事實證明,機器學習在幾乎所有行業都是有益的,網絡行業也不例外。機器學習可以幫助解決棘手的網絡障礙,促進新的網絡應用程序的應用,使網絡變得非常方便。以下詳細討論基本工作流程以及一些用例,以便更好地理解網絡領域中的應用機器學習技術。
智能網絡流量管理
伴隨對物聯網(IoT)解決方案的需求日益增長,現代網絡產生大量的異構流量數據。對于這樣一個動態網絡,傳統的網絡流量監控和數據分析網絡管理技術(如ping監控、日志文件監控,甚至SNMP)是不夠的。它們通常缺乏對實時數據的準確性和有效處理。另一方面,由于設備移動性和網絡異構性,網絡中來自其他來源(如蜂窩設備或移動設備)的流量相對顯示出更復雜的行為。
機器學習有助于在大數據系統和大區域網絡中進行分析,以便在管理此類網絡時識別復雜模式。鑒于這些機會,網絡領域的研究人員將深度學習模型用于網絡流量監控和分析應用,如流量分類和預測、擁塞控制等。
帶內網絡遙測技術
網絡遙測數據提供了有關網絡性能的基本指標。這些信息通常很難解釋。考慮到網絡的規模和通過網絡的總數據,分析數據具有巨大的價值。如果使用得當,它可以顯著提高性能。
比如帶內網絡遙測等新興技術可以幫助實時收集詳細的網絡遙測數據。最重要的是,在這些數據集上運行機器學習可以幫助關聯延遲、路徑、交換機、路由器、事件等之間的現象。使用傳統方法很難從大量實時數據中指出這些現象。
機器學習模型經過訓練以理解遙測數據中的相關性和模式。這些算法最終獲得了基于歷史數據學習的預測將來的能力。這有助于管理將來的網絡中斷。
資源分配和擁塞控制
每個網絡基礎設施都有預定義的可用總吞吐量。它被進一步分割成不同預定義帶寬的多個通道。在這樣的場景中,如果每個最終用戶的總帶寬使用量是靜態預定義的,在網絡被大量使用的某些部分可能會出現瓶頸。
為了避免這種擁塞,可以訓練監督機器學習模型來實時分析網絡流量,并以使網絡遇到的瓶頸最少的方式推斷出每個用戶的合適帶寬量。
這些模型可以從網絡統計數據中學習,比如每個網絡節點的總活動用戶、每個用戶的歷史網絡使用數據、基于時間的數據使用模式、用戶在多個接入點之間的移動等。
流量分類
在每個網絡中,都存在各種各樣的流量,如Web托管(HTTP)、文件傳輸(FTP)、安全瀏覽(HTTPS)、HTTP實時視頻流(HLS)、終端服務(SSH)等。當涉及到網絡帶寬使用時,每一種行為都不同;比如,通過FTP傳輸文件會在傳輸期間連續使用大量數據。
另一個例子是,如果一個視頻是流媒體的,它使用數據塊和緩沖方法。當允許這些不同類型的流量以無監督的方式使用網絡時,將會造成一些臨時阻塞。
為了避免這種情況,可以使用機器學習分類器來分析和分類通過網絡的流量類型。然后,可以使用這些模型來推斷網絡參數,如分配的帶寬、數據上限等,這反過來可以通過改進所服務請求的調度以及動態更改分配的帶寬來幫助提高網絡性能。
網絡安全
網絡攻擊數量的增加迫使企業持續監控和關聯整個網絡基礎設施及其用戶的數百萬外部和內部數據點。人工管理大量實時數據變得很困難。這就是機器學習發揮重要的地方。
機器學習可以識別網絡中的某些模式和異常,并預測大量數據集中的威脅,所有這些都是實時的。通過對此類分析進行自動化,網絡管理人員可以輕松地檢測威脅并快速隔離情況,而無需耗費大量人力。
網絡攻擊識別與預防
網絡行為是機器學習系統中用于異常檢測的一個重要參數。機器學習引擎實時處理大量數據,以識別威脅、未知惡意軟件和違反安全策略的行為。
如果發現網絡行為在預定義行為范圍內,則接受網絡事務;否則,將在系統中觸發警報。這可用于防止DoS、DDoS和探測等多種攻擊。
防止網絡釣魚
誘騙某人點擊看似合法的惡意鏈接,然后利用收集到的信息試圖突破計算機的防御系統是很容易的。機器學習有助于標記可疑網站,以幫助防止人們不小心連接到惡意網站。
比如,文本分類器機器學習模型可以讀取和理解URL,并識別那些偽造的釣魚URL。這將為最終用戶創造更安全的瀏覽體驗。
機器學習在網絡中的集成并不局限于上述的用例。通過從網絡和機器學習的角度闡明機會和研究,可以在使用機器學習用于網絡和網絡安全領域開發解決方案,以解決尚未解決的問題。