戴 敏
(中國聯合網絡通信有限公司江西分公司,江西 南昌 330000)
0 引 言
當前通信網絡正在飛速發展,給人們的日常生活帶來了較大的便利,但也存在被網絡黑客入侵的風險[1]。隨著網絡互動水平的逐步提高,分析通信網絡入侵風險變得越來越難。為了準確識別入侵風險,需要確定入侵節點的位置,然而大部分節點定位算法很難給出通信網絡入侵節點的具體位置,導致定位的準確性較差。以大數據技術為基礎,構建一個由接收信號強度作為距離測量的指標,采用大數據技術原理對節點定位算法進行迭代處理,是解決入侵節點定位精度低的有效手段,也是國內外學者研究的熱點話題。
劉歡等人為了解決現有的網絡攻擊方法易出現漏報、誤報等問題,將融合機器學習算法引入網絡攻擊的探測和定位[2]。基于主成分分析(Principal Component Analysis,PCA)、深度卷積神經網絡(Deep Convolutional Neural Networks,DCNN) 以及輕量的梯度提升機(Light Gradient Boosting Machine,LightGBM)3 種算法,利用PCA 方法對高維信息進行主動降維,并利用DCNN 模型來訓練降維后的數據。由于LightGBM 的邊界識別能力不強,采用基于損傷函數的權值優化方法,以提升識別的準確性和運行效率。結果顯示,提出的方法在許多方面都比LightGBM 更好,能夠很好地進行網絡攻擊的探測和定位。與傳統定位算法相比,該算法的分類準確率更高。基于此,文章將大數據技術應用到通信網絡入侵節點定位方法設計,確保通信網絡的安全運行。
1 通信網絡入侵節點定位方法設計
1.1 識別通信網絡入侵節點
在確定通信網絡入侵節點的位置前,先提取出通信網絡的大數據特征,然后計算網絡入侵節點的特征權值。然后利用大數據技術構建重要密度函數,對通信網絡入侵節點進行采樣。通過引入分布式計算方法,計算入侵節點的權重信息,識別通信網絡入侵節點,具體過程如下。
第1 步,根據通信網絡的置信度,構建網絡入侵大數據集合Γ[3]。在集合內,提取通信網絡的大數據特征ZW,即
式中:τs表示網絡入侵大數據的屬性;f(·)表示特征提取函數;σi表示大數據樣本的初始特征值。
第2 步,篩選式(1)提取的通信網絡大數據特征。計算網絡入侵節點的特征權值ω,公式為
式中:N*表示通信網絡大數據的樣本數量;λT表示網絡入侵節點的屬性權值。
第3 步,利用大數據技術構建重要密度函數[4]。采集通信網絡入侵大數據的狀態,表示為
式中:Yt表示t時刻網絡入侵大數據的初始傳輸狀態;Mt表示t時刻網絡入侵大數據通過入侵節點后的傳輸狀態;μt表示網絡入侵大數據的初始傳輸速度;vt表示網絡入侵大數據通過入侵節點后的傳輸速度。
第4 步,利用分布式計算方法,計算入侵節點的權重信息[5]。將網絡入侵節點的識別時刻定義為t,如果t-1 時刻網絡入侵大數據通過入侵節點后的傳輸狀態為Mt-1,就可以計算出入侵節點的權值,公式為
第5 步,通過估計網絡入侵節點在任意時刻的狀態,計算入侵節點的危險程度γ,即
第6 步,網絡入侵節點采樣。通過計算當前網絡入侵節點的權值信息,判斷是否有入侵節點不在網絡區域內。如果第i個入侵節點在t時刻的權值與第1 個入侵節點在t時刻的權值之比不大于3/4,說明網絡入侵節點識別失敗,需要對網絡入侵節點重新采樣。
第7 步,識別通信網絡入侵節點。假設網絡入侵節點從狀態Mt-1轉移到狀態Mt的過程中,能夠傳輸Φ0個通信網絡大數據,那么在重采樣后,就可以計算出通信網絡大數據在狀態Mt-1與狀態Mt之間的傳輸量權值,即
1.2 設計通信網絡入侵節點定位算法
在定位通信網絡入侵節點的過程中,根據網絡入侵節點的信號強度,計算入侵節點之間的接收信號強度值,將計算結果轉換為質心理論的權值,最后結合大數據技術估計入侵節點的位置,經過優化計算得到通信網絡入侵節點的準確位置。
假設E(d) 表示網絡入侵節點之間距離為d時可以接收到的平均能量,構建入侵節點信號的衰減模型為
式中:E(d0) 表示網絡入侵節點之間距離為d0時可以接收到的平均能量;ξ表示通信網絡傳輸路徑的損耗指數。
當通信網絡遭到外界攻擊時,入侵節點處的信號強度會減弱[6]。假設信號強度以dB 為單位,優化式(7),計算入侵節點之間的接收信號強度值為
式中:AdB表示高斯隨機變量。
在式(7)的模型下,入侵節點的通信射程為L,通信過程中的網絡覆蓋范圍是以L為半徑的圓形,假設第i個入侵節點的對應坐標為(xi,yi),利用大數據技術估計入侵節點的位置,表示為
式中:εi表示網絡入侵節點對應的坐標權重[7]。
通過對式(9)的優化計算,得到通信網絡入侵節點的準確位置為
式中:ς表示優化系數。
2 實例分析
2.1 設置實驗環境及參數
為了驗證本文方法在通信網絡入侵節點定位中的性能,開展對比實驗。將入侵節點隨機分布在1 000 m×1 000 m 的正方形區域內,具體分布情況如圖1 所示。

圖1 入侵節點分布
在通信區域內,根據入侵節點分布情況設置實驗參數,如表1 所示。

表1 實驗參數
2.2 通信網絡入侵節點定位測試
因為大量的入侵節點會導致通信網絡中的數據丟失,嚴重時甚至導致通信網絡停止運行,所以必須在最短的時間內確定入侵節點的位置,以確保通信網絡的安全穩定運行。測試過程中,引入基于融合機器學習算法的定位方法作為對比,測試入侵節點的定位時間,結果如圖2 所示。

圖2 通信網絡入侵節點的定位時間
從圖2 可以看出,本文方法與基于融合機器學習算法的定位方法在定位時間方面存在較大的差異。采用基于融合機器學習算法的定位方法時,對100 個通信網絡入侵節點的定位時間始終在40 ms 以上,說明該算法還需要改進。采用本文方法時,通信網絡入侵節點的定位時間控制在20 ms 以內,說明大數據技術可以在最短的時間內準確定位入侵節點,提高了通信網絡的數據傳輸速度。
3 結 論
文章提出一種基于大數據的通信網絡入侵節點定位方法,利用大數據技術識別入侵節點,通過定位算法的設計,實現了通信網絡入侵節點的定位。結果顯示,該方法可以縮短入侵節點的定位時間,避免外界攻擊影響通信網絡的安全性。在今后的研究中,將引入同態加密算法對通信網絡進行加密處理,以保證通信網絡的安全性。