王 奎,劉 昊
(國網天津靜海供電有限公司,天津 301600)
0 引 言
在電力的生產、輸送和分配過程中,能量損失是不可避免的,主要包括技術性損失和非技術性損失。技術性損失主要是子站、變壓器和線路等硬件設施造成的電力損失,非技術性損失則是在配電網絡中因用戶非法用電而造成的電力損失[1]。在電力系統中,由于存在大量不合理的用電行為,對電力系統造成了嚴重影響[2]。從電網的角度來看,竊電等手段導致的線損不斷增加,對電網的安全運行構成了威脅,對電力行業的健康發展造成了很大的沖擊。目前,針對電網異常用電行為的監控主要依賴常規巡視、人工檢查設備配置以及旁路傳輸等手段,這些手段不僅消耗大量的人力、物力,而且容易產生大量的虛警,因此需要新的識別手段來取代。針對這些問題,通過映射用戶歷史用電行為,將其視為異常用電數據樣本,從海量數據中挖掘異常信息并識別。
隨著我國智能電網的不斷發展,智能電表的使用日益增多,電力企業可獲得大量配電網絡終端數據,采集頻率較高,數據類型豐富,為數據挖掘技術的發展提供數據依據。利用數據挖掘技術對電力消費數據進行高效分析,及時發現電力消費中的異常現象。與傳統的現場檢測方式相比,數據挖掘技術不僅能降低費用,還能減少用電異常造成的經濟損失,從而有效保障電力工業的安全生產。支持向量機是一種強大的分類算法,具有較強的適應能力,適用于小樣本數據處理。在電力用戶用電行為異常檢測中,能夠利用有限的數據進行學習,并取得較好的分類效果。電力用戶用電行為數據可能包括電量消耗、電力峰值、用電模式等多個維度的信息。支持向量機能夠有效地處理這些高維數據,提取出相關特征,通過構建一個分類模型,學習并識別不同類型的異常用電行為,從而有效地區分正常用電行為和異常用電行為,提高異常檢測的準確性。文章結合支持向量機,設計研究電力用戶異常用電行為智能檢測方法。
1 電力用戶用電行為數據預處理
在電力企業運行過程中,存在缺失值、異常值和噪聲數據等問題,不僅會影響后續的數據分析和異常檢測,還會對異常檢測算法產生干擾,影響異常檢測的準確性。因此,為有效識別和提取用戶用電行為中的異常行為,需要對獲取的海量用戶用電行為數據進行預處理。預處理包括缺失值處理和數據歸一化[3]。
利用拉格朗日插值方法來處理數據缺失問題,補充缺失值。針對每一個已知非缺失值數據點(xi,yi),計算拉格朗日基函數L(x),即
式中:i表示已知數據點的索引;x表示自變量的取值,即要進行插值的位置。
對于每個缺失數據點xj(j=m,n,…,k),將其代入插值函數L(x)來計算對應的估計值yj,實現缺失數據的補充。由于各個電力用戶的用電行為數據特征比例不同,為了使后續的檢測精度滿足電力企業提出的檢測精度要求,需要對數據進行標準化處理。數據歸一化處理表達式為
式中:x'表示經過歸一化處理后得到的電力用戶用電行為數據;表示未經過處理的電力用戶用電行為數據;xmin表示原始電力數據中的最小值;xmax表示原始電力數據中的最大值。根據上述操作,完成對電力用戶用電行為數據的預處理。
2 基于支持向量機的異常用電數據檢測
針對完成預處理的電力用戶用電行為數據,結合支持向量機檢測其中的異常用電數據。針對電力異常監測中的小子樣、非線性等問題,提出一種基于小子樣的電力異常監測算法。該算法的實質是借助核函數將原始數據映射到高維空間,通過這種映射將原本低維空間中無法線性分割的數據在高維空間中線性分割,并在此基礎上尋找滿足線性可分的最佳超平面,將非線性問題轉化成線性可分問題,從而解決電力異常監測中的非線性問題[4]。
由于傳統的支持向量機更適用于二分類問題,針對電力用戶異常用電行為的多分類問題,應當對其進行優化和擴展。引入二叉樹法,將所有需要檢測的樣本類型劃分為2 個子類別,然后對子類別再次劃分,以此類推,直到只剩1 個類別為止,得到多個子類別。在每一個非葉節點上對支持向量機分類器進行訓練。利用支持向量機模型對電力用戶用電行為數據進行分類,將分類結果作為二叉樹的葉子節點。根據分類結果的可信度等因素,將葉子節點進行劃分,形成新的內部節點。重復此過程,直到滿足停止條件,得到完整的二叉樹。在構建好的二叉樹上,對需要檢測的電力用戶用電行為樣本數據進行遍歷。根據每個節點的分類結果和可信度,判斷該樣本數據是否屬于異常用電行為。
為提高檢測方法的全局優化能力,解決收斂速度慢和局部優化問題,引入邊界收縮因子,并對其進行位置修正[5]。在此基礎上,引入邊界壓縮因子,使解空間的搜索更加完整,并加快算法的收斂。通過動態調整位置,能夠有效避免陷入局部極值的問題。通過位置更新的動態權重系數,以此有效防止支持向量機算法陷入局部最優的問題。
3 異常用電行為檢測與智能預警
在完成對基于支持向量機的異常用電數據檢測的設計后,針對電力用戶的用電行為進行檢測,并實現智能預警。考慮到電力用戶用電數據量較大,在具體檢測過程中可利用改進后的蟻獅優化算法(Ant Lion Optimizer,ALO)優化支持向量機參數,以此縮短訓練時間,提高檢測精度。
第一步,對ALO 算法和支持向量機算法進行初始化處理;第二步,通過改進后的ALO 算法,對支持向量機的參數進行優化;第三步,計算適應性,并采集優等參數;第四步,找出最佳參數,然后計算其適應性和定位;第五步,判斷是否符合檢測結束條件,若滿足則退出,若不滿足則重復第三步;第六步,完成對支持向量機參數的優化,并得到最優參數,利用該參數構建模型;第七步,將檢測數據集輸入模型進行分類,并輸出分類結果。
區分正常用戶用電行為和異常用電行為后,通過子類別的劃分可以進一步將異常用電行為劃分為具體類型,如欠流、移相、擴差等。結合得到的分類結果,對異常用電行為進行預警。在預警時,追溯該異常用電數據的產生來源、產生時間和持續時間,將得到的信息一起在預警顯示界面中展示,方便管理人員快速確定異常用電行為的各項信息,從而根據得到的檢測結果修正或屏蔽異常用電行為,確保用戶的用電安全。
4 對比實驗
為驗證基于支持向量機的智能檢測方法在實際應用中的效果,將該方法作為實驗組,將基于Grassberger 熵隨機森林的檢測方法和基于長短期記憶(Long Short Term Memory,LSTM)的檢測方法作為對照組A 和對照組B,利用3 組檢測方法檢測同一電力企業中的電力用戶異常用電行為。
獲取某電力企業近3 年的電力數據,其中包含3 000 名用戶的用電信息數據。將用電信息數據中的1 000 個用戶設置為竊電用戶,對數據進行替換,即將普通用戶的數據信息轉換為竊電用戶。在實驗過程中,模擬4 種異常用電行為,包括欠流法A、欠流法B、移相法C 以及擴差法D,每種情況下異常用電的用戶數均為250 個。利用3 組檢測方法對獲取的3 000 名用戶的用電行為進行智能檢測,通過對比每種方法檢測到的異常用電行為用戶數量,檢驗檢測精度。當檢測的異常電力用戶個數與實際情況相符時,表明該方法具有較高的準確度。實驗結果如表1 所示。

表1 檢測結果對比
由表1 可知,實驗組檢測到的異常用戶數與實驗設置的異常用戶數更接近,而對照A 組和對照B組均存在檢測到的異常用戶數與實際值差距較大的情況。因此,文章提出的基于支持向量機的智能檢測方法具有更高的檢測精度,可以實現對電力用戶異常用電行為的高精度檢測,對于促進電力企業用電安全具有重要意義。
5 結 論
文章主要結合支持向量機理論,提出一種全新的針對電力用戶異常用電行為的智能檢測方法。通過對比實驗,證明了該檢測方法在實際應用中的優勢。該方法能夠避免傳統人工采集數據的煩瑣過程,為電力企業的智能化轉型提供有力的技術支持。在后續的研究中,將結合更多智能化的技術和手段,如機器學習算法,實現對用戶異常用電行為的自主實時檢測等,促進電力系統的穩定運行。