王 奎,劉 昊
(國(guó)網(wǎng)天津靜海供電有限公司,天津 301600)
0 引 言
在電力的生產(chǎn)、輸送和分配過(guò)程中,能量損失是不可避免的,主要包括技術(shù)性損失和非技術(shù)性損失。技術(shù)性損失主要是子站、變壓器和線路等硬件設(shè)施造成的電力損失,非技術(shù)性損失則是在配電網(wǎng)絡(luò)中因用戶非法用電而造成的電力損失[1]。在電力系統(tǒng)中,由于存在大量不合理的用電行為,對(duì)電力系統(tǒng)造成了嚴(yán)重影響[2]。從電網(wǎng)的角度來(lái)看,竊電等手段導(dǎo)致的線損不斷增加,對(duì)電網(wǎng)的安全運(yùn)行構(gòu)成了威脅,對(duì)電力行業(yè)的健康發(fā)展造成了很大的沖擊。目前,針對(duì)電網(wǎng)異常用電行為的監(jiān)控主要依賴常規(guī)巡視、人工檢查設(shè)備配置以及旁路傳輸?shù)仁侄危@些手段不僅消耗大量的人力、物力,而且容易產(chǎn)生大量的虛警,因此需要新的識(shí)別手段來(lái)取代。針對(duì)這些問(wèn)題,通過(guò)映射用戶歷史用電行為,將其視為異常用電數(shù)據(jù)樣本,從海量數(shù)據(jù)中挖掘異常信息并識(shí)別。
隨著我國(guó)智能電網(wǎng)的不斷發(fā)展,智能電表的使用日益增多,電力企業(yè)可獲得大量配電網(wǎng)絡(luò)終端數(shù)據(jù),采集頻率較高,數(shù)據(jù)類型豐富,為數(shù)據(jù)挖掘技術(shù)的發(fā)展提供數(shù)據(jù)依據(jù)。利用數(shù)據(jù)挖掘技術(shù)對(duì)電力消費(fèi)數(shù)據(jù)進(jìn)行高效分析,及時(shí)發(fā)現(xiàn)電力消費(fèi)中的異常現(xiàn)象。與傳統(tǒng)的現(xiàn)場(chǎng)檢測(cè)方式相比,數(shù)據(jù)挖掘技術(shù)不僅能降低費(fèi)用,還能減少用電異常造成的經(jīng)濟(jì)損失,從而有效保障電力工業(yè)的安全生產(chǎn)。支持向量機(jī)是一種強(qiáng)大的分類算法,具有較強(qiáng)的適應(yīng)能力,適用于小樣本數(shù)據(jù)處理。在電力用戶用電行為異常檢測(cè)中,能夠利用有限的數(shù)據(jù)進(jìn)行學(xué)習(xí),并取得較好的分類效果。電力用戶用電行為數(shù)據(jù)可能包括電量消耗、電力峰值、用電模式等多個(gè)維度的信息。支持向量機(jī)能夠有效地處理這些高維數(shù)據(jù),提取出相關(guān)特征,通過(guò)構(gòu)建一個(gè)分類模型,學(xué)習(xí)并識(shí)別不同類型的異常用電行為,從而有效地區(qū)分正常用電行為和異常用電行為,提高異常檢測(cè)的準(zhǔn)確性。文章結(jié)合支持向量機(jī),設(shè)計(jì)研究電力用戶異常用電行為智能檢測(cè)方法。
1 電力用戶用電行為數(shù)據(jù)預(yù)處理
在電力企業(yè)運(yùn)行過(guò)程中,存在缺失值、異常值和噪聲數(shù)據(jù)等問(wèn)題,不僅會(huì)影響后續(xù)的數(shù)據(jù)分析和異常檢測(cè),還會(huì)對(duì)異常檢測(cè)算法產(chǎn)生干擾,影響異常檢測(cè)的準(zhǔn)確性。因此,為有效識(shí)別和提取用戶用電行為中的異常行為,需要對(duì)獲取的海量用戶用電行為數(shù)據(jù)進(jìn)行預(yù)處理。預(yù)處理包括缺失值處理和數(shù)據(jù)歸一化[3]。
利用拉格朗日插值方法來(lái)處理數(shù)據(jù)缺失問(wèn)題,補(bǔ)充缺失值。針對(duì)每一個(gè)已知非缺失值數(shù)據(jù)點(diǎn)(xi,yi),計(jì)算拉格朗日基函數(shù)L(x),即
式中:i表示已知數(shù)據(jù)點(diǎn)的索引;x表示自變量的取值,即要進(jìn)行插值的位置。
對(duì)于每個(gè)缺失數(shù)據(jù)點(diǎn)xj(j=m,n,…,k),將其代入插值函數(shù)L(x)來(lái)計(jì)算對(duì)應(yīng)的估計(jì)值yj,實(shí)現(xiàn)缺失數(shù)據(jù)的補(bǔ)充。由于各個(gè)電力用戶的用電行為數(shù)據(jù)特征比例不同,為了使后續(xù)的檢測(cè)精度滿足電力企業(yè)提出的檢測(cè)精度要求,需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。數(shù)據(jù)歸一化處理表達(dá)式為
式中:x'表示經(jīng)過(guò)歸一化處理后得到的電力用戶用電行為數(shù)據(jù);表示未經(jīng)過(guò)處理的電力用戶用電行為數(shù)據(jù);xmin表示原始電力數(shù)據(jù)中的最小值;xmax表示原始電力數(shù)據(jù)中的最大值。根據(jù)上述操作,完成對(duì)電力用戶用電行為數(shù)據(jù)的預(yù)處理。
2 基于支持向量機(jī)的異常用電數(shù)據(jù)檢測(cè)
針對(duì)完成預(yù)處理的電力用戶用電行為數(shù)據(jù),結(jié)合支持向量機(jī)檢測(cè)其中的異常用電數(shù)據(jù)。針對(duì)電力異常監(jiān)測(cè)中的小子樣、非線性等問(wèn)題,提出一種基于小子樣的電力異常監(jiān)測(cè)算法。該算法的實(shí)質(zhì)是借助核函數(shù)將原始數(shù)據(jù)映射到高維空間,通過(guò)這種映射將原本低維空間中無(wú)法線性分割的數(shù)據(jù)在高維空間中線性分割,并在此基礎(chǔ)上尋找滿足線性可分的最佳超平面,將非線性問(wèn)題轉(zhuǎn)化成線性可分問(wèn)題,從而解決電力異常監(jiān)測(cè)中的非線性問(wèn)題[4]。
由于傳統(tǒng)的支持向量機(jī)更適用于二分類問(wèn)題,針對(duì)電力用戶異常用電行為的多分類問(wèn)題,應(yīng)當(dāng)對(duì)其進(jìn)行優(yōu)化和擴(kuò)展。引入二叉樹(shù)法,將所有需要檢測(cè)的樣本類型劃分為2 個(gè)子類別,然后對(duì)子類別再次劃分,以此類推,直到只剩1 個(gè)類別為止,得到多個(gè)子類別。在每一個(gè)非葉節(jié)點(diǎn)上對(duì)支持向量機(jī)分類器進(jìn)行訓(xùn)練。利用支持向量機(jī)模型對(duì)電力用戶用電行為數(shù)據(jù)進(jìn)行分類,將分類結(jié)果作為二叉樹(shù)的葉子節(jié)點(diǎn)。根據(jù)分類結(jié)果的可信度等因素,將葉子節(jié)點(diǎn)進(jìn)行劃分,形成新的內(nèi)部節(jié)點(diǎn)。重復(fù)此過(guò)程,直到滿足停止條件,得到完整的二叉樹(shù)。在構(gòu)建好的二叉樹(shù)上,對(duì)需要檢測(cè)的電力用戶用電行為樣本數(shù)據(jù)進(jìn)行遍歷。根據(jù)每個(gè)節(jié)點(diǎn)的分類結(jié)果和可信度,判斷該樣本數(shù)據(jù)是否屬于異常用電行為。
為提高檢測(cè)方法的全局優(yōu)化能力,解決收斂速度慢和局部?jī)?yōu)化問(wèn)題,引入邊界收縮因子,并對(duì)其進(jìn)行位置修正[5]。在此基礎(chǔ)上,引入邊界壓縮因子,使解空間的搜索更加完整,并加快算法的收斂。通過(guò)動(dòng)態(tài)調(diào)整位置,能夠有效避免陷入局部極值的問(wèn)題。通過(guò)位置更新的動(dòng)態(tài)權(quán)重系數(shù),以此有效防止支持向量機(jī)算法陷入局部最優(yōu)的問(wèn)題。
3 異常用電行為檢測(cè)與智能預(yù)警
在完成對(duì)基于支持向量機(jī)的異常用電數(shù)據(jù)檢測(cè)的設(shè)計(jì)后,針對(duì)電力用戶的用電行為進(jìn)行檢測(cè),并實(shí)現(xiàn)智能預(yù)警。考慮到電力用戶用電數(shù)據(jù)量較大,在具體檢測(cè)過(guò)程中可利用改進(jìn)后的蟻獅優(yōu)化算法(Ant Lion Optimizer,ALO)優(yōu)化支持向量機(jī)參數(shù),以此縮短訓(xùn)練時(shí)間,提高檢測(cè)精度。
第一步,對(duì)ALO 算法和支持向量機(jī)算法進(jìn)行初始化處理;第二步,通過(guò)改進(jìn)后的ALO 算法,對(duì)支持向量機(jī)的參數(shù)進(jìn)行優(yōu)化;第三步,計(jì)算適應(yīng)性,并采集優(yōu)等參數(shù);第四步,找出最佳參數(shù),然后計(jì)算其適應(yīng)性和定位;第五步,判斷是否符合檢測(cè)結(jié)束條件,若滿足則退出,若不滿足則重復(fù)第三步;第六步,完成對(duì)支持向量機(jī)參數(shù)的優(yōu)化,并得到最優(yōu)參數(shù),利用該參數(shù)構(gòu)建模型;第七步,將檢測(cè)數(shù)據(jù)集輸入模型進(jìn)行分類,并輸出分類結(jié)果。
區(qū)分正常用戶用電行為和異常用電行為后,通過(guò)子類別的劃分可以進(jìn)一步將異常用電行為劃分為具體類型,如欠流、移相、擴(kuò)差等。結(jié)合得到的分類結(jié)果,對(duì)異常用電行為進(jìn)行預(yù)警。在預(yù)警時(shí),追溯該異常用電數(shù)據(jù)的產(chǎn)生來(lái)源、產(chǎn)生時(shí)間和持續(xù)時(shí)間,將得到的信息一起在預(yù)警顯示界面中展示,方便管理人員快速確定異常用電行為的各項(xiàng)信息,從而根據(jù)得到的檢測(cè)結(jié)果修正或屏蔽異常用電行為,確保用戶的用電安全。
4 對(duì)比實(shí)驗(yàn)
為驗(yàn)證基于支持向量機(jī)的智能檢測(cè)方法在實(shí)際應(yīng)用中的效果,將該方法作為實(shí)驗(yàn)組,將基于Grassberger 熵隨機(jī)森林的檢測(cè)方法和基于長(zhǎng)短期記憶(Long Short Term Memory,LSTM)的檢測(cè)方法作為對(duì)照組A 和對(duì)照組B,利用3 組檢測(cè)方法檢測(cè)同一電力企業(yè)中的電力用戶異常用電行為。
獲取某電力企業(yè)近3 年的電力數(shù)據(jù),其中包含3 000 名用戶的用電信息數(shù)據(jù)。將用電信息數(shù)據(jù)中的1 000 個(gè)用戶設(shè)置為竊電用戶,對(duì)數(shù)據(jù)進(jìn)行替換,即將普通用戶的數(shù)據(jù)信息轉(zhuǎn)換為竊電用戶。在實(shí)驗(yàn)過(guò)程中,模擬4 種異常用電行為,包括欠流法A、欠流法B、移相法C 以及擴(kuò)差法D,每種情況下異常用電的用戶數(shù)均為250 個(gè)。利用3 組檢測(cè)方法對(duì)獲取的3 000 名用戶的用電行為進(jìn)行智能檢測(cè),通過(guò)對(duì)比每種方法檢測(cè)到的異常用電行為用戶數(shù)量,檢驗(yàn)檢測(cè)精度。當(dāng)檢測(cè)的異常電力用戶個(gè)數(shù)與實(shí)際情況相符時(shí),表明該方法具有較高的準(zhǔn)確度。實(shí)驗(yàn)結(jié)果如表1 所示。

表1 檢測(cè)結(jié)果對(duì)比
由表1 可知,實(shí)驗(yàn)組檢測(cè)到的異常用戶數(shù)與實(shí)驗(yàn)設(shè)置的異常用戶數(shù)更接近,而對(duì)照A 組和對(duì)照B組均存在檢測(cè)到的異常用戶數(shù)與實(shí)際值差距較大的情況。因此,文章提出的基于支持向量機(jī)的智能檢測(cè)方法具有更高的檢測(cè)精度,可以實(shí)現(xiàn)對(duì)電力用戶異常用電行為的高精度檢測(cè),對(duì)于促進(jìn)電力企業(yè)用電安全具有重要意義。
5 結(jié) 論
文章主要結(jié)合支持向量機(jī)理論,提出一種全新的針對(duì)電力用戶異常用電行為的智能檢測(cè)方法。通過(guò)對(duì)比實(shí)驗(yàn),證明了該檢測(cè)方法在實(shí)際應(yīng)用中的優(yōu)勢(shì)。該方法能夠避免傳統(tǒng)人工采集數(shù)據(jù)的煩瑣過(guò)程,為電力企業(yè)的智能化轉(zhuǎn)型提供有力的技術(shù)支持。在后續(xù)的研究中,將結(jié)合更多智能化的技術(shù)和手段,如機(jī)器學(xué)習(xí)算法,實(shí)現(xiàn)對(duì)用戶異常用電行為的自主實(shí)時(shí)檢測(cè)等,促進(jìn)電力系統(tǒng)的穩(wěn)定運(yùn)行。