基于BP神經網絡的電力工程異常數據識別技術研究
張本君
摘要:電力工程是國計民生的重要保障,如何高效、準確地識別異常數據是實施工程的必要手段。文中基于對電力工程數據的分析,利用了分層電網工程數據檢測系統,其具有分層體系結構。使用統計模型與神經網絡分類器進行數據檢測,并測試了5 種不同類型的神經網絡的性能,以及在分層數據檢測系統上進行的異常數據的壓力測試結果。基于此,本文對基于BP神經網絡的電力工程異常數據識別技術進行探討,以供相關從業人員參考。
關鍵詞:BP神經網絡;電力工程;異常數據識別技術
BP神經網絡是一種多層前饋神經網絡,信號從輸入層到隱含層,再到輸出層得到期望輸出。期望輸出同實際值做比較,若得不到所期望的值,則誤差反向傳播,調節網絡的權值和閾值。BP神經網絡作為一種引入隱含層神經元的采用多層感知器的神經網絡模型,主要由輸入層、中間層和輸出層3 個部分組成。其中,中間層即隱含層,可以是一層或多層結構。
1 BP神經網絡概述
BP神經網絡是人工神經網絡的分類中的多層前饋型神經網絡。BP神經網絡的主要特征為傳遞信號向前傳播,而誤差反向向后傳播。BP神經網絡在工作時,信息從輸入層通過隱含層到達輸出層。輸出層達不到所期望的信號,將誤差反向傳播,從而根據誤差不斷調整BP神經網絡的閾值和權重,從而使BP神經網絡的輸出值不斷逼近期望值。
2系統設計
該異常數據識別系統利用神經網絡對電力系統異常進行識別,實際上是利用神經網絡可以以任意精度逼近任一非線性函數的特性以及通過學習歷史數據建模的特點。在各種類型的神經網絡中,BP神經網絡具有輸入延遲,適合于電力系統異常數據識別。根據電力系統運行的歷史數據,設定神經網絡的輸入、輸出節點,以反映系統運行的內在規律,實現識別數據異常的目的。所以,利用神經網絡對電力系統異常數據進行識別,主要就是要設定神經網絡的輸入、輸出節點使其能反映電力系統運行規律。
3訓練樣本
在BP神經網絡模型中,在選擇樣本時,一定要盡可能的表達出系統中全部可能發生的情況所對應的狀態,這樣才能表現出來動力參數與實際測量數據一一對應的映射關系。將需要進行反分析的動力參數作為因素,要在每一個因素里面的各種組合中均要做試驗。假設在一組設計試驗中,有n個因素,并且它自身又有l1 ,l2 ,......,ln個水平,那么在進行全面試驗時,至少需要做每個水平之積次試驗。當因素及其自身對應的水平數量不太多時,運用這種算法是比較準確的。但是,隨著因素及其對應的水平越來越多,需要做的試驗次數也要幾何級數般增長。因此,在BP神經網絡的學習過程中,如果選擇合適、合理的方法選擇樣本就十分重要。
4 BP網絡模型與訓練算法
BP(BackPropagation,后向傳播)神經網絡全稱又叫作誤差反向傳播(errorBackPropagation)網絡。它是一種采用BP算法訓練的多層前饋神經網絡,每層網絡均包含一個或多個M-P神經單元構成。M-P神經單元結構,xi表示第i個輸入值,wi為該輸入值的權重,θ為該神經元的閾值,y為該神經元輸出值。其中,即神經元將n個維度的輸入值加權相加后與神經元的閾值進行比較,然后將比較值通過激活函數f處理后進行輸出。BP網絡通過不同網絡層間神經元的全連接構成。在網絡訓練學習過程中,BP算法將輸入數據通過輸入層進行輸入,并經過隱藏層計算后由輸出層進行輸出。接著輸出值與標記值進行比較,計算誤差(代價函數)。最后誤差再反向從輸出層向輸入層傳播,反向傳播過程使用梯度下降算法以目標的負梯度方向來對神經網絡上的權重和閾值進行調整。
5神經網絡識別實驗
考察5 種不同類型的神經網絡,表1 列出了Perceptron、BP、PBH、模糊ARTMAP和RBF的均方根誤差與Perceptron的誤分類率等信息。可以看到,Perceptron神經網絡表現不佳,均方根誤差在0.6~0.7 之間;誤分類率在0.1~0.2 之間。Perceptron神經網絡對異常數據的檢測錯誤與誤分類率較高。隨著隱藏神經元數量的增加,ARTMAP與RBF網絡的性能均會提高。在大多數情況下,均優于Perceptron。BP與PBH網絡具有相似性能,且兩個神經網絡始終比其他3 種類型的神經網絡表現更優。隨著隱藏神經元數量的增加,兩種神經網絡錯誤與誤分類率不會降低。
6狼群算法
狼群算法優化BP神經網絡。狼群算法是一種群智能算法,它通過模仿狼群捕獵的行為來處理優化問題。在自然界中,狼在食物鏈中處于捕獵者。狼的外形神似狗和豺,動作迅速,嗅覺靈敏,有天生的捕獵能力。狼群算法最早于2007 年提出,后來有學者發現其中存在的問題,經狼群算法優化后提出了新型狼群算法(WCA),最后,2013 年根據自然界中狼群追捕獵物,捕食,以及分配食物的方式提出的基于狼群群體智能的算法(WPA)。該算法詳細的將狼群內的種類分為頭狼、探狼、猛狼三種,并具有圍攻、召喚、奔襲、游走等行為。狼群算法同樣依據自然界中“勝者為王,適者生存”的更新機制。狼群算法的加入,形成了改進的BP神經網絡,防止網絡陷入局部極值點,提高網絡效率。
7遺傳算法
遺傳算法優化BP神經網絡。算法主要包括三部分:初始化BP神經網絡結構、遺傳算法優化和BP神經網絡識別。其中初始化BP神經網絡結構包括:確定輸入層、隱含層和輸出層節點個數,以及初始化網絡的權值和閾值等參數。遺傳算法優化BP神經網絡是將一個網絡中的所有權值和閾值看作種群中的一個個體,然后通過選擇、交叉和變異的操作得到最優的個體,即最優權值和閾值,并將該組權值閾值賦給BP神經網絡作為初始的權值和閾值。最后的BP神經網絡識別部分,是利用遺傳算法優化的初始權值和閾值來訓練網絡,再利用訓練好的神經網絡進行識別。
結束語
為實現電網工程建設中對異常數據的檢測,建立了分布分層的數據檢測系統。其是一種使用統計預處理與神經網絡分類的異常數據檢測算法。通過對5 種不同的神經網絡進行對比實驗,可得出結論:BP與PBH網絡的性能優于Perceptron、模糊ARTMAP和RBF等3 種神經網絡。考慮到構建成本最終選取BP神經網絡作為系統的神經網絡分類器,在此基礎上還進行了系統測試。結果表明,系統能夠可靠地檢測到異常數據,其流量強度僅為背景強度的5%~10%,證明了該系統的有效性。