自 1794 年 C. F. Gauss 首先提出最小二乘估計起,回歸分析已經有 200 餘年的歷史,在這 200 年間,回歸分析受到廣泛套用,幾乎難以找到用不到它的領域,電力系統也不例外。
關注節點的諧波電壓與潛在的諧波源負荷的諧波電流之間存在一定的線性相關性,且這種線性相關性規律具有普遍性。此後,Mazin H E, Xu W, Huang B首次闡述了多諧波源諧波責任問題,並利用最小二乘估計計算了諧波責任。對於滿足基本假設的回歸模型,最小二乘估計可以得到較為理想的結果,但在實際問題研究中,最小二乘估計的回歸結果,卻總是不那么令人滿意,其中最著名的問題為:有些觀察值(稱為異常值)偏離假定的模式。簡單的操作錯誤、包含另一總體的少量樣本等都會產生異常值,異常值會對統計推斷產生嚴重的影響。鑒於此,利用 M 估計穩健回歸對多諧波源諧波責任進行劃分,以期得到優於最小二乘估計的結果。
M 估計的基本思想是採用疊代加權最小二乘估計來計算回歸係數。該方法通過對不同的點施加不同的權重來減小遠端數據的影響,具體實施方法為對殘差小的點給予較大的權重,對殘差大的點給予較小的權重,據此建立加權最小二乘估計。權重係數的確定需通過反覆疊代來使其改變數小於一定的允許誤差,以此來達到穩健的目的。
對比
一般情況下,M 估計和最小二乘估計均可以有效評估諧波責任,M 估計的評估結果更加接近真實值。但某些情況下,如樣本數據中出現高影響點時,最小二乘估計遠遠偏離真實情況,甚至出現了負責任(負責任表示該諧波源對關注節點的諧波電壓有抵消作用),該種情況下最小二乘估計無法正確評估諧波責任,此時 M 估計的優越性將更加凸顯。
嶺估計
套用最小二乘估計求解多元回歸模型需要滿足係數矩陣滿秩這一條件。實際情況中這一條件往往得不到滿足,各諧波源的諧波電流數據可能並不相互獨立。為解決該問題,套用嶺估計,通過仿真算例驗證,在係數矩陣非滿秩(以下稱之為病態)情況下,嶺估計優於最小二乘估計。雖然最小二乘估計中 M 估計亦優於最小二乘估計,但在係數矩陣嚴重病態情況下,M 估計疊代次數過多,甚至不收斂,需要降低精度進行求解,精度降低又會降低解的準確度。
嶺估計原理
嶺估計的基本思想是:在自變數信息矩陣的主對角線元素上人為地加入一個非負因子 k ,從而使回歸係數的估計稍有偏差、而估計的穩定性卻可能明顯提高的一種回歸分析方法。它是最小二乘估計的一種補充,近年來,在經濟、工業生產、工程技術、環境保護等方面已有一定的套用。
多元線性回歸模型的矩陣形式為: y = Xβ + ε 其中, y 為 h 維測量量, X 為 h×s 係數矩陣, β 為 s 維待估參數向量, ε 為 h維誤差向量。 該式的最小二乘解是當係數矩陣 X 呈病態,即 X 的列向量之間有較強的線性相關性時,變數之間將出現嚴重的多重共線性,此時 X求逆會很不穩定,最終導致計算出的 βˆ與真實值有較大偏差,甚至有時候會出現與實際意義不相符的正負號。針對係數矩陣病態問題,數學上通常用嶺估計來克服係數矩陣的病態性,它是一種在均方誤差意義下優於最小二乘估計的方法,根據吉洪諾夫(Tikhonov)正則化原理可進行推導。
是在非主要諧波源負荷在S母線產生的h次諧波電壓,稱之為殘餘諧波電壓,這個諧波電壓相對於主要諧波源負荷產生的諧波電壓是很小的,因此不用考慮其是否波動的情況。但在考慮諧波污染的情況下, 並不是一個可以忽略不計的誤差量,所以多元回歸模型 y = Xβ + ε 重新定義為如下形式: y = Xβ + V+ ε。 式中,y 為 h 維測量量,X 為 h×s 係數矩陣,β 為 s 維待估參數向量,V 為未知光滑參數, ε 為 h 維誤差向量。
套用場景
(1)根據所建立的多元回歸模型劃分多諧波源諧波責任,用傳統最小二乘估計進行回歸時需要滿足係數矩陣滿秩這一條件,但實際情況這一條件往往得不到滿足,在電網中各諧波源的諧波電流數據可能並不相互獨立,為了克服該問題,提出了嶺估計。本章從病態產生的原因開始分析,介紹了嶺估計的原理、性質及嶺參數 k 的選擇方法。從理論上證明嶺估計可以在諧波電流數據線性相關,即係數矩陣病態時較好地改善病態解,從而使計算的諧波阻抗更接近真實值,進而更好地計算諧波責任。
(2)通過係數矩陣非病態情況、病態情況,病態情況又分為集中式多諧波源和分散式多諧波源兩種情況驗證本文方法的可行性。仿真結果表明,在諧波電流數據非病態情況下,三種方法均能得到較為接近真實值的結果;而在諧波電流數據病態情況下,最小二乘估計失效,嶺估計能較好的計算出相應的諧波阻抗值,且計算量小,M 估計依賴於數據選擇且與所設定精度相關,數據相關性嚴重的情況下 M 估計需要疊代的次數比較多,甚至不收斂,降低精度後難以得到正確結果,數據相關性一般情況下,M 估計準確度與精度的選擇相關,計算準確度也有所下降。相比之下,嶺估計方法簡單,計算方便。