基礎介紹
對於平面上給定的點
,要尋找y與x之間的近似函式關係
,插值法要求曲線
準確通過每個給定點
;而m較大時無論是高次插值還是分段低次插值都將很複雜,數據
一般是由實驗觀測得到的,總會帶有觀測誤差,刻意要求
並不能反映真實的函式關係,反而會引起
的波動加劇,因此用
近似描述已知數據
,不必要求在每個點
處,誤差
,都為0,只需在所有點處的某種總體誤差最小即可,這就是所謂的
曲線擬合問題,亦稱為
離散函式最佳平方逼近問題。要確定擬合曲線(1)中的待定係數
,由(2)式知,就是求
多元函式 這是n+1個方程、n+1個未知數的
線性方程組,藉助矩陣運算,可寫成如下矩陣形式:
方程組(3)稱為法方程組,設
線性無關(且滿足Haar條件),則行列式
,線性方程組(3)存在唯一的一組解。
若取基函式
,法方程的係數矩陣顯然非奇異,此時一般稱為多項式擬合,求解法方程組,得到擬合係數
再由多元函式取極值的充分條件可證明,這樣求出的
確實是方程組(2)的解,即
為最小二乘擬合曲線。
幾種具體的擬合曲線類型
以上討論的都是線性最小二乘擬合問題,即擬合曲線
,也就是
是基函式
的線性組合,有些問題雖然數學模型不是線性模型,但通過變換可化為線性模型,則上述最小二乘擬合方法仍然可用。
指數函式擬合
這是一個關於
的線性模型,原來的已知數據
經取對數後變成一組新數據
,這裡
取基函式
則由(3)式可得法方程組,求解出
後即得到擬合曲線
,從而得到
冪函式擬合
這也是關於
的非線性模型.兩邊取對數,同樣可將其化為線性模型,即