維度之咒又叫作維度詛咒,維數禍根等,是從英語curse of dimensionality翻譯過來的一個專業術語。用來描述當(數學)空間維度增加時,體積指數增加的難題。
維度之咒是指在高維空間(通常有成百上千個維度)分析和組織數據時出現的一些現象。這些現象可能並不會在低維度的環境中發生,比如日常經驗的三維物理空間。
在諸如數值分析、抽樣、組合學、機器學習、數據挖掘和資料庫等領域中,經常發生這樣的現象。
基本介紹
- 中文名:維度之咒
- 外文名:curse of dimensionality
- 別稱:維度詛咒,高維詛咒
- 提出者:Richard Bellman
成因,舉例,
成因
維數之咒所指的問題是,當維度增加時,空間的體積增加得非常之快(以指數增加),以致於可用的數據變得稀疏。這種稀疏性會造成統計意義上的一些困難,這是因為為了獲得一個統計上可靠的結果,支持結果所需的數據量往往隨著維度的增加而成倍增長。此外,組織和搜尋數據通常依賴於檢測具有相似屬性的對象的區域,然而,在高維數據中,所有對象在許多方面看起來都是稀疏和不相似的,這使得在數據處理的過程中無法使用通用的數據處理方法。
舉例
Richard Bellman舉了一個例子,100個平均分布的點能把一個單位區間以每個點距離不超過0.01採樣;而當維度增加到10後,如果以相鄰點距離不超過0.01小方格採樣一單位超正方體,則需要10^20個採樣點:所以,這個10維的超正方體也可以說是比單位區間大10^18倍。
在組合領域中,同樣有維數之咒的例子。在某些問題中,每個變數可以取一些離散的數值,或者可能的取值範圍被分成了一些有限的區間,這些區間各自出現的機率也是固定的(離散性)。這時如果要考慮這些變數的組合,就需要考慮的是每個變數可能出現情況的組合,由乘法原理可以知道,這時需要考慮的情況總數是各個變數對應的取值的乘積,即以指數形式增長,這種效應被稱為“組合爆炸”(combinatorial explosion)。也就是說,每增加一個維度,你需要考慮的情況數就會加倍。