Gan(生成式對抗網路)

發展歷史

Ian J. Goodfellow等人於2014年10月在Generative Adversarial Networks中提出了一個通過對抗過程估計生成模型的新框架。框架中同時訓練兩個模型：捕獲數據分布的生成模型G，和估計樣本來自訓練數據的機率的判別模型D。G的訓練程式是將D錯誤的機率最大化。這個框架對應一個最大值集下限的雙方對抗遊戲。可以證明在任意函式G和D的空間中，存在唯一的解決方案，使得G重現訓練數據分布，而D=0.5。在G和D由多層感知器定義的情況下，整個系統可以用反向傳播進行訓練。在訓練或生成樣本期間，不需要任何馬爾科夫鏈或展開的近似推理網路。實驗通過對生成的樣品的定性和定量評估證明了本框架的潛力。

方法

機器學習的模型可大體分為兩類，生成模型（Generative Model）和判別模型（Discriminative Model）。判別模型需要輸入變數，通過某種模型來預測。生成模型是給定某種隱含信息，來隨機產生觀測數據。舉個簡單的例子，

判別模型：給定一張圖，判斷這張圖裡的動物是貓還是狗
生成模型：給一系列貓的圖片，生成一張新的貓咪（不在數據集裡）

對於判別模型，損失函式是容易定義的，因為輸出的目標相對簡單。但對於生成模型，損失函式的定義就不是那么容易。我們對於生成結果的期望，往往是一個曖昧不清，難以數學公理化定義的範式。所以不妨把生成模型的回饋部分，交給判別模型處理。這就是Goodfellow他將機器學習中的兩大類模型，Generative和Discrimitive給緊密地聯合在了一起。

GAN的基本原理其實非常簡單，這裡以生成圖片為例進行說明。假設我們有兩個網路，G（Generator）和D（Discriminator）。正如它的名字所暗示的那樣，它們的功能分別是：

G是一個生成圖片的網路，它接收一個隨機的噪聲z，通過這個噪聲生成圖片，記做G(z)。
D是一個判別網路，判別一張圖片是不是“真實的”。它的輸入參數是x，x代表一張圖片，輸出D（x）代表x為真實圖片的機率，如果為1，就代表100%是真實的圖片，而輸出為0，就代表不可能是真實的圖片。

在訓練過程中，生成網路G的目標就是儘量生成真實的圖片去欺騙判別網路D。而D的目標就是儘量把G生成的圖片和真實的圖片分別開來。這樣，G和D構成了一個動態的“博弈過程”。

最後博弈的結果是什麼？在最理想的狀態下，G可以生成足以“以假亂真”的圖片G(z)。對於D來說，它難以判定G生成的圖片究竟是不是真實的，因此D(G(z)) = 0.5。

Gan(生成式對抗網路)

基本介紹

發展歷史

方法

套用

圖像生成

數據增強

相關詞條

熱門詞條