以下の内容はhttps://htn20190109.hatenablog.com/entry/2025/12/28/102318より取得しました。


GAN

https://qiita.com/typecprint/items/035478748a811dd29721
https://pystyle.info/pytorch-gan/
https://cysec148.hatenablog.com/entry/2025/04/08/063505

・GAN目的関数
第1項: データが実際に本物データである場合の負の交差エントロピー
第2項: 生成器が生成したデータである場合の負の交差エントロピー

識別器は最大化するように学習
生成器は最小化するように学習


\displaystyle
\min_{G} \max_{D} 
\mathbb{E}_{\mathbf{x} \sim p(\mathbf{x})}
\left[ \log D(\mathbf{x}) \right]
+
\mathbb{E}_{\mathbf{z} \sim p(\mathbf{z})}
\left[ \log(1 - D(G(\mathbf{z}))) \right]

・モード崩壊
特定のデータしか生成しなくなる問題

・勾配消失
識別器が生成器よりも大幅に優れている場合、勾配消失し、生成器の学習が進まなくなる問題



・WGAN(Wasserstein GAN)
目的関数に下記Wasserstein距離を用いることで、確率分布が重ならない場合でも有限の値を返し
生成器がよりスムーズに学習できる。


\displaystyle
W(p, q)
= \inf_{\gamma}
\mathbb{E}_{(x, y) \sim \gamma}
\left[ d(x, y)\right]

・DCGAN
畳み込み層
バッチ正規化
生成器にReLU
識別器にLeakeyReLU


・CGAN

指定したラベルとノイズを入力として、指定したラベルの画像を生成する


\displaystyle
\min_{G} \max_{D} 
\mathbb{E}_{\mathbf{x} \sim p(\mathbf{x})}
\left[ \log D(\mathbf{x|y}) \right]
+
\mathbb{E}_{\mathbf{z} \sim p(\mathbf{z})}
\left[ \log(1 - D(G(\mathbf{z|y}))) \right]

・CycleGAN
画像を別のスタイルの画像に変換する
生成器と識別器が2つずつ存在する
サイクル一貫性損失を導入




以上の内容はhttps://htn20190109.hatenablog.com/entry/2025/12/28/102318より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14