理解していなかったので、メモ。
参考url
https://www.codexa.net/cross_validation/
交差検証における3種のデータ
| データ種 | 内容 |
|---|---|
| 訓練データ | モデルの学習に使用 |
| 検証データ | モデルのハイパーパラメータ調整に使用 (※1) |
| テストデータ | モデル評価に使用 |
※1 モデルの重みの他にハイパーパラメータを持つ モデル(例:SVM、Random Forest)は、訓練データだけでは 最適化できない為
交差検証におけるデータ分割イメージ
┌───────────────────┬──┐ ┌──┐
│ 訓練 │検証│モデル1│テスト │
└───────────────────┴──┘ └──┘
┌────────────────┬──┬──┐ ┌──┐
│ 訓練 │検証│訓練│モデル2│テスト │
└────────────────┴──┴──┘ └──┘
: :
┌──┬───────────────────┐ ┌──┐
│検証│ 訓練 │モデルN│テスト │
└──┴───────────────────┘ └──┘