機械学習 – 機械学習の基礎 – 検証集合

[ホールドアウト法]
全データを学習データとテストデータに分割する
何割ずつ割り当てるかが悩ましい

[交差検証法]
全データをn個のセットに分割し、その内の一つをテストデータ、他を学習データとする方法
テストデータとしたセットを、学習のサイクルごとに変更し、最後に各サイクルの結果の平均を求める
k個に分けるとk-分割交差検証法

[ブートストラップ法]
ある標本集団から母集団の性質を推定する方法
データから重複を許してサンプリングし、学習データとテストデータに分割する
サンプリングを何度も繰り返すことにより、テストに学習データが含まれることのバイアスを小さくする