LINEスタンプ制作代行サービス・LINEスタンプの作り方!

お電話でのお問い合わせ:03-6869-8600

stampfactory大百科事典

交差検証

交差検証(交差確認)(英: Cross-validation)とは、統計学において標本データを分割し、その一部をまず解析して、残る部分でその解析のテストを行い、解析自身の妥当性の検証・確認に当てる手法を指す 。データの解析(および導出された推定・統計的予測)がどれだけ本当に母集団に対処できるかを良い近似で検証・確認するための手法である。最初に解析するデータを「訓練事例集合(training set)」などと呼び、他のデータを「テスト事例集合(testing set、テストデータ)」などと呼ぶ。交差検証は Seymour Geisser が生み出した。特にそれ以上標本を集めるのが困難(危険だったり、コストがかかったり)な場合は、データから導いた推定は、交差検証などで慎重に裏付けを確認するべきである。初期標本群から事例を無作為に選択してテスト事例を形成し、残る事例を訓練事例とする。テスト事例に使われるのは初期の標本群の3分の1以下の場合が多い。ただし一般にホールドアウト検証は交差検証には分類されない。なぜなら、データを交差させることがないためである。英名では"K"-fold cross-validation"。"K"-分割交差検証では、標本群を"K"個に分割する。そして、そのうちの1つをテスト事例とし、残る "K" − 1 個を訓練事例とするのが一般的である。交差検証は、"K" 個に分割された標本群それぞれをテスト事例として "k" 回検証を行う。そうやって得られた "k" 回の結果を平均して1つの推定を得る。leave-one-out cross-validation (LOOCV,一個抜き交差検証) は、標本群から1つの事例だけを抜き出してテスト事例とし、残りを訓練事例とする。これを全事例が一回ずつテスト事例となるよう検証を繰り返す。これは"K"-分割交差検証の "K" を標本数にした場合と同じである。ただし、LOOCV にはカーネル回帰やティホノフ正則化などと関連がある。パラメータ推定誤差は計算で求めることができる。平均平方誤差(MSE)は分散、平均平方二乗誤差(RMSE)は標準偏差に用いられる。

出典:wikipedia

LINEスタンプ制作に興味がある場合は、
下記よりスタンプファクトリーのホームページをご覧ください。