LINEスタンプ制作代行サービス・LINEスタンプの作り方!

お電話でのお問い合わせ:03-6869-8600

stampfactory大百科事典

最尤推定

最尤推定(さいゆうすいてい、、略してMLEともいう)や最尤法(さいゆうほう、)とは、統計学において、与えられたデータからそれが従う確率分布の母数を点推定する方法である。この方法はロナルド・フィッシャーが1912年から1922年にかけて開発した。生物学に於いて、塩基やアミノ酸配列のような分子データの置換に関する確率モデルに基づいて系統樹を作成する際に、一番尤もらしくデータを説明する樹形を選択するための有力な方法としても利用される。確率分布関数 formula_1 と分布の母数 formula_2 のわかっている離散確率分布 formula_3 が与えられたとして、そこから formula_4 個の標本 formula_5 を取り出すことを考えよう。すると分布関数から、観察されたデータが得られる確率を次のように計算することができる:しかし、データが分布 formula_3 によることはわかっていても、母数 formula_2 の値はわからないかもしれない。どうしたら formula_2 を見積もれるか?formula_4 個の標本 formula_5 があれば、この標本から formula_2 の値を見積もることができる。最尤法は母数 formula_2 の一番尤もらしい値を探す(つまり formula_2 のすべての可能な値の中から、観察されたデータセットの尤度を最大にするものを探す)方法である。これは他の推定量を求める方法と対照的である。たとえば formula_2 の不偏推定量は、 formula_2 を過大評価することも過小評価することもないが、必ずしも一番尤もらしい値を与えるとは限らない。尤度関数を次のように定義する:この関数を母数 formula_2 のすべての可能な値から見て最大になるようにする。そのような値 formula_17 を母数formula_2 に対する最尤推定量(さいゆうすいていりょう、maximum likelihood estimator、これもMLEと略す)という。最尤推定量は(適当な仮定の下では)しばしば尤度方程式(ゆうどほうていしき、likelihood equation)の解として求められる。以下、コインを投げて表・裏(あるいは成功・失敗:その確率は0.5とは限らない)のいずれが出るかを見る場合(ベルヌーイ試行)を例にとる。箱の中に3つのコインがあるとしよう。見た目では全く区別がつかないが、表の出る確率formula_23が、それぞれformula_24、formula_25、formula_26 である。(formula_23 が、上で formula_2 と書いた母数にあたる)。箱の中から適当に1つ選んだコインを80回投げ、formula_29 、 formula_30 、 formula_31 、 formula_32 のようにサンプリングし、表(H)の観察された回数を数えるたところ、表(H)が49回、裏が31回であった。さて、投げたコインがどのコインであったと考えるのが一番尤もらしいか? 一番尤もらしいコイン(すなわち、一番尤もらしいformula_23の値)を推定するためには、次のように尤度を計算する:こうして母数 formula_34 によって尤度が最大となることがわかり、これが formula_23 に対する最尤推定量である。こんどは上の例での箱に入っているコインの数は無限であると仮定する。それぞれがすべての可能な formula_36 の値をとるとする。するとすべての可能な formula_36 の値に対して次の尤度関数を最大化しなければならない:この関数を最大化するには formula_23 に関して微分しその値を0にすればよい:これを解けば formula_39 、 formula_40 、 formula_41 の3つの解が得られるが、そのうち尤度を最大化するのは明らかに formula_41 である( formula_39 と formula_40 では尤度は0になってしまう)。こうして formula_23 に対する最尤推定量は formula_46 と求められる。この結果で、ベルヌーイ試行の成功数49を formula_47 と置き、全回数80を formula_4 と置けば一般化できる。 formula_4 回のベルヌーイ試行で formula_47 回成功した場合に対する母数 formula_23 の最尤推定量はとなる。よく出てくる連続確率分布に、次の正規分布がある:この分布に従う formula_4 個の独立なランダム変数標本の密度関数は:また計算しやすいように書き換えると:この分布には平均 formula_53 と分散 formula_54 の2つの母数がある。上では1つの母数に対する最大化だけを議論したが、この場合も各母数に対して尤度 formula_55 を最大化すればよい。上の書き方なら formula_56 とする(このように母数が複数の場合は母数ベクトルとして扱う)。尤度を最大にするのは、尤度の自然対数を最大にするのと同じである(自然対数は単調増加関数であるから)。このような計算法はいろいろな分野でよく利用され、対数尤度は情報のエントロピーやフィッシャー情報と密接な関係がある。これを解くと formula_57 となる。これはまさに関数の最大値、すなわち formula_53 の唯一の極値で、2次微分は負となる。同様に、 formula_59 に関して微分し0とおけば尤度の最大値 formula_60 が得られる。つまり、正規分布の母数 formula_56 に対する最尤推定量はとなる。最尤法は生物の分子系統推定(分子系統樹作成)にも応用される。塩基やアミノ酸配列の置換に関する確率モデルを仮定した上で、想定される樹形ごとに手持ちのデータ(配列の多重アラインメント)が得られる尤度を求め、最も尤度の高い樹形を採用する方法である。

出典:wikipedia

LINEスタンプ制作に興味がある場合は、
下記よりスタンプファクトリーのホームページをご覧ください。