


外れ値(はずれち、英:"outlier ")は、統計において他の値から大きく外れた値である。測定ミス・記録ミス等に起因する異常値とは概念的には異なるが、実用上は区別できないこともある。外れ値かどうか検定したい標本について、偏差を不偏標準偏差で割った検定統計量を求め("x" は標本値、"μ" は平均、"σ" は標準偏差)、この値(両側検定をする場合はこの絶対値)が有意点より大きいかどうかで検定する。簡単な方法では、2または3を有意点とする。つまり、"μ" ± 2–3 "σ" の外なら外れ値とする。より精密には、正規分布を仮定して、スミルノフ・グラブス () 検定を使う。標本数を "n"、所要の有意水準を "α"、自由度 "n" - 2 のt分布の "α" / "n" × 100 パーセンタイルを "t" として、を有意点とする。この式は再帰的に使う。つまり、最も外れた1標本のみを検定し、それが外れ値と判定されたら、それを除外した "n" - 1 個の標本を使って2番目に外れた標本を検定し、以下、外れ値が検出されなくなるまで繰り返す。トンプソン () 検定では、を使う。計算式の都合上、スミルノフ・グラブス検定とは逆に、標本値の検定統計量 "τ" から "t" を経て有意水準 "α" を求めることが多い。"n" が十分大きければスミルノフ・グラブス検定と同じ結果になる。
出典:wikipedia
LINEスタンプ制作に興味がある場合は、
下記よりスタンプファクトリーのホームページをご覧ください。