要約統計量(ようやくとうけいりょう)とは、標本の分布の特徴を代表的に(要約して)表す統計学上の値であり、統計量の一種。記述統計量(descriptive statistics value)、基本統計量、代表値(representative value)ともいう正規分布の場合は、平均と、分散または標準偏差で分布を記述できる。正規分布からのずれを知るためには、尖度や歪度などの高次モーメントから求められる統計量を用いる。正規分布から著しく外れた場合には、より頑健な中央値、四分位点、最大値・最小値や最頻値が用いられる。「頑健」とは分布の非対称性や外れ値などの影響を受けにくいことを意味する統計用語である。例えば、労働者一人あたりの年収を例に採れば、最も収入が少なくても0未満にはならないのに対し、収入が多いほうでは数十億円という年収を稼ぐ少数者があり得る。この場合の分布は、少数者が上側にいることによって、上側に極端に尾を引いた非対称な分布となる。平均値はこれらの極端な高値の影響を受け、分布の代表値として適切でないものとなってしまう。中央値や最頻値では、いかに飛び抜けた値であっても1例としてしか扱われないので、より大多数の実感に近い値を示すことができる。"N" 個のデータ formula_1 に対する統計量を考える。まず、平均値 formula_2 と、平均値まわりの "m" 次中央モーメント formula_3 をで定義する。原点まわりの1次モーメント formula_2。和を個数で割ったもの。2次中央モーメントから求められる統計量。分布の広がりを表す。3次中央モーメントから求められる統計量。分布の左右非対称の度合いを表す。4次中央モーメントから求められる統計量。分布の峰の鋭さ(裾野の広さ)を表す。ただし、3 を引かない定義もある。以下、昇順にソートされた "N" 個のデータ formula_12 に対する統計量(順序統計量)を考える。メジアン、メディアン (median) ともいう。データの大きさに関してちょうど中央に当たるデータ "x" 。ただし、整数でない添数に対する中央値は線形補間によって定義する(つまり "N" が偶数のときは "x" と "x" の平均とする)。最大値、最小値を除外した平均。除外する数を増やして行くと、最後は中央値になる。そのため、中央値は刈込平均の一つである。。集団を値の大きさで4等分するとき、その境界となる値。"x" を第1四分位点、"x" を第3四分位点という。"x" 、つまり第2四分位点は中央値である。集団に含まれる最も小さい値 "x" と、最も大きい値 "x" 。これらの統計量を視覚化するために、箱ひげ図を用いる。最大値と最小値を足して2で割ったものを中点値(mid-range)とよび、代表値として用いることがある。最大値と最小値の差を範囲(range)とよび、代表値として用いることがある。記号はRを用いる。モード (mode)、並み数 ともいう。データのうち、度数分布において最も高い度数を示す値、つまり最も多く現れているデータの値。
出典:wikipedia
LINEスタンプ制作に興味がある場合は、
下記よりスタンプファクトリーのホームページをご覧ください。