相関係数(そうかんけいすう、)は、2つの確率変数の間にある線形な関係の強弱を測る指標である。相関係数は無次元量で、−1以上1以下の実数に値をとる。相関係数が正のとき確率変数には正の相関が、負のとき確率変数には負の相関があるという。また相関係数が0のとき確率変数は無相関であるというたとえば、先進諸国の失業率と実質経済成長率は強い負の相関関係にあり、相関係数を求めれば比較的−1に近い数字になる。相関係数が±1に値をとるのは2つの確率変数が線形な関係にあるとき、かつそのときに限る。また2つの確率変数が互いに独立ならば相関係数は0となるが、逆は成り立たない。普通、単に相関係数といえばピアソンの積率相関係数を指す。ピアソン積率相関係数の検定は偏差の正規分布を仮定する(パラメトリック)方法であるが、他にこのような仮定を置かないノンパラメトリックな方法として、スピアマンの順位相関係数、ケンドールの順位相関係数なども一般に用いられる。日本工業規格では、相関(そうかん:correlation)を、「二つの確率変数の分布法則の関係。多くの場合,線形関係の程度を指す。」と定義している正の分散を持つ確率変数、が与えられたとき、共分散を、標準偏差を、とおく。このときを確率変数、の相関係数という。これは期待値をで表せばと書き直すこともできる。2組の数値からなるデータ列formula_3 formula_4が与えられたとき、標本共分散を、標本標準偏差を、とおく。このときを標本相関係数(sample correlation coefficient)あるいはピアソンの積率相関係数という。これはデータformula_6, formula_7の相加平均をformula_8、formula_9 で表せばと書き直すこともできる。これは、幾何学的には各データの平均からのずれを表すベクトルのなす角の余弦である。データが2次元正規分布からの標本のとき、標本相関係数は母集団相関係数の最尤推定量ではあるが、不偏推定量ではなく(絶対値で見ると)小さめに見積もりがちである。また外れ値に鋭敏に反応してしまう。相関係数は、あくまでも確率変数の間にある線形な関係の尺度に過ぎない。また、確率変数間の因果関係を説明するものでもない。相関係数は順序尺度であり間隔尺度ではないので、例えば「相関係数が0.2と0.4であることから、後者は前者より2倍の相関がある」などと言うことはできない。しばしば、相関があるという表現が、あたかも因果関係を示しているかのように誤解あるいは誤用される。2つの変数(A,B)間に相関が見られる場合、偶然による相関を除けば、次の3つの可能性が想定される(相関と因果の違いに関する誤解・誤用において目立つのは、3番目の場合である)。相関分析とは2変数の間に線形関係があるかどうか、およびその強さについての分析であり、2つの変数の間に質的な区別を仮定しない。それに対し回帰分析とは、変数の間にどのような関係があるか(具体的な関数の形)についての分析であり、また説明変数によって目的変数を予測するのを目的としている。
出典:wikipedia
LINEスタンプ制作に興味がある場合は、
下記よりスタンプファクトリーのホームページをご覧ください。