相関係数とは2変量のデータ間の関係性の強弱を計る統計学的指標である。相関係数rがとる値の範囲は-1≦r≦1である。相関係数rの値により以下のように呼ばれる。

  • -1≦r<0ならば負の相関
  • r=0ならば無相関
  • 0<r≦1ならば正の相関

一般的に、強弱も合わせて以下のように呼ばれる。

-1≦r<-0.7 強い負の相関がある
-0.7≦r<-0.4 かなり負の相関がある
-0.4≦r<-0.2 やや負の相関がある
-0.2≦r<0 ほとんど負の相関がない
r=0 相関がない
0<r≦0.2 ほとんど正の相関がない
0.2<r≦0.4 やや正の相関がある
0.4<r≦0.7 かなり正の相関がある
0.7<r≦1 強い正の相関がある

散布図

2変量のデータがあるときに、各要素(x,y)を座標の点としてグラフ化したものを散布図という。具体例は下のピアソンの積率相関係数の散布図を参照してほしい。

ピアソンの積率相関係数

一般的に、相関係数というときにはピアソンの積率相関係数を指すことが多い。

R ピアソンの積率相関係数

統計Rに標準で含まれるサンプルデータcarsを用いて相関係数を計算してみる。carsは自動車の速度と停止までの時間をもつデータフレームである。


> # 車の速度
> x<-cars$speed
> # 停止までの時間
> y<-cars$dist
> # 相関係数を計算(cor(x,y,method="pearson")と同じ)
> cor(x,y)
[1] 0.8068949
> # 散布図を表示
> plot(y~x)

自動車の速度と停止時間までの散布図

スピアマンの順位相関係数

順位データから求める関係性の強弱を計る統計学的指標である。

R スピアマンの順位相関係数


> x<-c(1,2,3,4,5)
> y<-c(2,4,3,5,6)
> cor(x,y,method="spearman")
[1] 0.9

ケンドールの順位相関係数

順位データから求める関係性の強弱を計る統計学的指標である。

R ケンドールの順位相関係数


> x<-c(1,2,3,4,5)
> y<-c(2,4,3,5,6)
> cor(x,y,method="kendall")
[1] 0.8

関連する記事

  • Ubuntu 20.04にDockerをインストールする手順Ubuntu 20.04にDockerをインストールする手順 Ubuntu 20.04にDockerをインストールおよびインストールの確認、sudoなしでdockerコマンドを実行する方法をお伝えします。 Ubuntu 20.04にDockerをインストールする方法はいくつかありますが、snapを用いた方法、Ubuntuの標準リポジトリを用いた方法、DockerおよびDocker […]
  • Linux:Eclipse+CDTでC/C++開発Linux:Eclipse+CDTでC/C++開発 Linux環境においてEclipseでCDTを用いてC/C++開発を行う場合にはまったことを備忘記録として残しておく。 CDTインストール直後、関数が認識されないエラーの対処 CDTのインストール後にすぐにC++開発を行おうとしてコードを入力した場合、関数が認識されずエラーが出る。この場合は一度Eclipseを再起動すれば、次回からきちんと認識される。 外部ヘッダーファ […]
  • WindowsにMariaDBをインストールする手順WindowsにMariaDBをインストールする手順 WindowsにMariaDBをインストールする手順についてお伝えいたします。 ファイルのダウンロード MariaDBのインストールファイルをダウンロードするために、次のサイトに移動します。 MariaDB.org - Supporting continuity and open […]
  • 地図で見る石川県金沢市の人口 2014年1月地図で見る石川県金沢市の人口 2014年1月 金沢市役所が公開している平成26年1月の住民基本台帳人口と総務省統計局が公開している地図データを基に人口、人口密度、世帯数、未成年・高齢者の年齢別などの数値および前年同月からの増減率を地図上に色分けして視覚化したものと上位・下位のランキングをご紹介する。 人口、世帯数などのデータを活用しようと考えた場合、まずは国勢調査を思いつくが、国勢調査は5年ごとに行われており、最近 […]
  • Ubuntu16.04でElectronをインストールする方法Ubuntu16.04でElectronをインストールする方法 Ubuntu16.04でElectronをインストールし、定番のHello […]
相関係数