相関係数とは2変量のデータ間の関係性の強弱を計る統計学的指標である。相関係数rがとる値の範囲は-1≦r≦1である。相関係数rの値により以下のように呼ばれる。

  • -1≦r<0ならば負の相関
  • r=0ならば無相関
  • 0<r≦1ならば正の相関

一般的に、強弱も合わせて以下のように呼ばれる。

-1≦r<-0.7 強い負の相関がある
-0.7≦r<-0.4 かなり負の相関がある
-0.4≦r<-0.2 やや負の相関がある
-0.2≦r<0 ほとんど負の相関がない
r=0 相関がない
0<r≦0.2 ほとんど正の相関がない
0.2<r≦0.4 やや正の相関がある
0.4<r≦0.7 かなり正の相関がある
0.7<r≦1 強い正の相関がある

散布図

2変量のデータがあるときに、各要素(x,y)を座標の点としてグラフ化したものを散布図という。具体例は下のピアソンの積率相関係数の散布図を参照してほしい。

ピアソンの積率相関係数

一般的に、相関係数というときにはピアソンの積率相関係数を指すことが多い。

R ピアソンの積率相関係数

統計Rに標準で含まれるサンプルデータcarsを用いて相関係数を計算してみる。carsは自動車の速度と停止までの時間をもつデータフレームである。


> # 車の速度
> x<-cars$speed
> # 停止までの時間
> y<-cars$dist
> # 相関係数を計算(cor(x,y,method="pearson")と同じ)
> cor(x,y)
[1] 0.8068949
> # 散布図を表示
> plot(y~x)

自動車の速度と停止時間までの散布図

スピアマンの順位相関係数

順位データから求める関係性の強弱を計る統計学的指標である。

R スピアマンの順位相関係数


> x<-c(1,2,3,4,5)
> y<-c(2,4,3,5,6)
> cor(x,y,method="spearman")
[1] 0.9

ケンドールの順位相関係数

順位データから求める関係性の強弱を計る統計学的指標である。

R ケンドールの順位相関係数


> x<-c(1,2,3,4,5)
> y<-c(2,4,3,5,6)
> cor(x,y,method="kendall")
[1] 0.8

関連する記事

  • 地図で見る石川県野々市市の人口 2013年12月版地図で見る石川県野々市市の人口 2013年12月版 野々市市役所が公開している平成25年12月末日の住民基本台帳人口と総務省統計局が公開している地図データを基に人口、人口密度、世帯数などの数値および前年同月からの増減率を地図上に色分けして視覚化したものと上位・下位のランキングをご紹介する。 人口の上位・下位ランキング […]
  • Python 科学技術関連のパッケージ一覧Python 科学技術関連のパッケージ一覧 PyPIで公開されているパッケージのうち、科学技術関連のパッケージの一覧をご紹介します。 具体的には、次のフィルターによりパッケージを抽出しました。 Intended Audience :: Science/Research Topic :: […]
  • SlideShareで公開されているR言語関係のまとめSlideShareで公開されているR言語関係のまとめ SlideShareで公開されているR言語関係の資料をまとめてみたのでご紹介する。全てを網羅しているわけではないが、あなたのお役に立てれば幸いだ。 Rによる医療統計2015 第1部 医療統計の基礎知識 前編 2015-12-18 / 70 slides Rによる医療統計2015 第1部 後半 2015-12-18 / 57 […]
  • R スティール・ドゥワス(Steel-Dwass)法R スティール・ドゥワス(Steel-Dwass)法 スティール・ドゥワス(Steel-Dwass)法とは、テューキー(Tukey)法の多重比較に対応するノンパラメトリックな多重比較である。 スティール・ドゥワス法を簡単に言うと、正規分布を仮定しない各群間を順位を用いて多重比較で調べる方法である。 Rで、スティール・ドゥワス法を使う場合は、「スティール・ドゥワス(Steel-Dwass)の方法による多重比較」のページにソ […]
  • Python KNPを用いて係り受け構造を抽出する方法Python KNPを用いて係り受け構造を抽出する方法 Ubuntu14.04環境で、Python3と日本語構文・格・照応解析システムKNPを用いて係る語と受ける語のペアを抽出する方法をご紹介する。 係り受け構造を抽出するPython3のソースコードは次である。 from pyknp import KNP def […]
相関係数