2014年3月の石川県金沢市周辺のツイッターの利用状況を調査した結果を紹介する。利用状況を調査する上で必要となるデータはTwitter APIを使用して石川県金沢市を中心とした半径30km以内のツイートを用いた。このツイートデータは真に正しいものでないことに注意していただきたい。つまり、漏れがなく、この指定地域の全てのツイートが入手できたわけではない。しかし、おおよその傾向をつかむことはできるように思う。このツイートデータを見てみると、石川県小松市や福井県坂井市なども入っていた。

2014年3月21日から2014年3月23日までのデータ

ここでは、2014年3月21日0時0分0秒から2014年3月23日23時59分59秒までの石川県金沢市周辺のツイートデータを分析した結果をご紹介する。

この期間内でツイートしたユーザーの総数は1,084人で、ツイート総数は6,096回であった。このユーザーがすべて金沢市民と仮定すると、金沢市の2014年1月1日時点の住民基本台帳人口は452,144人であるため、人口に対する割合は約0.24%となる。つまり1万人あたり24人がツイートした割合となる。実際にはすべて金沢市民ではないし、0歳または100歳の人がツイッターをしているとはありえないし、一人で2つ以上のアカウントを使用しているかもしれないのであくまでもおおよその目安だ。また、取得したツイートの地域におけるツイッター利用者の総数は約7,000人であるので、ツイッターユーザーの約15%の人が1回以上ツイートしたということになる。言い換えると7人に1人は1回以上ツイートしたことになる。
ユーザーごとのツイート数の基本統計量を計算すると下のようになった。

  • 最小値:1
  • 第1四分位:1
  • 中央値:2
  • 平均値:5.624
  • 第3四分位:5
  • 最大値:240

おおよその見方として、全体の25%のユーザーのツイート回数が1回、全体の50%のユーザーのツイート回数が2回以下、全体の75%のユーザーのツイート回数が5回以下とみることができる。

ユーザーがツイートした回数をヒストグラムにしたものが下のグラフである。このヒストグラムで階級幅は10回としてある。

石川県金沢市周辺のツイートのヒストグラム 2014年03月21日から2014年03月23日まで
ツイート数を1時間ごとの時系列に見ていくと、下のグラフのようになる。5時前後に最も少なく、そこから徐々に増えて22時前後にピークを迎えることが分かる。

石川県金沢市周辺のツイートの時系列 2014年03月21日から2014年03月23日まで
次にリプライの状況についてみてみる。ツイート総数6,096回のうちリプライであったツイートは2,351回であった。そのため、ツイートに対するリプライの割合は約38%となった。リプライは個人へのメッセージであるため、そのユーザーの間にはフォロー・フォロワー関係よりも強い関係があると見ることができる。そこで、リプライを元にユーザーをネットワークに表現したものが下のグラフである。

石川県金沢市周辺のリプライのネットワーク 2014年03月21日から2014年03月23日まで
リプライのネットワーク数は343個で、一つのネットワーク内のユーザー数を基本統計量で表したものは以下のようになった。

  • 最小値:1
  • 第1四分位:2
  • 中央値:3
  • 平均値:4.513
  • 第3四分位:4
  • 最大値:68

最小値の1は自分自身に宛てたものであるので、間違えてリプライした可能性があるがネットワーク全体で1つしかなかったので、全体への影響は少ない。中央値が3であるので、ネットワーク全体に対しておよそ半分くらいがユーザー数3人程度の小規模のネットワークを形成しているとみることができる。

ネットワーク内のユーザー数をヒストグラムにしたものが下のグラフである。このヒストグラムで階級幅は5としてある。ほとんどのネットワークが5人以下で形成されていることがわかる。

石川県金沢市周辺のリプライのネットワークのヒストグラム 2014年03月21日から2014年03月23日まで

2014年3月21日から2014年3月31日までのデータ

ここでは、2014年3月21日0時0分0秒から2014年3月31日23時59分59秒までの石川県金沢市周辺のツイートデータを分析した結果をご紹介する。

この期間内でツイートしたユーザーの総数は2,934人で、ツイート総数は27,027回であった。このユーザーがすべて金沢市民と仮定すると、金沢市の2014年1月1日時点の住民基本台帳人口は452,144人であるため、人口に対する割合は約0.65%となる。つまり1万人あたり65人がツイートした割合となる。また、取得したツイートの地域におけるツイッター利用者の総数は約7,000人であるので、ツイッターユーザーの約42%の人が1回以上ツイートしたということになる。
ユーザーごとのツイート数の基本統計量を計算すると下のようになった。

  • 最小値:1
  • 第1四分位:1
  • 中央値:1
  • 平均値:9.259
  • 第3四分位:5
  • 最大値:875

おおよその見方として、全体の25%のユーザーのツイート回数が1回、全体の50%のユーザーのツイート回数が1回以下、全体の75%のユーザーのツイート回数が5回以下とみることができる。

ユーザーがツイートした回数をヒストグラムにしたものが下のグラフである。このヒストグラムで階級幅は10回としてある。
石川県金沢市周辺のツイートのヒストグラム 2014年03月21日から2014年03月31日まで

ツイート数を1時間ごとの時系列に見ていくと、下のグラフのようになる。おおよそ一日でサイクルが一巡している。

石川県金沢市周辺のツイートの時系列 2014年03月21日から2014年03月31日まで

一時間ごとのツイート数を箱ひげ図にすると下のようになる。

石川県金沢市周辺のツイートの時間帯別箱ひげ図 2014年03月21日から2014年03月31日まで

関連する記事

  • R ggplotに回帰直線の式を表示する方法R ggplotに回帰直線の式を表示する方法 R言語のggplotにおいて、グラフに回帰直線の式を表示する方法をお伝えします。 ggplotのグラフに回帰直線の式を表示する方法はいくつかあります。 ここでは最も簡単と思われるggpmiscパッケージを用いて回帰直線の式を表示する方法をお伝えします。 環境 今回の作業環境をsessionInfo()関数で確認しておきます。 > […]
  • R実装と解説 母平均の検定(母分散未知) [latexpage] 母分散が未知の場合の母平均の検定とは、母集団が正規分布に従い、母分散が未知のときに母平均が標本平均と「異なる」または「大きい」、「小さい」かどうかを、検定統計量がt分布に従うことを利用して検定します。 統計的検定の流れ 検定の大まかな流れを確認しておきます。 帰無仮説H0と対立仮設H1をたてます […]
  • 経営戦略に使えるRFM分析の基礎知識と活用法経営戦略に使えるRFM分析の基礎知識と活用法 RFM分析とは、ある一定期間の購買履歴データを用いて、顧客を分類することにより様々な示唆を得るための分析手法である。分類の仕方は、顧客を直近購買時期・購入頻度・購買額の3つの軸で分類し、各軸ごとにランク分けをする。このことにより、顧客が現在どの位置にいて、それがどのくらいの人数なのかを把握することができる。 あなたは、このような分類をすることにどのようなメリットがあるの […]
  • R dplyrパッケージで複数の列を文字列として指定し結合された列を追加する方法R dplyrパッケージで複数の列を文字列として指定し結合された列を追加する方法 Rのdplyrパッケージのmutate関数は新たに列を追加する関数です。 ここでは、mutate関数に文字列として与えた列に対して、paste関数で統合した結果を新たに追加する方法をお伝えします。 サンプルデータとして、統計的な学生の髪と目の色が収められているHairEyeColorを用います。 ただし、このサンプルデータはtableとなっておりますので、実際にはd […]
  • Ubuntu apt-getでRがアップデートできない場合の対処法Ubuntu apt-getでRがアップデートできない場合の対処法 apt-getコマンドでRがアップデートできない理由はいくつか考えられる。ここでは、アップデートできない原因別に対処法をお伝えする。 接続できない 「apt-get […]
石川県金沢市周辺のツイッターの利用状況 2014年3月