2014年3月の石川県金沢市周辺のツイッターの利用状況を調査した結果を紹介する。利用状況を調査する上で必要となるデータはTwitter APIを使用して石川県金沢市を中心とした半径30km以内のツイートを用いた。このツイートデータは真に正しいものでないことに注意していただきたい。つまり、漏れがなく、この指定地域の全てのツイートが入手できたわけではない。しかし、おおよその傾向をつかむことはできるように思う。このツイートデータを見てみると、石川県小松市や福井県坂井市なども入っていた。

2014年3月21日から2014年3月23日までのデータ

ここでは、2014年3月21日0時0分0秒から2014年3月23日23時59分59秒までの石川県金沢市周辺のツイートデータを分析した結果をご紹介する。

この期間内でツイートしたユーザーの総数は1,084人で、ツイート総数は6,096回であった。このユーザーがすべて金沢市民と仮定すると、金沢市の2014年1月1日時点の住民基本台帳人口は452,144人であるため、人口に対する割合は約0.24%となる。つまり1万人あたり24人がツイートした割合となる。実際にはすべて金沢市民ではないし、0歳または100歳の人がツイッターをしているとはありえないし、一人で2つ以上のアカウントを使用しているかもしれないのであくまでもおおよその目安だ。また、取得したツイートの地域におけるツイッター利用者の総数は約7,000人であるので、ツイッターユーザーの約15%の人が1回以上ツイートしたということになる。言い換えると7人に1人は1回以上ツイートしたことになる。
ユーザーごとのツイート数の基本統計量を計算すると下のようになった。

  • 最小値:1
  • 第1四分位:1
  • 中央値:2
  • 平均値:5.624
  • 第3四分位:5
  • 最大値:240

おおよその見方として、全体の25%のユーザーのツイート回数が1回、全体の50%のユーザーのツイート回数が2回以下、全体の75%のユーザーのツイート回数が5回以下とみることができる。

ユーザーがツイートした回数をヒストグラムにしたものが下のグラフである。このヒストグラムで階級幅は10回としてある。

石川県金沢市周辺のツイートのヒストグラム 2014年03月21日から2014年03月23日まで
ツイート数を1時間ごとの時系列に見ていくと、下のグラフのようになる。5時前後に最も少なく、そこから徐々に増えて22時前後にピークを迎えることが分かる。

石川県金沢市周辺のツイートの時系列 2014年03月21日から2014年03月23日まで
次にリプライの状況についてみてみる。ツイート総数6,096回のうちリプライであったツイートは2,351回であった。そのため、ツイートに対するリプライの割合は約38%となった。リプライは個人へのメッセージであるため、そのユーザーの間にはフォロー・フォロワー関係よりも強い関係があると見ることができる。そこで、リプライを元にユーザーをネットワークに表現したものが下のグラフである。

石川県金沢市周辺のリプライのネットワーク 2014年03月21日から2014年03月23日まで
リプライのネットワーク数は343個で、一つのネットワーク内のユーザー数を基本統計量で表したものは以下のようになった。

  • 最小値:1
  • 第1四分位:2
  • 中央値:3
  • 平均値:4.513
  • 第3四分位:4
  • 最大値:68

最小値の1は自分自身に宛てたものであるので、間違えてリプライした可能性があるがネットワーク全体で1つしかなかったので、全体への影響は少ない。中央値が3であるので、ネットワーク全体に対しておよそ半分くらいがユーザー数3人程度の小規模のネットワークを形成しているとみることができる。

ネットワーク内のユーザー数をヒストグラムにしたものが下のグラフである。このヒストグラムで階級幅は5としてある。ほとんどのネットワークが5人以下で形成されていることがわかる。

石川県金沢市周辺のリプライのネットワークのヒストグラム 2014年03月21日から2014年03月23日まで

2014年3月21日から2014年3月31日までのデータ

ここでは、2014年3月21日0時0分0秒から2014年3月31日23時59分59秒までの石川県金沢市周辺のツイートデータを分析した結果をご紹介する。

この期間内でツイートしたユーザーの総数は2,934人で、ツイート総数は27,027回であった。このユーザーがすべて金沢市民と仮定すると、金沢市の2014年1月1日時点の住民基本台帳人口は452,144人であるため、人口に対する割合は約0.65%となる。つまり1万人あたり65人がツイートした割合となる。また、取得したツイートの地域におけるツイッター利用者の総数は約7,000人であるので、ツイッターユーザーの約42%の人が1回以上ツイートしたということになる。
ユーザーごとのツイート数の基本統計量を計算すると下のようになった。

  • 最小値:1
  • 第1四分位:1
  • 中央値:1
  • 平均値:9.259
  • 第3四分位:5
  • 最大値:875

おおよその見方として、全体の25%のユーザーのツイート回数が1回、全体の50%のユーザーのツイート回数が1回以下、全体の75%のユーザーのツイート回数が5回以下とみることができる。

ユーザーがツイートした回数をヒストグラムにしたものが下のグラフである。このヒストグラムで階級幅は10回としてある。
石川県金沢市周辺のツイートのヒストグラム 2014年03月21日から2014年03月31日まで

ツイート数を1時間ごとの時系列に見ていくと、下のグラフのようになる。おおよそ一日でサイクルが一巡している。

石川県金沢市周辺のツイートの時系列 2014年03月21日から2014年03月31日まで

一時間ごとのツイート数を箱ひげ図にすると下のようになる。

石川県金沢市周辺のツイートの時間帯別箱ひげ図 2014年03月21日から2014年03月31日まで

関連する記事

  • R言語 CRAN Task View:薬物動態データの解析R言語 CRAN Task View:薬物動態データの解析 CRAN Task View: Analysis of Pharmacokinetic Dataの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Bill Denney Contact: wdenney at […]
  • R データフレームのファクター列を2値に変換する方法 Rのデータフレームにおいて、ファクター列を2値に変換する方法をお伝えいたします。 方法はとても単純で、データフレームの列ごとにファクター型かどうかをチェックし、ファクター型であればファクターごとに2値の列を新たに作成し追加します。 ソースコードは以下のようになります。 convertFactorToBinary <- function(df, sep = […]
  • R言語 CRAN Task View:生態と環境データの分析R言語 CRAN Task View:生態と環境データの分析 CRAN Task View: Analysis of Ecological and Environmental Dataの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Gavin Simpson Contact: ucfagls at […]
  • R言語 CRAN Task View:追跡データの処理と分析R言語 CRAN Task View:追跡データの処理と分析 CRAN Task View: Processing and Analysis of Tracking Dataの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Rocío Joo, Matthew E. Boone, Michael Sumner and Mathieu […]
  • R データフレームから特定の型の列を抽出する方法R データフレームから特定の型の列を抽出する方法 Rのデータフレームから特定の型の列を抽出する方法をお伝えします。 サンプルデータとして、irisを用います。 データフレームの構造をstr関数で確認します。 > str(iris) 'data.frame': 150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 […]
石川県金沢市周辺のツイッターの利用状況 2014年3月