2014年3月の石川県金沢市周辺のツイッターの利用状況を調査した結果を紹介する。利用状況を調査する上で必要となるデータはTwitter APIを使用して石川県金沢市を中心とした半径30km以内のツイートを用いた。このツイートデータは真に正しいものでないことに注意していただきたい。つまり、漏れがなく、この指定地域の全てのツイートが入手できたわけではない。しかし、おおよその傾向をつかむことはできるように思う。このツイートデータを見てみると、石川県小松市や福井県坂井市なども入っていた。

2014年3月21日から2014年3月23日までのデータ

ここでは、2014年3月21日0時0分0秒から2014年3月23日23時59分59秒までの石川県金沢市周辺のツイートデータを分析した結果をご紹介する。

この期間内でツイートしたユーザーの総数は1,084人で、ツイート総数は6,096回であった。このユーザーがすべて金沢市民と仮定すると、金沢市の2014年1月1日時点の住民基本台帳人口は452,144人であるため、人口に対する割合は約0.24%となる。つまり1万人あたり24人がツイートした割合となる。実際にはすべて金沢市民ではないし、0歳または100歳の人がツイッターをしているとはありえないし、一人で2つ以上のアカウントを使用しているかもしれないのであくまでもおおよその目安だ。また、取得したツイートの地域におけるツイッター利用者の総数は約7,000人であるので、ツイッターユーザーの約15%の人が1回以上ツイートしたということになる。言い換えると7人に1人は1回以上ツイートしたことになる。
ユーザーごとのツイート数の基本統計量を計算すると下のようになった。

  • 最小値:1
  • 第1四分位:1
  • 中央値:2
  • 平均値:5.624
  • 第3四分位:5
  • 最大値:240

おおよその見方として、全体の25%のユーザーのツイート回数が1回、全体の50%のユーザーのツイート回数が2回以下、全体の75%のユーザーのツイート回数が5回以下とみることができる。

ユーザーがツイートした回数をヒストグラムにしたものが下のグラフである。このヒストグラムで階級幅は10回としてある。

石川県金沢市周辺のツイートのヒストグラム 2014年03月21日から2014年03月23日まで
ツイート数を1時間ごとの時系列に見ていくと、下のグラフのようになる。5時前後に最も少なく、そこから徐々に増えて22時前後にピークを迎えることが分かる。

石川県金沢市周辺のツイートの時系列 2014年03月21日から2014年03月23日まで
次にリプライの状況についてみてみる。ツイート総数6,096回のうちリプライであったツイートは2,351回であった。そのため、ツイートに対するリプライの割合は約38%となった。リプライは個人へのメッセージであるため、そのユーザーの間にはフォロー・フォロワー関係よりも強い関係があると見ることができる。そこで、リプライを元にユーザーをネットワークに表現したものが下のグラフである。

石川県金沢市周辺のリプライのネットワーク 2014年03月21日から2014年03月23日まで
リプライのネットワーク数は343個で、一つのネットワーク内のユーザー数を基本統計量で表したものは以下のようになった。

  • 最小値:1
  • 第1四分位:2
  • 中央値:3
  • 平均値:4.513
  • 第3四分位:4
  • 最大値:68

最小値の1は自分自身に宛てたものであるので、間違えてリプライした可能性があるがネットワーク全体で1つしかなかったので、全体への影響は少ない。中央値が3であるので、ネットワーク全体に対しておよそ半分くらいがユーザー数3人程度の小規模のネットワークを形成しているとみることができる。

ネットワーク内のユーザー数をヒストグラムにしたものが下のグラフである。このヒストグラムで階級幅は5としてある。ほとんどのネットワークが5人以下で形成されていることがわかる。

石川県金沢市周辺のリプライのネットワークのヒストグラム 2014年03月21日から2014年03月23日まで

2014年3月21日から2014年3月31日までのデータ

ここでは、2014年3月21日0時0分0秒から2014年3月31日23時59分59秒までの石川県金沢市周辺のツイートデータを分析した結果をご紹介する。

この期間内でツイートしたユーザーの総数は2,934人で、ツイート総数は27,027回であった。このユーザーがすべて金沢市民と仮定すると、金沢市の2014年1月1日時点の住民基本台帳人口は452,144人であるため、人口に対する割合は約0.65%となる。つまり1万人あたり65人がツイートした割合となる。また、取得したツイートの地域におけるツイッター利用者の総数は約7,000人であるので、ツイッターユーザーの約42%の人が1回以上ツイートしたということになる。
ユーザーごとのツイート数の基本統計量を計算すると下のようになった。

  • 最小値:1
  • 第1四分位:1
  • 中央値:1
  • 平均値:9.259
  • 第3四分位:5
  • 最大値:875

おおよその見方として、全体の25%のユーザーのツイート回数が1回、全体の50%のユーザーのツイート回数が1回以下、全体の75%のユーザーのツイート回数が5回以下とみることができる。

ユーザーがツイートした回数をヒストグラムにしたものが下のグラフである。このヒストグラムで階級幅は10回としてある。
石川県金沢市周辺のツイートのヒストグラム 2014年03月21日から2014年03月31日まで

ツイート数を1時間ごとの時系列に見ていくと、下のグラフのようになる。おおよそ一日でサイクルが一巡している。

石川県金沢市周辺のツイートの時系列 2014年03月21日から2014年03月31日まで

一時間ごとのツイート数を箱ひげ図にすると下のようになる。

石川県金沢市周辺のツイートの時間帯別箱ひげ図 2014年03月21日から2014年03月31日まで

関連する記事

  • R 関数に時間制限を設ける方法 ある処理にとても時間が掛かるため、一定時間経過後はその処理を途中で打ち切りたいときがある。 例えば、for文で、あるループだけが重いため全体として時間が掛かってしまう場合、その処理を一旦スキップしてfor文の先に処理を進めたい、などである。 ここでは、そのひとつの解決策として、関数に時間制限を設けて、一定時間経過後はその関数を強制終了するコードをご紹介する。 ただし […]
  • Python 科学技術関連のパッケージ一覧Python 科学技術関連のパッケージ一覧 PyPIで公開されているパッケージのうち、科学技術関連のパッケージの一覧をご紹介します。 具体的には、次のフィルターによりパッケージを抽出しました。 Intended Audience :: Science/Research Topic :: […]
  • DockerでMariaDB10.5を使う方法DockerでMariaDB10.5を使う方法 DockerでMariaDB 10.5を使用できるまでの手順をお伝えします。 ここでは、docker-composeとDocker公式のMariaDB 10.5イメージを用います。 環境 ホストOS ホストOSはUbuntu 20.04を用いております。 $ cat /etc/lsb-release […]
  • WindowsにMariaDBをインストールする手順WindowsにMariaDBをインストールする手順 WindowsにMariaDBをインストールする手順についてお伝えいたします。 ファイルのダウンロード MariaDBのインストールファイルをダウンロードするために、次のサイトに移動します。 MariaDB.org - Supporting continuity and open […]
  • R データフレームから特定の型の列を抽出する方法R データフレームから特定の型の列を抽出する方法 Rのデータフレームから特定の型の列を抽出する方法をお伝えします。 サンプルデータとして、irisを用います。 データフレームの構造をstr関数で確認します。 > str(iris) 'data.frame': 150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 […]
石川県金沢市周辺のツイッターの利用状況 2014年3月