2014年3月の石川県金沢市周辺のツイッターの利用状況を調査した結果を紹介する。利用状況を調査する上で必要となるデータはTwitter APIを使用して石川県金沢市を中心とした半径30km以内のツイートを用いた。このツイートデータは真に正しいものでないことに注意していただきたい。つまり、漏れがなく、この指定地域の全てのツイートが入手できたわけではない。しかし、おおよその傾向をつかむことはできるように思う。このツイートデータを見てみると、石川県小松市や福井県坂井市なども入っていた。

2014年3月21日から2014年3月23日までのデータ

ここでは、2014年3月21日0時0分0秒から2014年3月23日23時59分59秒までの石川県金沢市周辺のツイートデータを分析した結果をご紹介する。

この期間内でツイートしたユーザーの総数は1,084人で、ツイート総数は6,096回であった。このユーザーがすべて金沢市民と仮定すると、金沢市の2014年1月1日時点の住民基本台帳人口は452,144人であるため、人口に対する割合は約0.24%となる。つまり1万人あたり24人がツイートした割合となる。実際にはすべて金沢市民ではないし、0歳または100歳の人がツイッターをしているとはありえないし、一人で2つ以上のアカウントを使用しているかもしれないのであくまでもおおよその目安だ。また、取得したツイートの地域におけるツイッター利用者の総数は約7,000人であるので、ツイッターユーザーの約15%の人が1回以上ツイートしたということになる。言い換えると7人に1人は1回以上ツイートしたことになる。
ユーザーごとのツイート数の基本統計量を計算すると下のようになった。

  • 最小値:1
  • 第1四分位:1
  • 中央値:2
  • 平均値:5.624
  • 第3四分位:5
  • 最大値:240

おおよその見方として、全体の25%のユーザーのツイート回数が1回、全体の50%のユーザーのツイート回数が2回以下、全体の75%のユーザーのツイート回数が5回以下とみることができる。

ユーザーがツイートした回数をヒストグラムにしたものが下のグラフである。このヒストグラムで階級幅は10回としてある。

石川県金沢市周辺のツイートのヒストグラム 2014年03月21日から2014年03月23日まで
ツイート数を1時間ごとの時系列に見ていくと、下のグラフのようになる。5時前後に最も少なく、そこから徐々に増えて22時前後にピークを迎えることが分かる。

石川県金沢市周辺のツイートの時系列 2014年03月21日から2014年03月23日まで
次にリプライの状況についてみてみる。ツイート総数6,096回のうちリプライであったツイートは2,351回であった。そのため、ツイートに対するリプライの割合は約38%となった。リプライは個人へのメッセージであるため、そのユーザーの間にはフォロー・フォロワー関係よりも強い関係があると見ることができる。そこで、リプライを元にユーザーをネットワークに表現したものが下のグラフである。

石川県金沢市周辺のリプライのネットワーク 2014年03月21日から2014年03月23日まで
リプライのネットワーク数は343個で、一つのネットワーク内のユーザー数を基本統計量で表したものは以下のようになった。

  • 最小値:1
  • 第1四分位:2
  • 中央値:3
  • 平均値:4.513
  • 第3四分位:4
  • 最大値:68

最小値の1は自分自身に宛てたものであるので、間違えてリプライした可能性があるがネットワーク全体で1つしかなかったので、全体への影響は少ない。中央値が3であるので、ネットワーク全体に対しておよそ半分くらいがユーザー数3人程度の小規模のネットワークを形成しているとみることができる。

ネットワーク内のユーザー数をヒストグラムにしたものが下のグラフである。このヒストグラムで階級幅は5としてある。ほとんどのネットワークが5人以下で形成されていることがわかる。

石川県金沢市周辺のリプライのネットワークのヒストグラム 2014年03月21日から2014年03月23日まで

2014年3月21日から2014年3月31日までのデータ

ここでは、2014年3月21日0時0分0秒から2014年3月31日23時59分59秒までの石川県金沢市周辺のツイートデータを分析した結果をご紹介する。

この期間内でツイートしたユーザーの総数は2,934人で、ツイート総数は27,027回であった。このユーザーがすべて金沢市民と仮定すると、金沢市の2014年1月1日時点の住民基本台帳人口は452,144人であるため、人口に対する割合は約0.65%となる。つまり1万人あたり65人がツイートした割合となる。また、取得したツイートの地域におけるツイッター利用者の総数は約7,000人であるので、ツイッターユーザーの約42%の人が1回以上ツイートしたということになる。
ユーザーごとのツイート数の基本統計量を計算すると下のようになった。

  • 最小値:1
  • 第1四分位:1
  • 中央値:1
  • 平均値:9.259
  • 第3四分位:5
  • 最大値:875

おおよその見方として、全体の25%のユーザーのツイート回数が1回、全体の50%のユーザーのツイート回数が1回以下、全体の75%のユーザーのツイート回数が5回以下とみることができる。

ユーザーがツイートした回数をヒストグラムにしたものが下のグラフである。このヒストグラムで階級幅は10回としてある。
石川県金沢市周辺のツイートのヒストグラム 2014年03月21日から2014年03月31日まで

ツイート数を1時間ごとの時系列に見ていくと、下のグラフのようになる。おおよそ一日でサイクルが一巡している。

石川県金沢市周辺のツイートの時系列 2014年03月21日から2014年03月31日まで

一時間ごとのツイート数を箱ひげ図にすると下のようになる。

石川県金沢市周辺のツイートの時間帯別箱ひげ図 2014年03月21日から2014年03月31日まで

関連する記事

  • R言語 CRAN Task View:自然言語処理R言語 CRAN Task View:自然言語処理 CRAN Task View: Natural Language Processingの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Fridolin Wild Contact: wild at […]
  • R ggplot2を用いて散布図と周辺分布をプロットする方法R ggplot2を用いて散布図と周辺分布をプロットする方法 ggplot2を用いて散布図と周辺分布をプロットする2つの方法をお伝えします。 最初の方法は、ggExtraパッケージのggMarginal関数を用いる方法で、周辺分布を簡単にプロットすることができます。 二番目の方法は、散布図と周辺分布を作成した上で、一つにまとめる方法です。 それぞれ一長一短があります。 最初の方法は、コード量が少ないですがグラフとして […]
  • Ubuntu 20.04にDockerをインストールする手順Ubuntu 20.04にDockerをインストールする手順 Ubuntu 20.04にDockerをインストールおよびインストールの確認、sudoなしでdockerコマンドを実行する方法をお伝えします。 Ubuntu 20.04にDockerをインストールする方法はいくつかありますが、snapを用いた方法、Ubuntuの標準リポジトリを用いた方法、DockerおよびDocker […]
  • Googleアナリティクスとコレスポンデンス分析を用いた年齢別のユーザー像の捉え方Googleアナリティクスとコレスポンデンス分析を用いた年齢別のユーザー像の捉え方 ページビュー数やコンバージョン率を上げるためには、良質なコンテンツが大切であるとよく言われる。そして、良質なコンテンツを作成するためには、ユーザー像を具体的に思い描き、そのユーザーに向けてコンテンツを作成しなくてはならない。 ここでは、ページビュー数から年齢とページの関係性を視覚的に確認し、年齢別にユーザーがどのコンテンツに興味を抱くか、その傾向を探っていく。この傾向が […]
  • TensorFlow チュートリアルMNIST For Beginnersを試してみるTensorFlow チュートリアルMNIST For Beginnersを試してみる TensorFlowのチュートリアルMNIST For ML Beginnersを試してみる。 プログラミングの世界では、最初に「Hello World」と表示される非常に小さいプログラムを書くことが伝統となっている。 機械学習では、この「Hello […]
石川県金沢市周辺のツイッターの利用状況 2014年3月