2014年3月の石川県金沢市周辺のツイッターの利用状況を調査した結果を紹介する。利用状況を調査する上で必要となるデータはTwitter APIを使用して石川県金沢市を中心とした半径30km以内のツイートを用いた。このツイートデータは真に正しいものでないことに注意していただきたい。つまり、漏れがなく、この指定地域の全てのツイートが入手できたわけではない。しかし、おおよその傾向をつかむことはできるように思う。このツイートデータを見てみると、石川県小松市や福井県坂井市なども入っていた。

2014年3月21日から2014年3月23日までのデータ

ここでは、2014年3月21日0時0分0秒から2014年3月23日23時59分59秒までの石川県金沢市周辺のツイートデータを分析した結果をご紹介する。

この期間内でツイートしたユーザーの総数は1,084人で、ツイート総数は6,096回であった。このユーザーがすべて金沢市民と仮定すると、金沢市の2014年1月1日時点の住民基本台帳人口は452,144人であるため、人口に対する割合は約0.24%となる。つまり1万人あたり24人がツイートした割合となる。実際にはすべて金沢市民ではないし、0歳または100歳の人がツイッターをしているとはありえないし、一人で2つ以上のアカウントを使用しているかもしれないのであくまでもおおよその目安だ。また、取得したツイートの地域におけるツイッター利用者の総数は約7,000人であるので、ツイッターユーザーの約15%の人が1回以上ツイートしたということになる。言い換えると7人に1人は1回以上ツイートしたことになる。
ユーザーごとのツイート数の基本統計量を計算すると下のようになった。

  • 最小値:1
  • 第1四分位:1
  • 中央値:2
  • 平均値:5.624
  • 第3四分位:5
  • 最大値:240

おおよその見方として、全体の25%のユーザーのツイート回数が1回、全体の50%のユーザーのツイート回数が2回以下、全体の75%のユーザーのツイート回数が5回以下とみることができる。

ユーザーがツイートした回数をヒストグラムにしたものが下のグラフである。このヒストグラムで階級幅は10回としてある。

石川県金沢市周辺のツイートのヒストグラム 2014年03月21日から2014年03月23日まで
ツイート数を1時間ごとの時系列に見ていくと、下のグラフのようになる。5時前後に最も少なく、そこから徐々に増えて22時前後にピークを迎えることが分かる。

石川県金沢市周辺のツイートの時系列 2014年03月21日から2014年03月23日まで
次にリプライの状況についてみてみる。ツイート総数6,096回のうちリプライであったツイートは2,351回であった。そのため、ツイートに対するリプライの割合は約38%となった。リプライは個人へのメッセージであるため、そのユーザーの間にはフォロー・フォロワー関係よりも強い関係があると見ることができる。そこで、リプライを元にユーザーをネットワークに表現したものが下のグラフである。

石川県金沢市周辺のリプライのネットワーク 2014年03月21日から2014年03月23日まで
リプライのネットワーク数は343個で、一つのネットワーク内のユーザー数を基本統計量で表したものは以下のようになった。

  • 最小値:1
  • 第1四分位:2
  • 中央値:3
  • 平均値:4.513
  • 第3四分位:4
  • 最大値:68

最小値の1は自分自身に宛てたものであるので、間違えてリプライした可能性があるがネットワーク全体で1つしかなかったので、全体への影響は少ない。中央値が3であるので、ネットワーク全体に対しておよそ半分くらいがユーザー数3人程度の小規模のネットワークを形成しているとみることができる。

ネットワーク内のユーザー数をヒストグラムにしたものが下のグラフである。このヒストグラムで階級幅は5としてある。ほとんどのネットワークが5人以下で形成されていることがわかる。

石川県金沢市周辺のリプライのネットワークのヒストグラム 2014年03月21日から2014年03月23日まで

2014年3月21日から2014年3月31日までのデータ

ここでは、2014年3月21日0時0分0秒から2014年3月31日23時59分59秒までの石川県金沢市周辺のツイートデータを分析した結果をご紹介する。

この期間内でツイートしたユーザーの総数は2,934人で、ツイート総数は27,027回であった。このユーザーがすべて金沢市民と仮定すると、金沢市の2014年1月1日時点の住民基本台帳人口は452,144人であるため、人口に対する割合は約0.65%となる。つまり1万人あたり65人がツイートした割合となる。また、取得したツイートの地域におけるツイッター利用者の総数は約7,000人であるので、ツイッターユーザーの約42%の人が1回以上ツイートしたということになる。
ユーザーごとのツイート数の基本統計量を計算すると下のようになった。

  • 最小値:1
  • 第1四分位:1
  • 中央値:1
  • 平均値:9.259
  • 第3四分位:5
  • 最大値:875

おおよその見方として、全体の25%のユーザーのツイート回数が1回、全体の50%のユーザーのツイート回数が1回以下、全体の75%のユーザーのツイート回数が5回以下とみることができる。

ユーザーがツイートした回数をヒストグラムにしたものが下のグラフである。このヒストグラムで階級幅は10回としてある。
石川県金沢市周辺のツイートのヒストグラム 2014年03月21日から2014年03月31日まで

ツイート数を1時間ごとの時系列に見ていくと、下のグラフのようになる。おおよそ一日でサイクルが一巡している。

石川県金沢市周辺のツイートの時系列 2014年03月21日から2014年03月31日まで

一時間ごとのツイート数を箱ひげ図にすると下のようになる。

石川県金沢市周辺のツイートの時間帯別箱ひげ図 2014年03月21日から2014年03月31日まで

関連する記事

  • R ggplot2を用いた2軸グラフの簡単な作成方法R ggplot2を用いた2軸グラフの簡単な作成方法 Rのggplot2を用いて、2軸グラフを作成するための簡単な方法をお伝えします. 2軸グラフは、グラフの縦軸(y軸)が左側と右側の両方にあり、それぞれ単位が異なるグラフのことを言います。 2軸グラフは、一般的に推奨されてはおりません。 そのため、ggplot2パッケージを用いた2軸グラフを作成するためには、scale_y_continuous()関数のsec.axi […]
  • Bioconductor Softwareパッケージ一覧Bioconductor Softwareパッケージ一覧 BioconductorのSoftwareパッケージの一覧をご紹介します。英語での説明文をgoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。パッケージを探す参考にしていただければ幸いです。 パッケージ確認日:2021/09/01 パッケージ数:2041 1. BiocGenerics S4 generic functions used […]
  • R言語 CRAN Task View:Rでの高性能並列コンピューティングR言語 CRAN Task View:Rでの高性能並列コンピューティング CRAN Task View: High-Performance and Parallel Computing with Rの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Dirk Eddelbuettel Contact: Dirk.Eddelbuettel at […]
  • これだけは抑えておきたい収益性分析の基本これだけは抑えておきたい収益性分析の基本 収益性分析とは、主に損益起算書上の数値から収益獲得力や投資効率性を測定する分析である。企業が継続的発展を遂げるためには利益確保が欠かせないが、企業経営は好調のときもあれば不調のときもあるため、様々な観点から収益または利益の状況を把握する必要がある。 ここでは、収益性分析の代表的な指標をいくつか紹介する。 これらの代表的な指標を活用するに当たっては、業種によってかなり異 […]
  • R,knitPDF bxjsarticleを用いた際にサブタイトルでエラーが出る場合の対処法 RStudioを用いてRmdファイルから日本語PDFを作成する際に、ドキュメントクラスをbxjsarticleと設定すると、次のようなエラーが出てPDFファイルが作成されない。 エラーは、subtitleコマンドが二重に定義されているために起こっているようだ。 ! LaTeX Error: Command \subtitle already defined. Or […]
石川県金沢市周辺のツイッターの利用状況 2014年3月