Twitterユーザの統計とってみた

最近,このようなツイートをよく目にする.

ホントにこんなに少ないのか? オレの周りが多いだけ…?

ということで実際に調べてみたよ!

日本人ユーザをランダムに1,000人取得し,統計をとってみた.

プログラムは以下.

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import twitter
import sqlite3
from random import randint

api = twitter.Api()
count = 0
while count < 1000:
    i = randint(1,500000000)
    try:
        user = api.GetUser(i)
    except:
        continue
    if user.time_zone in [u'Osaka', u'Tokyo', u'Sapporo']:
        con.execute('insert into data values (%s, %s, %s)' % (user.statuses_count, user.friends_count, user.followers_count))
        count += 1
        con.commit()

con.close()

こんな感じになった.


さらに詳しく見てみると,フォロイー数0のユーザは225人,フォロワー数0のユーザは506人,ツイート数0のユーザは216人であった.

そういうことか…

要するに,Twitterのアカウントは作っているものの,実際に使っていないユーザが大半を占め,これらが平均を大きく下げているということだろう.

アクティブなユーザだけで平均を取ると,もっと本質的な数値が得られると考えられる.

また,ツイート数,フォロイー数,フォロワー数の相関もグラフ化してみた.

フォロイー数とフォロワー数のみ正の相関あり,といったところか…

まあ予想通りの結果だが.