きんたろうの影響力を可視化する
おはようございます
まだ残暑が続きますね
きんたろうといえば「いいね」
「いいね」といえば「ツイッター」
きんたろうはしばしばファンのツイートにいいねをつけてくれることがありますが、ブログ主の実感としてきんたろうのいいねがつくとそのツイートが広範囲にリーチしやすいと言うのがあると思います
これは影響力のあるアカウントにいいねされるとそのアカウントをフォローしている他のユーザーにも当該のツイートが表示されると言うツイッターの仕様によるものだと思われます
今回はひろきち(@jousuix)アカウントのデータを使って、きんたろうの「いいね」が持つツイッターでの影響力について検証していきたいと思います
まずはひろきちアカウントの過去のツイートを一つ一つ遡って以下のようなデータセットを作成しました
これは一つ一つのツイートの日時とそのツイートのいいね数、そしてきんたろうのいいねの有無を 0 or 1 で表にしたものです
この表を使ってきんたろうのいいねがそのツイートのいいね数をどの程度押し上げるのかというリサーチクエスチョンを明らかにしていきたいと思います
まずは簡単な記述統計からみてみましょう
これは箱ヒゲ図というグラフで横軸がきんたろうのいいねの有無、縦軸がツイートのいいねの数を表しています。
四角の中の黒い線が中央値を表しているので、このグラフからきんたろうのいいねがあるツイートの方がないツイートよりもいいね数の中央値が高いことが読み取れます。
またグラフ上部の黒い点は外れ値を表しているのですが、ここからいいね数が極端に高い(バズった?)ツイートはほとんど全てきんたろうのいいねがついたツイートであることが読み取れます
次にツイートのいいね数の度数分布を見てみます
ここでは横軸がいいね数、縦軸がツイート数です
先ほどの箱ヒゲ図と結果は同じですがこのグラフからはツイートのいいね数は正規分布ではなくポアソン分布であると言うことが読み取れます
ポアソン分布とはあるイベントの観測回数に関する確率分布の一つでいわゆる離散型の確率関数の一つですが、テストの点数や身長に代表される正規分布と比べるとやや異なった振る舞いをするため取り扱いに注意が必要です
一般にある変数が他の変数に与える影響を統計的に検証したい場合は線形回帰分析が使われることが多いですが、ここではいいね数の分布がポアソン分布であることを考慮して一般化線形回帰分析の一種であるポアソン回帰を使って仮説を検証していきます
ためしに私の手元のPCを使って、オープンソースの統計分析ソフトRを使ってきんたろうのいいねの有無からツイートのいいね数をポアソン回帰した結果、以下のような結果を得ました
画面中央の Kin という変数がきんたろうのいいねの有無を表した変数で回帰分析の結果その係数は 0.99 (標準誤差0.12)と言う結果が得られました
これがどのくらいの大きさなのかというと、ポアソン回帰モデルの場合係数0でその変数が結果変数に与える影響が1倍(=変わらない)となりますから、今回の結果からはきんたろうのいいねがあることによってツイート全体のいいね数が平均1.99倍増える、と言う解釈ができます
また係数の信頼性を表す標準誤差は0.12ですから、きんたろうのいいねの影響力の範囲は95%信頼区間で 1.87 〜 2.11 倍まで幅があると考えられますが、いずれにしてもおおよそ2倍程度のいいね数増加効果がありそうです
いいねしたツイートのいいね数を倍増させる効果があるきんたろうのいいね
やはりきんたろうはすでに一流のインフルエンサーと言えそうです
※本記事は夏のくまきち学会2022 一般演題(テーマ:きんたろう)の一部として発表されました