以前、イケダハヤトさんのTwitterフォロワーは20万人いるのにイケダハヤトさんのツイートにつく”いいね”とリツイートの数が少なすぎるのでは?と言うエントリーを書きました。
で、その中でフォロワーを買っているのではないか?もしくは休眠アカウントが多いのではないか?と言う疑問を投げかけたわけなのですが、あくまでも憶測です。
と言う訳で、イケダハヤトさんのフォロワーを見てみたんですけれど、ツイート数が0とか1とかのユーザーが結構いるんですよね。
こう言うフォロワー
アイコンは設定されてますが、IDは不規則な文字列ですし、ツイート数が0なんですよね。まぁイケダハヤトさんをフォローしたくないか、ブロックされてしまった人の”観察アカウント“と言う可能性もあります。
でも、結構その数が多いんですよね。イケダハヤトさんにブロックされている人は「アンチイケハヤ」と言うウォッチャーです。僕もブロックされてます。
「こう言うユーザーって何人くらいいるんだろうなぁ?」って思ったんですよね。10人とか100人ならまだ可能性(正当な理由)があるんですけれど。
って事で、TwitterAPIを取得してプログラムを自分で作りました!
目的は「イケダハヤトさんをフォローしている人の総つぶやき数を取得する」です。
プログラムが動くまで結構苦労しましたが、僕はシステムエンジニアなのでそんなに苦では無かったです。楽しかった!GitHubや同じことを考えてソースを公表してくれている人が多いのでそれをベースに改造するって感じですね。
ソースコードの一部抜粋
で、無事動きました!
流石に20万人のデータを取得するのにはサーバ側で1時間強かかりましたね。
こんな感じで出力されます
さて、これを分析です。今回は総つぶやき数だけなので、ソートするだけにしました。
Excelでも良いのですが僕のExcelは古いのと文字化けしちゃったので、Googleスプレッドシートに読ませて総つぶやき数から降順ソートしてみました。休眠アカウント、もしくは始めたばかりでつぶやき数が少ない人という意味で、閾値(いき値)を200つぶやきにしてみました。
これがそのスプレッドシートです。行を選択していることが200つぶやきの境界線です。行番号を見ると104451。ってことは20万フォロワーの約半分がつぶやき数200以下と言う事になります。休眠アカウントと考えてもおかしくないですね。
では、一般的に「Twitterハマってるわぁー」と言い出せるような10000つぶやきを閾値にしてみましょうか?イケハヤさんは「1日30ツイートすべし!」と言っており10000/30=333.33なので、イケハヤさんの教えに沿って約1年Twitterをやっている人ですね。
同様に見てみると約15000行をさしていました。
と言うことはイケダハヤトさんの熱心なフォロワーで自分もTwitter活動をしている人は15000人程度ではないか?と思われます。
キックさんはフォロワー数16811
元お隣様のキックさんとほぼ同じフォロワー数って感じでしょうか?もちろん、キックさんのフォロワーの休眠アカウントも調べられますが…そこまではやめておきましょう。
…まぁ、僕自身のフォロワーは360を行き来している状態なので人のこと言えたものでは無いんですけれどね…。
でも、実に興味深いデータがわかりました。流石に20万件のデータは手動では大変ですからね。そう言う時はプログラムを書いて実行させるのが吉です。
今回のこのプログラムは完全に趣味であり、もちろん仕事時間外に書いているんですけれど、こう言うのをささっと考えてかけるようになって(システム)エンジニアって呼べるんだと思うんですよね。
イケハヤ界隈のエンジニアとかクリエイターってそう言うプログラムも作れないだろうしWebサービスやプラットフォームを作れないんですよね。だから芸術家?とか作家?なら100歩譲ってわかるんですけれど、クリエイターはあくまでも自称であって何もクリエイト出来てないですよね。
せっかくプラットホームを外注したのにお金をちゃんと払ってないし…
イケダハヤトとC-Lifeさんのアプリ開発未払い問題についてー契約の大事さ
こう言うのを作れるC-Lifeさんは尊敬します。
別にみんながみんなプログラムがかけるべき!なんて微塵にも思っていません。しかし、エンジニアとか名乗る人はそう言うのを知っていて(概念だけでも)欲しいなぁって。映像クリエイターも音楽クリエイターも自称は簡単ですが、人に認められるのとは違います。
別にクリエイターとか名乗らないで、ブロガーって言っている分には別に全くその通りと思うんですけれど、イケダハヤトさん、ほら肩書きがちょいちょい変わるから…
僕もエンジニアとしてまだ頑張っていきたいですね。
ちなみにこれはまだ検証中の状態です。今後、もっと多角的に調査していきたいと思います。週末にでもできればな、なんて思っております。
Update1(2019/6/25)
某掲示板で、Fakeアカウントを調べれると言うページを複数教えてもらいました。まずは「Fake Follwer Check」ってところです。
こう言うサイトがありました
面白いことに、イケハヤさん自身がこのページを自分のブログで紹介していました。リンクは貼りませんが、スクショを貼っておきます。
さて、イケハヤさんはこの時点で87%がアクティブアカウントと言っておりますね。では、僕の方で実際に調べた結果をどうぞ。
じょわん。アクティブアカウントは51%まで落ちております。僕の分析は200つぶやき以下を閾値としており、その結果もアクティブユーザは約半分だったので、この数値と合いますね。検証としては面白いです。
さて、次は、「Fake Followers Audit」ってところですね。
ここでイケダハヤトさんを調査。
結果は、約30%が嘘アカウントと言うことになりました。このグラフで言うと32%が中間の閾値になっていますね。簡単に計算して、61500アカウントが嘘アカウントと言う事になります。
参考までにこれが僕のデータ。母数が全然違いますが約18%ですね。
ちなみに、休眠アカウントの定義を調べたのですが、これと言った定義は出てきませんでした。ただ調べた結果、大体の目安として半年以上呟いていないアカウントが休眠アカウントと言う事がわかりました。
今のところ、アカウントを買っていると言う確証は全くありませんが約半数が休眠アカウント、ヘビーユーザー(アクティブユーザー)は1万5000人って所は今の所変わらないと思います。
注意なのですが、これらの調査には自分のツイッターアカウントとの連携を要求してきます。僕は休眠アカウントを使って調査(本アカウントはブロックされてますので)しましたが、興味本位で調べる時は終わった後でアプリ連携を解除しておいたほうが良いと思います。
Update2(2019/7/1)
さて、他のサイトの情報を裏付けるべく、プログラムを改造して、「最終つぶやき日」を取得できるようにしました。
こんな感じ
で、休眠アカウントの定義を色々と調べていると「120日以上呟いていない」と言うのが大体の閾値らしいです。
イケダハヤトさんのフォロワーの情報「1970/01/01(つぶやき0)」も目立ちますね
で、120日以上呟いていないと言うのは、このUPDATE日は2019/07/01なので、120を引くと2019/03/03と言う事になります。
はい、ソートして検索してみると約108000人が120日以内に呟いているので、イケダハヤトさんのフォロワー21万から引き算すると、約102000人。って事でやはり50%は休眠アカウントと言うことがわかりますね。
と言う意味で、つぶやき数、最終つぶやき日の両方観点からみて半数は休眠アカウントである事が証明されました。
ちなみに、このプログラム、フォロワー20万人なので結構時間がかかったんですけれど、「Fake Follwer Check」はすぐに帰ってきました。凄いですね。>調べた所、1000件を取得してサンプリングしているみたいです。
フォロワーを買っているか?と言うことは正直わかりませんでした…。すいません。でも、半分以上は休眠アカウントであることはしっかりと判明しましたので良かったです。
あ、あとこのプログラムや検索データを欲しい人、あげますので「お問い合わせ」から連絡ください。二次利用大歓迎です。
Update3(2019/7/3)
その後、分析軸を少々増やしてみました。
つぶやき10未満:43867
つぶやき100未満:87608
1か月以上つぶやいてない:124269
前澤キャンペーン(これは2019/1/6-2019/1/7の前澤さん1億円キャンペーンに応募しただけの人):4417
bot:617
1ヶ月以上呟いていない人が12万5千人だったので、引き算すると8万人くらいがアクティブアカウントだと思います。
あと、タイトルにあった「買っているか?」なのですが、これにはフォロワーがイケダハヤトさんをフォローした日と言うのが分析軸になってきます。特定の日に極端にフォロワーが増えていたら呟きがバズったかフォロワーを買ったかになりますよね。
なので、フォロワーがフォローした日を調べようとしたのですが、用意されている項目(Twitter API)ではわからないみたいです(=情報が取れない)。残念ですが。
今回の件は一旦、ここを持って終了とさせていただきます。ありとうございました。
おお、素晴らしい!
イケハヤのことそんなに脱がしちゃいやんって感じです。
しかしちょっと気になる言葉があります。
閾値(しきい値)とお書きですが正しくは閾値(いき値)です。
「しきいち」は湯桶読みと言われ稚拙な印象を与えます。
代替(だいたい)に送り仮名を加え代替え(だいがえ)と読んだり
真逆(まさか)を真逆(まぎゃく)と読み誤用しているのと同じ。
折角プログラムを書いて正確な情報を取得しそれを記事にまでしているのです。
こんな貴重かつ楽しい記事が揚げ足取りの材料にされないためにも
できるだけ本来の語義や用法に沿った遣い方で書くことをおすすめします。
では!
ご指摘ありがとうございます!直しておきます。ずっと「しきい値」だと思ってました。自分の無学さ…とほほ。