ニコニコ動画の自作自演をグラフにするプログラム
先のエントリ(自作自演について少しばかり 組曲『ニコニコ動画』 - WebLab.ota)で面白いツールを作ってらっしゃる方からコメントをいただきました.(ニコニコ動画の運営はミスを犯した? - LEMON IN THE BOOKSTORE)
面白そうだったので,上のエントリで公開されているソースを元に,適当に弄ってグラフを表示できるようにしました.
http://www.geocities.jp/rics2501/nico2.zip *1 *2
このツールの説明と結果
ジニ係数とは(中略)社会における所得分配の不平等さを測る指標(中略)係数の範囲は0から1で、係数の値が0に近いほど格差が少ない状態で、1に近いほど格差が大きい状態であることを意味する。ちなみに、0のときには完全な「平等」―つまり皆同じ所得を得ている状態を示す。
http://ja.wikipedia.org/wiki/%E3%82%B8%E3%83%8B%E4%BF%82%E6%95%B0
というのが”ジニ係数”らしいのですが,先のエントリは,この考え方をニコニコ動画のコメントの不平等さ(格差)を測る指標にしてはどうか?といった提案です.その名も”自ニ係数”(自作自演+ニコニコ動画+係数).
詳しいアルゴリズムは知らないのですが(ソースを適当に見る限りで…)
(詳しい解説はこちらを見てください…http://www.nihonkaigaku.org/ham/eacoex/100econ/120doms/122dist/1224inc/gini/gini.html)
自ニ係数とは簡単に言うと,ユーザごとのコメント量の格差を計算して,あるユーザは一人で100も200もコメントし,あるユーザは1コメントしかしていない事を調べます.そうすると,コメントを大量にする人間(荒らしや自演)のランキングに対する影響力と,コメントを一つしかしない人の影響力の差が見えてきます.
この図はジニ係数を計算したものではないですが,エロゲーが終わらない by Zebra 歌ってみた/動画 - ニコニコ動画(今話題のゼブラと愉快な仲間達氏のものですが,ユーザIDがhashになってしまっているので自演かどうかは解りません)のコメントを整理して,各ユーザのコメント量をソートしてグラフ化したもので,左はコメントを1つしかしていない人が並び,右に行くにつれて多くコメントをしている人になります.
この図は直感的によくわかる図ですね.それにしても右側の大量にコメントしている人々(この図では167コメントが最高)は凄いなぁ.偏り方がひでぇ
これをジニ係数っぽいグラフにすると下の図のようになります.
う〜ん,この図を観ても直感的に悪さが解りませんが,見る人が見たら酷く見えるんでしょうね…なんせ自ニ係数高いですからね.(0.67ですから…)
平等になっていると三角形になるようです.(下記の図参照.ジニ係数はその三角形からグラフの面積を削る値になるのか?)
一般的には、同等の意味を持ち幾何的表現に転換された「ローレンツ曲線と対角線に囲まれた面積」という定義で理解されている。
所得分布で説明すると、横軸に人数、縦軸に所得を取り、所得の低い人から順に並べた場合の所得累積額の描く曲線(ローレンツ曲線)と両端点を結ぶ直線(対角線=均等分布線)で囲まれる面積となる。ただし、軸と対角線で構成される三角形の面積を1とする。
(中略)
- 〜0.1 平準化が仕組まれる人為的な背景がある
- 0.1〜0.2 相当平等だが向上への努力を阻害する懸念がある
- 0.2〜0.3 社会で一般にある通常の配分型
- 0.3〜0.4 少し格差があるが、競争の中での向上には好ましい面もある
- 0.4〜0.5 格差がきつい
- 0.5〜 特段の事情がない限り是正を要する
な,らしいです.
けれども,ジニ係数が悪いからといって一概に改善する必要があるとはならないらしいです.*3
しかし,議論は必要だと思いますけどね.(自作自演について少しばかり 組曲『ニコニコ動画』 - WebLab.otaで多少書いています)
参考
ジニ係数って何? - 内田樹の研究室
http://test.hiroki-daichi.info/ref.html