ヒロッコ:珍しいわね。どういう風の吹き回し?
モリタック:私だって映画くらい観ますよ!
ヒロッコ:最後に観たのは何?
モリタック:えーーと、何だったかな?あの、ヒトラーがお怒りの・・・
ヒロッコ:ヒトラー 〜最期の12日間〜?
モリタック:そうそう、それ。
ヒロッコ:そういえば、ウィキペディアによると、総統閣下シリーズは最近、ブロックの対象じゃなくなったらしいわね?
ノブポン:パロディについてはまだ議論が行われている段階で、結論は出ていない模様です。映画の監督もパロディには好意的だという話もあります。
註釈:参考>The Director of Downfall Speaks Out on All Those Angry YouTube Hitlers
ヒロッコ:過去の作品を再アップロードしましょうかね?
ノブポン:こんなこともあろうかと思って、もちろん過去の動画は全て保全してあります。
ヒロッコ:GAGA様の意向もあるでしょうから、ちょっと様子を見つつ、よね。ところで、映画は何を観に行くの?
モリタック:「新しい靴を買わなくちゃ」を観ようかな?
ヒロッコ:随分と似合わない映画を選んだわね?
モリタック:みぽりんのファンなんですよ。
ノブポン:しかし、各種データによると「新しい靴を買わなくちゃ」はあんまり面白くないみたいですね。
モリタック:え?そうなの?どんなデータがあるの?
ヒロッコ:Yahoo!映画で2.85/5点満点、ぴあ映画生活で64点/100点満点、映画.comで3点/5点満点って感じよ。
閣下:だから、その手のサイトの評価はあてにならないっていつも言っているだろう?
モリタック:あれ?そうなんですか?みんなの評価は案外正しいんじゃないんですか?
閣下:「みんな」がどんな人間の集合体なのかによるんだよ。「案外正しい」評価になるためにはたくさんの条件をクリアしなくちゃならない。映画の場合なら、少なくとも、映画にこだわりのある人間が、多くの経験をもとに、公平に評価している必要がある。
モリタック:レビューサイトはダメですか?
閣下:ちょっと検証してみよう。じゃぁ、上のレビューサイトの中で投稿数が一番多い、Yahoo!映画のデータを使ってみようじゃないか。ヒロッコ、よろしく頼む。
註釈:出典:Yahoo!映画「新しい靴を買わなくちゃ」
ヒロッコ:どんなデータが必要ですか?
閣下:まず、現在のデータについてまとめてくれ。
ヒロッコ:了解です。まず投稿者数は150名です(2012/10/17 12:00調査)。評価(☆)の算術平均は2.847/5点満点となっています。
閣下:ご苦労。では、ちょっと細かく見てみよう。といっても、話はそれほど難しくない。「多くの経験」を簡単に、「今年になってどのくらいのレビューを書いているか」で評価してみよう。要は、たくさんのレビューを書いている人が、多くの経験を持っていると考えるわけだ。ただ、それぞれのレビュアーのレビュー数を一々調べるのも面倒くさい。そこで、今年になってからのレビュー数を、1本、2本、3本、4本以上で分類してみる。
ノブポン:少なくとも「新しい靴を買わなくちゃ」を観ているはずなので、1本以上なのは間違いないわけですね。
閣下:そういうことだ。レビュー数ごとの投稿者数を積算してくれ。
ヒロッコ:1本:87名で58%、2本:7名で4.7%、3本:13名で8.7%、4本以上:43名で28.7%です。
閣下:2本と3本のレビュアーはマイノリティなので、1本のみと4本以上の2つのカテゴリーで検討してみよう。「新しい靴を買わなくちゃ」しかレビューしていないレビュアー達の評価をまとめてみてくれ。
ヒロッコ:☆5:27、☆4:16、☆3:12、☆2:11、☆1:21で、平均は3.195です。
閣下:しかし、単発レビュアー率が58%っていうのも、滅茶苦茶だな。
ノブポン:データがゴミのようです。
閣下:まさに。じゃぁ、4本以上レビューしているレビュアーの評価はどんな感じだ?
ヒロッコ:☆5:2、☆4:7、☆3:9、☆2:9、☆1:16で、平均は1.605です。
閣下:なんか、この数字を見るだけでニヤニヤしてしまうだろ?
モリタック:ええっ?私にはオチがわかりません!!
ヒロッコ:馬鹿ねぇ、この映画しかレビューを書いていない単発レビュアーは、要はサクラが中心ってことでしょ。とどのつまり、データっていうのはサクラを仕込めば膨らんで信用が落ちるし、怪しいデータを取り除けば縮んで信頼性がアップするってことじゃない。
閣下:サクラかどうかはわからんけど、4本以上のレビューを書いている人間と、生まれて初めて映画のレビューを投稿した人間を比較したら、どちらの情報に信頼性があるかは火を見るより明らかだろう?
モリタック:なるほど・・・しかし、サクラはともかく、1点をつける単発レビュアーってなんなんでしょうか?
ヒロッコ:何かをしようとすると、必ず賛成する人と反対する人がいるのよ。それはみんな大切にしているものが違うから。サクラがたくさん出てくれば、それにあわせてアンチも出てくるものなのよ。
モリタック:なるほど。「役立ち度」は考えなくて良いんですか?
ヒロッコ:役立ち度順にソートすると・・・☆1つが19レビューも並んでいるわね(笑)。
閣下:役立ち度を考えても良いし、あるいは色々と書かれている内容を精査してみても良いんだが、それを始めると処理が主観的になりがちで面倒くさいことになる。
モリタック:そういうものですか?
閣下:統計処理は簡単でわかりやすいほうが良い。今回の主観的定義は「今年になって投稿したレビュー数で評価しよう」「投稿数が多い方が信頼性が高いはず」「4本以上はひとまとめにしてしまおう」という3点だ。1つめと3つめは決め、2つめは仮説で、この3つに同意してもらえるなら、Yahoo!映画のレビューからサクラレビューの疑いが強いデータを取り除いたデータに精緻化できたことになる。
モリタック:それで、映画の評価はどうなるんでしょうか。
ヒロッコ:5点満点で1.60ね。
モリタック:そりゃぁ酷い!
閣下:Yahoo!映画の得点はサクラとアンチが入り乱れていて信頼性がすっかり低下してしまったが、こうやって加工すればまだ役に立ちそうだな。
モリタック:でも、いちいち計算するのが面倒くさいですよね?
閣下:誰かが自動的にデータをマイニングできるような便利サイトを作ってくれればなぁ。
ノブポン:手法があっても、実現するとは限らないのですね。
閣下:真実はいつもひとつ。しかし、真実はたくさんの虚飾をまとっているということが多い。それを脱がしていくのは非常に面倒くさい。
モリタック:ところで、信用出来ないデータを加工して信用できるデータにしたのは良かったんですが、映画の評価は一層下がってしまったわけですね?
閣下:データを精緻化すれば、ダメなものは一層ダメになる、こともある。
ヒロッコ:興行通信社が発表している週末興行成績ランキングを観ても、「新しい靴を買わなくちゃ」は先週が初登場で9位、今週はランキング外だもんね。
モリタック:ならば仕方ないですね。でも、観てこよう。
ヒロッコ:昼寝しに行ってくるの?
モリタック:違いますよ!みぽりんを観てくるんです。
閣下:女の問題か。俗物め。