2014年8月26日火曜日

風が吹けば桶屋も楽器屋も眼医者も儲かる、かも

データアナリティクス事業部の左近です。

きっかけは、先日友人が突然発した一言。
「エビフライ大好きなやつにバカが多い、って科学的に証明されてるらしいよ」


極めて理不尽かつ暴力的でありながら、"科学的に証明"のフレーズを添えることでどことなく権威的でもあるこのワンセンテンス。

衝撃を隠せなかった私は、早速Google先生に尋ねてみました。
すると、どうやら数年前にバラエティ番組で実験されていた様子。

更に専門家(大学教授)の見解によると、エビに多く含まれるタウリンは、物事の理解力を補う成分であり、能力が低い動物は生理的欲求に従って、摂取を求めるとのこと。

なんともアバウトな実験。

この話で、ひとつ気になるところは、
「じゃあ鷲のマークが輝く某ドリンク好きな人はどうなのか?」
とかそういうことではなく、この立証が恣意的な仮説に基づいた
「やっぱりそうだ!」な結果だったのか?

それとも、何の気なしにエビフライ好きを集めたら、
「あれ、この人たち、ちょっと変かもしれない」
という結果が出たのか?

はたまた、エビフライを愛してやまない優秀な研究者が
「エビフライ好きは優秀な人間が多いに違いない」
と調べた結果、真逆の結果が出てしまったのか?

閑話休題。

先日、タレントの伊集院光さんがラジオ番組の中で、ビッグデータについて語っていました。
その中で印象的だった言葉。

逆算で、全国のデータで偶然を含めて同じカーブを描くもの、
そう言う奴を見つけて間を屁理屈で埋めていきたい。
「風が吹いたら桶屋儲かる」の逆みたいな、まず風と桶をまず見つけて、
真ん中を埋めていくと何かが見えてく気がして凄い面白い。

~とある桶屋~

旦那「おい、今日えらい売れてるな。やっぱ台風の後だからか?」
店番「台風の後だと売れるんですか?」
旦那「昔からそうだな。この間の台風の後も売れただろう。
   台風で桶がダメになる人が多いんだろうな。」
店番「でも、何で台風で桶壊すんですかね?
   普通は外に持ち出さないですよね?」
旦那「じゃあ聞いてみるか。」

奥様「ネズミよ、ネズミ!!ネズミが齧ってダメになっちゃったの!!」

旦那「ネズミ!? 台風の次の日はネズミが増えるのか?」
店番「あー、Googleトレンドで”ネズミ”上位にきてますね。
   twitterのトレンドでもかなり上に来てるみたいです。」
旦那「ほう。」
店番「”楽器”もあがってますね」
旦那「楽器・・・?」
店番「何か台風の土埃で目痛めて仕事休み取った人が多いみたいで、
   その休みの間に楽器始めた人が多いみたいっすね。」
旦那「楽器?ギターとかか?」
店番「色々クラスタリングしてみた感じだと三味線が多いですね。」
旦那「三味線??」
店番「ああ、三味線作りまくって猫が減ったからネズミが増えたとか?」
旦那「ひどい推論だな。」
店番「でも、ちょっと見てくださいよ。
   これ、うちの店の裏口にある監視カメラで撮った動画を
   解析したグラフなんですけど、実際、ネコの数が
   先週よりがっつり減ってますもん。
   今度はネズミを見てみますけど・・・ほら、ネズミめちゃくちゃ増えてますし。」
旦那(何でそんな分析データ持ってるんだ・・・)
店番「他の場所のデータも突き合わせてみましたけど、
   やっぱ全体的に相関関係ありそうですね。
   ちょっとランダムフォレストでもかましてみますか。」

こうして「風が吹けば桶屋が儲かる」のロジックを確固たるものにした旦那は、その後、楽器屋の経営、眼科クリニック等、天候に応じて多角的なビジネスを展開し、大成功を収めましたとさ。
めでたしめでたし。

わああああああ、ビッグデータすごい!

ってんな訳あるかい。ドリフなら全員でズッコケですね。

とは言え、風と桶の関連性を何となく知っていた旦那がやっぱ勝ちな訳で。
あとはそれをデータやらアルゴリズムやらをぶつけて解析していくという。

ビッグデータっていうと、無造作にたくさんのデータを放りこんだら、ゼロベースで面白い仮説が出てくるような、「最新のびっくり箱」的なイメージがあるような気がしますが、どちらかというと現場の経験と勘を煮詰めて、みんなで共有できるモデルに昇華させるアプローチの方が良いのでは? と最近思うようになりました。データマイニングが後から流行ってきているのもそんな流れで。

おもしろいことを探すためには、どうやら色々勉強が必要なようです。

じゃあ、ちょっとエビフライ食べてきますね。

0 件のコメント:

コメントを投稿