« お使い時々雨 | トップページ | CD・MDコンポを廃棄 »

2013.04.14

『統計学が最強の学問である』

「ビッグデータ」というIT用語(?)が流行している中で注目を浴びている統計学のなかで、書店オシな本です。

ビッグデータって何?という定義ってまだ定まっていないような気がするのですが、僕は全件データ解析のことだと勝手に認識しています。本書の前半では、そもそも全件を扱わなきゃいけない意味って何よ?妥当なサンプリングができれば、何も全件使うことなんかないでしょ、という話が進みます。学問としての統計学においては「いかに計算の手間を省いて近似的に精度の高い推測を行うか、あるいはできるだけ少ないデータで精度の高い推測を行うか」について研究が進められ、成果を挙げているので、その理論を適切に適用すればお金のかからない(Excelに手入力で済む程度の)データ解析で十分なことのほうが多いということです。

で、適切なサンプリング。本書の中盤ではランダムサンプリングということを重点的に解説が進みます。でも、統計学で言うランダム抽出はなかなか実務では難しそうだなという印象を持ってしまいました。そんなランダムサンプリングに時間と費用を費やすなら、安価になってきたハードウェア性能にものを言わせて全件扱ってやろうぜという話になってしまうのではないかなぁ。

本書終盤で、帰納と演繹の話が出てきます。仕事でよく聞くのが「理屈でこうなんだから、この手を打てば効果があるはず。」という戦略立案。「この手」の結果データが手に入ることがなかなか少ないのが実態なので「理屈」の妥当性と「この手」の費用、期待効果の兼ね合いでGoなりStopなりの判断をするのが実際でしょう。現実のビジネスでなかなか実施できていないのが、その後の検証。せっかく本書で言う「A/Bテスト」の結果が手に入る機会なのですが、そのデータを収集も解析もしないことが多いのが残念なことです。これは当人が悪いのではなく、いいか悪いかわからないけどやってみる施策が結果として失敗であることが判明したら立案者が吊るし上げられる風土がそうさせているんだと思います。うやむやなほうが都合がいい立場の人を多く作ってしまっているのですね。そもそも企画がいい結果になることも悪い結果になることもあることの「ブレ」(誤差)をまったく許容していないんでしょうね。結果が悪ければ悪いで次に生かしましょうという話にもっていかないと、組織がきちんと成長しないと思うんですけどね。

終盤あたりを読んでいて気がついたのが、Google検索の仕組みがかなりよくできた統計学の応用なんだろうということです。検索キーワードからユーザーが最も探したいであろうWEBサイトを提示する、単語からサジェストする、行動分析からもっとも効果のある広告を表示するなど、きっと統計学を適切に使っているんだろうなと思います。Amazonのおすすめなんかは、統計学を収益に変えている顕著な例でしょう。(一般の小売業は統計の収益化のメインがいまだにダイレクトメールだったりしますから。)

きっと難しい統計学に関して、触りの部分をセンセーショナルに取り上げた本書ですが、それでも理論はなかなか頭に入りませんでした。「統計家」たちがどういう武器を持って挑んでくるのかっていうところくらいは感じることができたでしょうか。まあ、実用にならない集計値を耳障りのいいバズワードとともにキレイなPowerPointに仕立て上げてやってくるマーケッターに気をつけなければいけないことは肝に銘じておきましょう。


|

« お使い時々雨 | トップページ | CD・MDコンポを廃棄 »

コメント

コメントを書く



(ウェブ上には掲載しません)




« お使い時々雨 | トップページ | CD・MDコンポを廃棄 »