どうも、TJです!(自己紹介はこちら)
今回ご紹介するのは、「統計学が最強の学問である」です。
発行部数50万部を超える大ベストセラーとなった本書から、「とりあえずこれ知ってたらドヤれまっせ」という内容に絞ってご紹介したいと思います。
それではさっそく見ていきましょう!
そもそもなんのために統計学を使う?
この記事をご覧になっている方は、統計学に興味があったり、仕事の現場で実際に使ってたりする人が多いと思いますが、みなさんは統計学を何のために使いますか?
統計学はあくまでツールなので、目的が大事ですよね。
人によって様々だとは思いますが、ひとつ挙げるとしたら「ビジネスでの具体的な行動に繋げて利益を上げるため」だと思います。
ビジネスの現場で、マーケターとかアナリストが統計学を駆使して、見るからに綺麗なレポートを作ってドヤ顔でプレゼンする光景って目にしますよね。
そこで、プレゼンされた側が「ふ~ん、それで?」となってしまうことはよくあります。笑
このケースは、以下に示す大事な視点が欠けているために起こることだといえます。
「統計学をビジネスに活かす」ための大事な問い
- 何かの要因が変化すれば利益は向上するのか?
- そうした変化を起こすような行動は実際に可能なのか?
- 変化を起こす行動が可能だとしてその利益はコストを上回るのか?
この3つの問いに答えられて初めて、ビジネスでの行動に繋げて利益を上げられる見通しが立つのであって、答えられないようであれば「ふ~ん」で終わっちゃうよねということです。
ドヤ知識➀:標準誤差
標準誤差とは、「サンプルから得られた割合に対して標準誤差の2倍を引いた値から標準誤差の2倍を足した値までの範囲に真の値が含まれている信頼性が約95%という値」です。
はい、よく分かりません。おやすみなさい!
冗談はさておき、例えばサンプリングの結果から失業率が25%、標準誤差が0.5%となった場合、実際の失業率も24%~26%の間にあると考えられる、みたいな感じです。
ドヤり方の例としては、「この前の検証結果だけど、クリック率の標準誤差は1%だから、大体前後2%の間に真の値も収まるね、ドヤッ!」とかですかね。
その名の通りですが、要するに「誤差の振れ幅がどの程度か」を表す値です。
ちなみに、Excelなどを使えば簡単に出すことができるので、ぜひ試してみてください。
Excelで出す場合は、「=STDEV(数値 1,[数値 2],…)」っていう関数でサクッと出せるよ~、ドヤッ!
ドヤ知識➁:p値
P値とは「実際には何の差もないのに誤差や偶然によってたまたま差が生じる確率」のことです。
一般的に、「p値が5%以下であれば、その結果は偶然得られたとは考えにくい」と判断できる。そんな値です。
使い方はなんとなく分かったけど具体的になんなの?って問いに対しては、こちらのサイトでさらに分かりやすく解説されているので気になった方はどうぞ。
ドヤり方ですが、「その結果って有意差あんの?まさかだけど、p値って出してみたよね?」などが鉄板ですね。
Excelで出す場合は、「=T.TEST(配列 1,配列 2,2,1)」っていう感じで出せるよ。配列ってのは、有意な差があるのか調べたいデータセットのことね!
ドヤ知識➂:因果関係の向き
これはもうほんと、あるあるの極み。笑
「相関関係はありそうだけど、因果関係があるのかどうかはよく分かりましぇ~ん」ってほんとよくあります。
結論をお伝えすると、「とりあえずA/Bテスト最強!」っていうお話。
因果関係の向きがわからないというのは、実はこの比較している集団が同じ条件ではない、つまり「フェアではない」ということに由来しているんですね。
なので、分析段階でどうにかするのではなく、そもそものデータの取り方の時点でフェアに条件を揃える、要するに「ランダム化比較実験 ≒ A/Bテストをする」ということが、ほぼ唯一といっていい解決策になります。
現場でも施策出してデータ見たけどよく分からんってことはよく起こるんですが、フェアに効果検証ができる「データの取り方」を事前にしっかり設計しておくことが大事です。
最近だとA/Bテストのツールも色々あるので、ぜひ積極的に使ってみてください!
まとめ
私はこれからの10年で最もセクシーな職業は統計家だろうって言い続けてるんだ。
Google チーフエコノミスト ハル・ヴァリアン博士(2009年1月 マッキンゼー社発行の論文誌にて)
I keep saying the sexy job in the next ten years will be statisticians.
ハル・ヴァリアン博士もこう仰っていますので、ぜひみなさんもセクシー統計家への道を進んでみてはいかがでしょうか。
今回ご紹介した内容はほんの一部に過ぎませんので、気になった方はぜひ本書を手に取ってみてください。
他にも統計の歴史など、とても興味深い内容が盛りだくさんです。
さらに、Excelで実際に統計学応用する方法について書かれた本を要約した記事もありますので、こちらも併せてご覧いただければ幸いです。
ではまた!