平均に騙されていませんか?
そのアンケート結果本当に信じて良いのでしょうか?
実はこの世の中には平均を使った騙しのテクニックやグラフ、アンケート結果を使ったものが溢れかえっているのです。
かのビルゲイツも推薦する書「統計でウソをつく法」では、そんな統計を使った騙しのテクニックを数字を使わずに紹介しています。
騙されないためには騙す方法を知るのが手っ取り早いのです。
ここではそんな「統計でウソをつく法」の内容を5分でわかるよう要約し、騙されないために気をつけるポイント3つに絞って書いていきます。
普段、統計に触れつつも騙されていた皆さんにぴったりの内容です。
では、行ってみましょう。
本書の概要
ページ数
講談社のブルーバックスという文庫より縦に2cmほど大きい本で、全223ページです。
訳者あとがきは2ページあります。
読むのにかかった時間
挿絵も多くあるので、トータル2時間を切るくらいで読むことができました。
縦書きということで、数字が全て漢数字なのが読みづらかったですが、数式が特に出てくるわけではないので非常に読みやすかったです。
構成
本書は前半部で平均やグラフで騙す方法について触れ、後半で因果関係にまつわる結論の持っていき方で騙す方法を紹介しています。
最後には統計に騙されない5つの鍵として、騙されないためにやるべきことをピックアップしていました。
この記事ではそんな構成に則りつつ、騙されない方法は4つ(僕が実際に現実的だと感じたもの)に絞ってご紹介します。
%による騙しのテクニック
「98%の人が満足したと回答!」
と聞いてどう思うでしょうか?
「おー結構な人が満足しているんだなぁ」「残り2%は満足していないってことじゃん!」
それぞれ意見は分かれたりすると思いますが、実は騙しているポイントは満足度が高いか低いかではないのです。
実はこれってたとえ、3人くらいにしか聞いていなくても算出できてしまうアンケート結果なのです。
聞いている人の数が少なければそれだけ偏った解釈や意見がまとまりやすくなってしまいます。
例えば、中学2年生3人に「世界をどうすれば救えると思いますか?」とアンケート、質問をした場合、おそらく3人「僕の封印された魔眼で救いますよ、その時が来ればね…」と答えるでしょう(笑)
こんな感じで偏った意見を集めるのは簡単であり、人数を少なくすればより簡単になるのです。
先の例が中学生1000人に聞いた、とかになれば話は別で、随分信憑性も上がってくるのではないでしょうか。
%は全体の数が見えていないと、ただの少数の変な意見という可能性を秘めているということです。
またアンケートなどが全て本心から答えているというわけでもないというのも付け加えさせてください。
例えば、「あなたの年収を教えてください」というアンケートがあった時、どれだけの人が本当の自分の年収を答えるでしょうか?
また年収を手取りの年収とするのか、額面の年収とするのかでも結果は異なってくると思います。
このようにアンケートなどのサンプルと呼ばれるデータは容易に、間違った結果につながってしまうこともあるのです。
僕が「統計でウソをつく法」を読んで一番、衝撃を受けた部分であり、じゃあ何を信じればいいんだ!となったポイントでした。
平均による騙しのテクニック
平均には3種類あるのをご存知でしょうか?
平均値、中央値、最頻値があります。
例えば、「160cm、160cm、162cm、175cm、178cm、180cm、185cm」というデータがあったとします。
この時平均値が171.4cmになり、中央値が175cm、最頻値が160cmになります。
データ数が少ないので違いが顕著に出てしまっていますが、このように平均といってもかなり違いがある値をまとめて「平均」という言い方をするのです。
つまり皆さんがみている平均というのがなんの値かによって、意味合いは変わってくるのです。
平均値なのであれば、全値を足して総数で割る。
中央値であれば、総数のちょうど真ん中の値、最頻値であれば一番数の多い値になります。
言葉一つで誤魔化せる値であり、意味合いが大きく変わってくるのです。
ちなみに平均値はバカみたいな外れ値によって、思っている平均よりもズレてきます。
例えば年収100億円とかいうお金持ちが入った、平均所得を考えたら、想像しやすいと思います。
一つの外れ値と呼ばれる値によって狂いやすいのが、平均値なので想像する平均とはかけ離れたものになりやすいのが平均値になります。
逆に中央値は全体のちょうど真ん中なので、かなり平均っぽい値になります。
一番は全ての値を見比べる方法ですが、僕としても「統計でウソをつく法」でも中央値がかなり感覚的な平均に近いものであるとの結論です。
平均という言葉だけで、データ全体の真ん中くらいと思い込むのは危ういことがわかっていただけましたでしょうか?
グラフによる騙しのテクニック
引き伸ばしたグラフやグラフの値が抜けているものをご存知でしょうか?
例えば、こんなグラフです。
これはかなり顕著なひどい例ですが、一見大きくなっているように見えて、実は3Dを利用しているだけのグラフになっていてその値は決して大きくなっていないというグラフです。
他にも縦軸の値の間を超細かい値にすることで小さい差を大きな差に見せるテクニックもあります。
しっかりとどういった単位のグラフなのかを把握しないとケロッと騙されてしまうようなものが多いのです。
グラフは視覚的効果が大きい分、思い込みや人の目を引くようなものを作りやすく、騙される人も多くなります。
皆さんもぜひ、グラフが出ているブログや記事を見つけたら、単位やグラフの縮尺を確認してみてください。
案外、騙そうとしてなくても見た目を重視するが故に誇張表現されたグラフが多いことでしょう。
騙されないためにチェックすべきポイント
ここからは「統計でウソをつく法」で書かれていた騙されないためにチェックすべきポイントについてまとめていきます。
誰が言っているのか
専門家が裏付けをしていてもデータが正しいとは言えないんです。
どういう立場の人が言っているかに注目することが大事になります。
例えば、スポンサーになっている企業の実験結果をスポンサー先の研究所が担当したら、偏った結果になりかねないでしょう。
どの研究所がやったのかだけでなく、その研究、実験結果によって得をする企業や人物がいるかどうかで信頼性も変わってくることを自覚すると騙されづらくなります。
自分に都合の良い結果だけをピックアップしていないかに注目すると、データを鵜呑みにしない心構えが作れます。
どういう方法でわかったデータか
調査方法に注目するのも騙されない方法の一つです。
サンプリング方法に特に注目することが必要になってきます。
アンケートをした際の男女比だったり年代別やアンケートに参加した人数など、信頼できる値になっているかを見極めることが大切です。
いかにランダムなサンプリング結果になっているか、もしくは意図にあったサンプリングが行われた結果なのかを見ます。
見極めることで、いかにテキトーな統計の結果かを見極めることができるのです。
足りないデータはないか
過去25年間でがんによる死亡者数は増加した。という事実があります。
しかしこれには足りていない情報があるのです。
それが、死亡者総数です。
25年前から医学は進歩し、原因不明だった死も「がん」であるという特定をできるようになったりしています。
なので、仮に死亡者総数が変わらないのであれば、決して「がん」が増えているのではなく、原因不明だった死や他の病気の治療法がわかったからかもしれないのです。
一つのデータで結論を出してしまうのは早計なのかもしれません。
まとめ
今回は「統計でウソをつく法」について要約し、まとめてきました。
僕は「統計でウソをつく法」を読んで一番に思ったのは、世の中怖いということと「何を信用したらいいんだ」ということです。
世の中に出ているアンケート結果や研究結果もひっくり返るような考え方だったので、衝撃と共に信じられるデータは実はこの世にないのかもという思いになりました。
ビジュアルばかりに捉われすぎず、しっかりと見極める力が必要なのだとより一層思うようになりました。
皆さんも騙されないように、データは正しいではなくデータは一つの事実を言っているだけという観点で見るようにしてください。
データはウソをつかなくても、データを作る人はウソをつくのです。
では、統計による嘘がなくなって手放しで信頼できるデータで溢れかえる世界になることを祈って。
コメント