○不透明な時代を見抜く「統計思考力」
神永正博
ディスカバー21 2009年4月15日第1刷発行
著者は、自称「データ分析オタク」(東北学院大学工学部准教授)。
データ分析が、自力でモノを考える際に強力な武器になるというのが著者の主張。
著者は大事なことは3つだという。
【1】データを先に見る
【2】だれかが解釈する前のデータを見る
【3】自分の仮説に反するデータも集める
若者の読書離れについて、著者は、データから次のように言う。
(1)小中高校生は、本を読んでいる
(2)大学生は本を読まなくなっている
(3)社会人(64歳以下)は、ネットと本を読む
(4)65歳以上は、ネットの利用は少ない
そして、(2)の原因について、大学の大衆化が最も大きいのではないかとする。
△
つまり、大学生全体の平均読書時間が減っているのは、1つには「よく読んでいる層」以外に、「ほとんど読んでいない層」がどんどん大学に入ってきているからだと考えられます。
最近になって、大学生が、見かけ上「読む層」と「読まない層」へと二極化したように見えますが、実際には、もともと違う層に属する若者が、スライドして大学に入学してきているだけなのではないでしょうか。「昔の」大学生と「今の」大学生は同じではありません。今や、男子の4年生大学進学率は5割を超えています。全員が昔と同じように本を読んでいると思うのは間違いでしょう。(P46)
▽
私の能力では検証できないが、なるほどって気はする。
所得分布がべき分布(パレート分布)になっているという説明も面白い。
△
つまり、高額所得者の上位1%(超高額所得者)は、その他の99%(庶民)とはまったく違う「べき分布」になっているのです。
べき分布についてはのちほど詳しく説明しますが、一言でいえば、「極端な差が出やすい性質を持つ分布」のことです。
庶民の所得は、差があるといっても数百万円程度ですが、べき分布の場合には、1億円の人がいるかと思えば10億円の人もいるという具合です。
99%の庶民は、基本的には日々の給与で所得を積み重ねているため、差が小さくなります。これに対して、上位1%の人たちは、投資によって所得が決まるため、所得がが大きく変化しやすいためだと考えられています。(P122~123)
▽
対比で、正規分布については、次のような説明。
△
このように、独立に変動する値が多数足し合わされると、正規分布に近い分布になります。(略)
正規分布が重要なのは、独立に変動する値の足し合わせというのが、さまざまなところに現れるからです。たとえば、身長は骨の長さと椎間板などの骨と骨のつなぎめの長さ(厚み)の合計ですが、それぞれの大きさは独立に近いため、正規分布すると考えられます。(P147)
▽
試験の成績などは、正規分布が当てはまらないことが多く、ワイブル分布と呼ばれる、機械部品等の寿命分析で使われる分布になることが多い。これは、左か右のどちらかに偏った分布になっているのだという。
△
試験といえば偏差値ですが、
得点分布が正規分布から離れたもののときは、
偏差値という尺度は適切とはいえない
のです。
正規分布は非常に重要な分布で、現在の統計学の基礎理論は、かなりの部分、正規分布に依存しています。しかし、いくら頼りがいがあるからといっても、ちょっと頼りすぎという気がしないでもありません。
あくまでわたしの見解ですが、どんな現象にでも機械的に正規分布を当てはめている場合が多すぎるような気がします。共通一次試験の得点分布は、正規分布の当てはめが適切ではない例です。(P152~153)
▽
で、正規分布の問題点について触れ、べき分布の重要性について語る。
△
べき分布は、株価だけでなく、自然界のさまざまな現象を支配する確率法則で、正規分布とはまったく違う性質を持っています。
べき分布と正規分布との最大の違いは、平均や分散が存在しないことがあることです。
(P170~171)
▽
で、LTCMの失敗は、正規分布によるリスク見積りによる失敗であったと言う。
△
投資のプロでも、予想外の出来事でそれまでの資産をすべて失うような事態が発生する背景には、べき分布の存在があります。べき分布はワイルドな分布なので、現在の金融技術ではうまくコントロールできないのです。(P179~180)
▽
として、分散投資が絶対安全だは言えないのだとする。
部分的には既に読んだ内容もあったが、なかなか面白かった。
一読をお勧めしたい。
最近のコメント