前回の標準偏差でも同じように「割合」を考えることが出来ます。
他にも新生児の体重など身の回りには正規分布とみなせる例がたくさんあります。
「正規分布」という言葉が新たに出てきました。統計学では正規分布なしでは語れないと言われるほど重要な存在です。統計学を学ぶ上で正規分布の理解は必須です。
統計学の手法の多くは、この正規分布を前提にしています。
また、世の中の事柄を計測すると、多くは正規分布に従っているものが見受けられることも一つの理由にです。生活習慣や意思の影響を受ける以外の胎児の体重や身長などは正規分布に従います。他にも工場で生産される製品の長さや重さの”バラつき”も正規分布に近似している為品質管理に用いられるそうです。
グラフは左右対称の「釣鐘」状をしています。正規分布に従うデータでは平均値から標準偏差何個分離れているか(標準得点)で割合が分かるのが特徴です。
これを見ると平均から標準偏差±1個分の割合がそれぞれ34%、2個分になると14%増加し、それ以上では2%増えていることになっています。これを見ると全体の7割近いものが平均に近い位置にあるといえます。
因みにヒストグラムの階級幅(1つの棒)をどんどん小さくしていくと正規分布のグラフみたいに釣鐘状になります。
正規分布の山の部分が1つであれば「一峰性」といいます。2つ山があれば「二峰性」といいます。ヒストグラムを作成した際に「二峰性」や、それ以上(3つとか)山がある場合は複雑な何か別の要素が関係していることを示唆しています。
「一峰性」とか「二峰性」は現在読んでいる
には書いていなく別の本
に書いてありました。
正確には34.13%ですが、このパーセンテージは「標準正規分布表」から求めます。
この表は縦軸が「標準得点の小数第一位」、横軸が「標準得点の小数第二位」を示しています。身長170cm~176cmの人が全体に占める割合を求めるには、「μ=170cm、σ=6cm」から176cmの標準得点を求めます。
つまり、「標準得点が0~1」である「身長170~176cm」の割合は「0.3413(34.13%)」と求めることが出来ます。
この場合、「身長170~180cm」の人が占める割合は「45.25%」という事が分かります。
今度は「データの上の部分を占める割合」を求めます。平均値より上はデータ全体の50%であることに注目します。
まずは標準得点を求めます。「(190-170)÷6=3.33」となり、標準正規分布表にあてはめると縦方向が「3.3」横方向が「0.03」となり「0.4996(49.96%)」となります。
「平均値より上の割合は50%」なので50から先に求めた割合49.96を引いて「50-49.96=0.04%」となり、身長190cm以上の人が占める割合は全体の0.04%となります。
① 縦方向に標準得点の小数点以下第一位を「0.0から3.7まで」、横方向に標準得点の小数点以下第二位を「0.00から0.09まで」の表を作成する。
NORM.S.DIST関数の結果から0.5を引くとその位置での値が求められます。
③ あとは他のセルも同様にするだけです。
全体を1としてみると半分は0.5です。その分を引くと平均値からの値が求められます。
因みに身長180㎝の時の標準得点を求めた時は「1.67」でした。平均値から同じだけ差がある160cmの時の標準得点は「-1.67」です。正規分布表にあてはめるとどちらも同じ割合が求められます(値がプラスでもマイナスでも同じです。)