【Excel】データ分析してみる②

スポンサーリンク





前回、Excelでデータ分析のアドインを追加して使用可能にしました。

それから国税庁のサイトから練習用に使えそうな表を取ってきました。

それを使って統計学やデータ分析を少しずつやっていこうと思います。

使うデータは
国税庁の「民間給与実態統計調査結果」

ここから「第13表 事業所規模別及び勤続年数別の給与所得者数・給与額」を使います。

このファイルを開いてみてそのまま使うには、少しデータが多いので簡単にするためにデータ量を減らして使います。

平均給与の表から合計のみを抜き出して新たに表を作ります。

こんな感じ

これでシンプルになったのでこの表を使って、まずは「平均値・中央値・最頻値」の3つの値を算出します。

〇 平均値とは

「平(たい)ら」に「均(なら)す」という意味で、全てを同じ高さにするという事。高いものと低いものを合わせて全て平らにならすのが平均値。

〇 中央値とは

「真ん中」という意味でデータを値の大きさ順に並べた時にちょうど真ん中に来る値のことが中央値。

〇 最頻値とは

「登場回数が多い値」という意味でデータの中で最も登場回数が多い値のことが最頻値。

英語では

mean(ミーン) = 平均値

median(メディアン) = 中央値

mode(モード) = 最頻値

と言います。よく平均の事はaverageという事がありますが、この場合は「平均値・中央値・最頻値」などの真ん中を表す値のことを総称して「代表値(average)」と言います。異なる代表値を使って読み解くことでデータは見せる顔が変わってきます。

では、それぞれの値をExcelで算出します。

この場合アドインではなく、通常の関数で出せます。

平均値は比較的使うことが多いと思うのですが、他はそんなに使う機会が少ないかと思います。実際自分はこの本で統計学の事を学ぶまで意識して使うことはなく、表をグラフ化してこの値が一番多いなとか、なんとなくでしか考えてなかったです。

平均値はExcelでは「=AVERAGE(C6:J13)」で出します。

中央値は「=MEDIAN(C6:J13)」、最頻値は「=MODE(C6:J13)」とそれぞれ出します。こんな感じの値が出ます。(カッコ内の値は実際の表によって変わります。)

平均値:5,043

中央値:4,714

最頻値:3,996

という結果になり結構差が開きました。ですが、正直この値では細かすぎます。平均値や中央値はいいのですが、最頻値はこれだけ細かいとあまり意味があるようには思えません。最頻値の「3,996」は2か所(勤続年数5~9年で500人以上と5000人以上)しかありません。どうやら最頻値は値の範囲を決めて、そこから算出しなければいけないようです。(登場回数が多い値なので当然といえば当然ですが・・・)

この表をグラフにするとこんな感じになります。

これを見ると規模の大きいところで勤続年数が20年以上の人の金額が高くなっています。まぁ、勤続年数が長いとその分昇給回数が多いから高くなるのは当然といえば当然です。昇給するだけでもありがたいけど・・・ 今はなかなか昇給しないよね。

しかし、よく見るとあまり変化が見られない個所もあります。「事業所規模が1~4人」の事業所の場合は勤続年数による変化があまり見られません。「5~9人」も大きな変化は見られません。やはり事業所規模が小さい所では平均給与の伸びも少ないようです。どこも20年以上勤務していればある程度以上の伸びは期待できるようです。20年以上勤務しているというと、年功序列の恩恵にあずかっている人たちでしょうか?

算出した値は「平均値:5,043」「中央値:4,714」でした。

比較的近い所は平均値では「事業所規模が100人以上」の「15~19年勤務」の値より少し多いぐらいです。中央値は「事業所規模が500人以上」の「10~14年勤務」の値よりほんの少し多いぐらいです。

他に気になるのは35年以上勤務していると何故か給与が下がっているのは何故だろう??嘱託の人とか含まれてるのかな?でも、嘱託の人って一旦退職するよね。

この表には載っていないですが、公務員の平均年収は630万くらいだそうで、一般企業の平均よりも100万以上多いです。勿論平均なので全員がこの額ではないですが、ちょっと貰い過ぎ何じゃないかと思うのは自分だけ?

こうしてみると所謂中小企業って大して給料あがらないのね(>_<)というのが考えられます。

まぁ、愚痴っぽいことは置いといて、まだまだ平均値や中央値では分かることは少ないと思いますが、進めていくうちにもっと分かることが増えてくるのではと思います。

一先ず今回はこれまで。

スポンサーリンク
%d人のブロガーが「いいね」をつけました。