情報・資料館

データ分析のはじめの一歩①【エクセルで代表値を求めよう】

2020-06-19

 

データがいろいろあるんだけど、分析するにはまずどうしたら良いのかな?

こんな疑問を解決したいと思います。

 

少しずつ統計学についてお伝えしています。

ですが私は統計初学者であり、数学のスペシャリストではありません。

こちらでは、あくまでも私が学んできた内容を中心に、産業保健師の業務にも役立つような内容をお伝えしたいと思っています。

説明がイマイチかもしれませんが、よくわからなければググってみてください(笑)

 

統計学に強くなりたい【産業保健師スキルアップ】

こんにちは。 今回は統計についてのお話です。 統計? 昔習ったけど、苦手だなぁ・・・ 会社にデータはたくさんあるけれど、使いこなせてない・・・ こんな風に思ったことはありませんか? 私は統計学に苦手意 ...

続きを見る

 

代表値

データの分類を押さえたところで、またまた超基本的な内容である「代表値」についてお伝えしたいと思います。

代表値とは、データを分析するときに最初に求めておくべき数値で、「とりあえず代表値を求めてデータの特徴を見ておこう」といったスタンスで求められるものです(笑)

つまりは、手元にあるデータがどのような特徴を持つのかを簡単に把握するために、代表値を求めることになります。

 

代表値とは、以下の3種の数値を言います。

平均値

中央値

最頻値

 

平均値:AVERAGE関数

平均値とは、言わずと知れた、あの平均値のことです。

小学校で習いましたかね。

平均値 =(全ての数値の和)÷(数値の個数)

で求められます。

 

Excel の場合

「AVERAGE」という関数で求めることができます。

=AVERAGE(最初のセル:最後のセル) ←( )でセルの範囲を指定してくださいね

 

中央値:MEDIAN関数

中央値とは、データを小さい順に並べた時、ちょうど真ん中に位置する数値を言います。

データの個数が奇数の場合にはちょうど真ん中の数値がありますが、データの個数が偶数の場合にはちょうど真ん中の数値が無いため、真ん中に近い2つの数値の平均を中央値とします。

 

Excel の場合

「MEDIAN」という関数で求めることができます。

=MEDIAN(最初のセル:最後のセル) ←( )でセルの範囲を指定してくださいね

 

最頻値:MODE関数

最頻値とは、最も多い数値を言います。

身長や体重はぴったり同じと言うことが少ないため最頻値を求める意味はあまりありませんが、年齢や階級ごとに分けた各種の数値では最頻値を求めることができます。

 

Excel の場合

「MODE」という関数で求めることができます。

=MODE(最初のセル:最後のセル) ←( )でセルの範囲を指定してくださいね

 

おまけ 合計:SUM関数

合計を表す関数はSUM関数です。

 

Excel の場合

=SUM(最初のセル:最後のセル) ←( )でセルの範囲を指定してくださいね

 

統計学の知識を業務へ活かそう【産業保健師スキルアップ】

こんにちは。 統計学を学ぼうとしたきっかけなどは別でお伝えしましたが、今回は「統計学の知識を実際の業務へどのように使うことができるのか」についてお伝えしようと思います。   私は統計学がまる ...

続きを見る

 

最後に

今回はここまでにしますね。

代表値とともにもう2〜3種の数値を求めると、よりそのデータの特徴を掴むことができます。

それについては、また次に。