こんにちは。
統計学を学ぼうとしたきっかけなどは別でお伝えしましたが、今回は「統計学の知識を実際の業務へどのように使うことができるのか」についてお伝えしようと思います。
私は統計学がまるで苦手で、高校生の数学の知識まで全て無くしていたので、高校数学と合わせて一からやり直しになってしまいました。
今でもまだ統計学については初歩的なことしかわかっていませんが、それでも業務に少しずつ使えるくらいにはなってきているはずです。
おさらい:産業保健で扱うデータ
以前にもお伝えしましたが、産業保健分野では心身の健康やそれにまつわる様々なデータを取り扱います。
例えば、
・定期健康診断
・特殊健診
・ストレスチェック
・健康教育のアンケート などなど。
そういった様々なデータを、どのように加工し、どのように表現するのかというところにおいて、統計学の「記述統計学」という分野の知識が使えるでしょう。
また、もし研究等を行うのであれば、「推測統計学」という分野の知識が使えるでしょう。
これは、標本から母数を推測する際の検定等に用いられるものです。
とりあえず、産業保健の一般業務においては、最初にお伝えした「記述統計学」までの知識があれば十分なのではないか、と感じています。
記述統計学とは
先ほどお伝えしたように、統計学は
・記述統計学
・推測統計学
の二つに分けることができます。
そのうちの記述統計学が何かというと、様々なデータがある状態で、
・データを要約すること
・データを可視化すること
を言います。
データを要約する
「データを要約する」というのは、手元にある集めてきたデータがどのような特徴を持っているのかを調べてみるということになります。
基本的に調べることの多いものとしては、
・平均値
・中央値
・最大値
・最小値
・標準偏差
といったものが挙げられます。
それぞれの意味については、また別の機会にお伝えしますね。
集めたデータにおける上記の数値を出してみることで、集めたデータがどのような特徴を持っているのかがわかり、他のデータとの比較に役立ちます。
健康診断のデータを分析してみたいと思ったとき、おそらく膨大なデータが目の前に出てくると思います。
統計学はデータをどのように切り取るか、要約するかの手段でしかないため、そのデータからどのようなことを知りたいのかは自分で考えなければなりません。
ですが統計学の手法を使って何ができるのがわかれば、「このデータをこんな視点からみてみたい」というような考えが浮かんでくるかと思います。
何も浮かばなくても、種類ごと、年齢ごと、性別ごとに上記の数値を出してみるだけでも、何かしら見えてくるものがあるでしょう。
例えば、年齢の平均値を調べる。BMIの中央値を調べる。血圧の最小値・最大値を調べる。血糖値の標準偏差を調べる。などです。
標準偏差がわかると偏差値の仕組みもわかると思いますが、全てのデータについて偏差値で見てみると、個人のデータの良し悪しが比較しやすくなるので面白いかもしれません。
データを可視化する
「データを可視化する」というのは、手元のデータを主にグラフなどで表現することを言います。
よく見かけるグラフとしては
ヒストグラム
折れ線グラフ
棒グラフ
などが挙げられます。
それぞれについて、どのような場合に何を用いて表現すべきかという適性があり、それについてもまた別の機会にお伝えできればと思います。
このデータの可視化はとても大切です。
ただ数値を見せられてもよくわからない場合でも、グラフにすると一目瞭然となってわかりやすくなることが多いですよね。
ただ、可視化することで大きなインパクトが生まれるため、誤った方法で可視化されていたとしても見る側はその誤りに気付きにくい場合があります。
人間は五感を使って情報を得ていますが、約80%は視覚から得ていると言われていますので、目で見て取り込みやすい情報を提示する場合には正しい情報を正しく伝わるように注意しなければなりませんね。
最後に
今回は、統計学の中で業務に活かせそうな「記述統計学」についてザッとお伝えしました。
言葉だけ見ると難しいと感じることもあるかもしれませんが、ここら辺は意外と簡単です。
高校生の数学をすっかり忘れていた筆者でさえ、すぐに理解することができました。
また別の機会に、もう少し踏み込んだお話ができれば良いなと思っています。
-
統計学に強くなりたい【産業保健師スキルアップ】
こんにちは。 今回は統計についてのお話です。 統計? 昔習ったけど、苦手だなぁ・・・ 会社にデータはたくさんあるけれど、使いこなせてない・・・ こんな風に思ったことはありませんか? 私は統計学に苦手意 ...
続きを見る