研修・資格 資格

データ(変数)の分類【統計学の基本】

2020-06-18

別の記事で少しずつ統計学の話をしていますが、ちょっとずつ深掘りしていきたいと思います。

「統計学」への苦手意識を持つ方も多いと思いますので、少しずつ進めたいと思います。

 

産業保健師の業務において統計学の知識があるとより深くデータを見ることができるはず、ということは別の記事でお伝えしてきました。

もし以前までの内容をご覧になりたい場合には、以下の記事を覗いてみてくださいね。

 

統計学に強くなりたい【産業保健師スキルアップ】

こんにちは。 今回は統計についてのお話です。 統計? 昔習ったけど、苦手だなぁ・・・ 会社にデータはたくさんあるけれど、使いこなせてない・・・ こんな風に思ったことはありませんか? 私は統計学に苦手意 ...

続きを見る

 

統計学の知識を業務へ活かそう【産業保健師スキルアップ】

こんにちは。 統計学を学ぼうとしたきっかけなどは別でお伝えしましたが、今回は「統計学の知識を実際の業務へどのように使うことができるのか」についてお伝えしようと思います。   私は統計学がまる ...

続きを見る

 

それでは、上記でお伝えした「記述統計学」の中で、「データを要約する」という部分について、もう少し進めていきたいと思いますが、その前に「データ」の分類について改めて押さえておきましょう。

知らないと何か不都合があるというわけではないのですが、何となく知っておくだけでも良いかと思いますので(笑)

 

データ(変数)の種類

データの種類には、以下の二つがあります。

・質的データ(質的変数)

・量的データ(量的変数)

 

変数

「変数」という言葉はなかなか普段聴き慣れないと思います。

「変数」=「データ」だと考えていただければ大丈夫です。

 

質的データ(質的変数)

質的データは、一言で言うと「数量ではないデータ」を言います。

例えば、アンケート結果の“男・女”の記載や、尿検査結果の”たんぱく+”といったデータは、質的データになります。

 

名義尺度

質的データのうち、先に述べた“男・女”で区別するようなデータを「名義尺度」といいます。

その区別に優劣や大小が無い場合がそれに当てはまり、他には血液型や住所、従業員番号といったデータも名義尺度になります。

従業員番号は「数値」ですが、その大小には特に意味のある優劣は無く、「一人ひとりに割り当てられた番号」という意味しか持ちません。

 

順序尺度

質的データのうち、先に述べた尿検査結果の”尿たんぱく(+)”といったデータは、尿タンパク(ー)、(±)、(+)、(++)、(+++)と、データを区別するだけでなくその区別に順序だった意味がある場合には、「順序尺度」と言います。

その区別に大小や順序の意味があるものが順序尺度となります。

 

量的データ

量的データは、一言で言うと「数量データ」を言います。

例えば、年齢、体温、血圧など、それぞれの数値が数量としての意味を持っています。

 

間隔尺度

間隔尺度は、体温などの等間隔の目盛りがついているような数値で、その数値の差や間隔に意味があるものを言います。

 

比率尺度

比率尺度は、身長や体重、血圧などの増減を比率で表すことのできる数値で、その数値が「0」だった場合に「無い」と言えるものを言います。

 

まとめ

データの分類ができたから何が良いのかと言われると困ってしまいますが(笑)、数学や統計学を学ぶ上での基本となることなので、少なくとも「質的データ」と「量的データ」の区別ができれば良いかと思います。

少しボリュームが増えてしまったので、今回はここまでにしますね。