Webいまさら聞けない「統計」のはなし 第3回「データの種類」

 私たちは、普段特に気にすることなく「データ」と一言で呼んでいますが、実はデータには様々な種類があります。それぞれの種類ごとにデータの見方、使用するグラフ、分析の手法が異なってくるので、どのような特徴があるのかを知っておくのは非常に重要です。今回は、データの種類と特徴について、ご紹介いたします。

質的データと量的データ

 データの分類には大きく、質的データと量的データとの2つがあります。質的データとは、好きなスポーツ、血液型、自動車のナンバーなど、単に分類や種類を区別するためだけのデータです。具体的には、かけ算・わり算・足し算・引き算(いわゆる四則演算)ができないものは、質的データだと覚えてください。例えば、アンケートなどで「男性は1に女性は2に○印を付けてください」といった内容を見たことがあると思います。このような与えられた数字を四則演算しても何の意味もないものは、質的データと呼ばれます。

次に量的データとは、枚数、身長、金額など、数値で推し測ることができ、数字の大小に意味をもつデータです。質的データとは逆に、四則演算ができるものになります。例えば物の重量、世帯人数、購入金額などが該当します。

名義尺度と順序尺度

 この質的データも量的データは、さらに2つに分類されています。まず、質的データは「名義尺度」と「順序尺度」に分類されます。名義尺度とは、例にあげた1は男性、2は女性のようにある種の分類を表しているだけで、選択肢の並びには当然意味がない、区別にのみ意味がある尺度です。順序尺度とは、(1大変良い2やや良い3やや悪い4非常に悪い)というように選択肢の並びに意味を持っています。中央値が意味を持つ尺度です。

 次に量的データは「間隔尺度」と「比例尺度」に分類されます。間隔尺度とは、数値の差のみに意味がある尺度のことです。例えば、温度の場合、10度と15度の間隔には「5度異なる」という意味があるが、その比率(50%)には意味がないといったようなものが該当します。平均値、中央値、最頻値、標準偏差(データの偏り具合)といった統計量が意味を持つ尺度となります。次に比例尺度は、ゼロが「何もない」、つまり基点(原点)として特別な意味を持つものになります。例えば、経過時間や速度、身長、体重、血圧などです。比率に意味があるため、データの四則演算が全て可能です。ほとんどの統計量が意味を持ち、用いることができる分析手法が多い尺度です。

 いかがでしょうか?聞きなれない言葉かと思いますが、それぞれの「データ」が持つ意味はご理解していただけたかと思います。ぜひ日々接するデータを、どの種類・尺度に属するものか。考えてみてください。


参考:

・ビジネス最新マーケティング・リサーチがよーくわかる本 岸川茂

・なるほど統計学園高等部 http://www.stat.go.jp

hybrid-banner.png