※本稿では
- 「愚昧という言葉は、
あなたのためにあるようですね。いたしかたありません。ならば基本から説明しましょう。では、 データとはどういうものかを教えてさしあげましょう。変数には量的データと質的データがあり、 質的データはさらに名義尺度と順序尺度に分れ、 量的データは比例尺度と間隔尺度に分かれます」
数人は説明しながら、
- 「おわかりですか?」
- 「……わからない」
典型的なクチャラーである様也は、
- 「簡単に言えば計算できるデータとそうでないものがあるということです。質的データは計算できません。たとえば、
東京と大阪を足すことはできません。量的データである体重や距離、 売上金額は計算可能です」 - 「ああ、
満足度も量的データだから平均を計算してもいいんだね」
珍しく様也が説明の最中に割って入った。カレーを食べ終えてほっとしたらしい。
- 「……そうです。しかし、
これは間隔尺度というものであることにご注意ください。つまり、 等しい間隔の目盛り、 満足度で言えば、 “大変満足” と “やや満足” という選択肢の間にある距離は、 “どちらでもない” と “やや不満” の選択肢間の差と同じということです」 - 「あーあーあー」
様也が露骨にわかっていない風の返事をする。
- 「比例尺度>間隔尺度>順序尺度>名義尺度の順で、
用途が多くなります。一般的なビジネスデータはこれらが混ざっていることが多く、 グラフは名義尺度と比例尺度ないしは間隔尺度を用いれて作成されます。こんな感じですね」
数人はそこまで説明して、
- 「ここでお父さんに質問です。これまでの説明を理解していればすぐにわかることです」
数人は血の涙を流しながらメモを取り始めた父に冷たい眼差しを送る。
読者への挑戦
数人が様也に出した問題にみなさんもチャレンジしてみましょう! 下記URLから回答できます。
ケース1:
先ほどのデータでは満足度を5段階で評価していました。しかしデータを取る際、
ケース2:
メールサービスとサジェストサービスの、
ケース3:
複数のサイト利用者の職業分布を比較するとき、
ケース4:
これは今回の説明には含まれていませんでしたが、