グラフ仕事人六道数人~陥りやすいデータ分析の誤りと効率的なグラフの利用方法

第8回量的データと質的データは青春の蹉跌 その2:尺度にもいろいろな種類がある。適切な方法で分析しよう

本稿では直感でわかるデータ分析⁠2015年9月30日、技術評論社刊)の一部内容を参考にし、データなどを転載しています。

  • 「愚昧という言葉は、あなたのためにあるようですね。いたしかたありません。ならば基本から説明しましょう。では、データとはどういうものかを教えてさしあげましょう。変数には量的データと質的データがあり、質的データはさらに名義尺度と順序尺度に分れ、量的データは比例尺度と間隔尺度に分かれます」

数人は説明しながら、様也のレポートの表紙にチャートを描いてみせた。

チャート1 ⁠直感でわかるデータ分析』⁠2015/9/30、技術評論社刊)より転載
チャート1 『直感でわかるデータ分析』(2015/9/30、技術評論社刊)より転載
  • 「おわかりですか?」
  • 「……わからない」

典型的なクチャラーである様也は、カレーを食べながら血の涙を流した。

  • 「簡単に言えば計算できるデータとそうでないものがあるということです。質的データは計算できません。たとえば、東京と大阪を足すことはできません。量的データである体重や距離、売上金額は計算可能です」
  • 「ああ、満足度も量的データだから平均を計算してもいいんだね」

珍しく様也が説明の最中に割って入った。カレーを食べ終えてほっとしたらしい。

  • 「……そうです。しかし、これは間隔尺度というものであることにご注意ください。つまり、等しい間隔の目盛り、満足度で言えば、⁠大変満足⁠⁠やや満足⁠という選択肢の間にある距離は、⁠どちらでもない⁠⁠やや不満⁠の選択肢間の差と同じということです」
  • 「あーあーあー」

様也が露骨にわかっていない風の返事をする。

  • 「比例尺度>間隔尺度>順序尺度>名義尺度の順で、用途が多くなります。一般的なビジネスデータはこれらが混ざっていることが多く、グラフは名義尺度と比例尺度ないしは間隔尺度を用いれて作成されます。こんな感じですね」

数人はそこまで説明して、一息ついた。

図1 ⁠直感でわかるデータ分析』⁠2015/9/30、技術評論社刊)より転載
図1 『直感でわかるデータ分析』(2015/9/30、技術評論社刊)より転載
図2 ⁠直感でわかるデータ分析』⁠2015/9/30、技術評論社刊)より転載
図2 『直感でわかるデータ分析』(2015/9/30、技術評論社刊)より転載
  • 「ここでお父さんに質問です。これまでの説明を理解していればすぐにわかることです」

数人は血の涙を流しながらメモを取り始めた父に冷たい眼差しを送る。

読者への挑戦

数人が様也に出した問題にみなさんもチャレンジしてみましょう! 下記URLから回答できます。

ケース1:

先ほどのデータでは満足度を5段階で評価していました。しかしデータを取る際、どうしても真ん中の「3 どちらでもない」を選択されることが多くなります。そこで「3 どちらでもない」をのぞいた4段階評価を行うことにしました。この場合も同じように平均を計算できるのでしょうか?

ケース2:

メールサービスとサジェストサービスの、満足度と重要度を比較するためのグラフはどのようなものが適しているでしょうか?

ケース3:

複数のサイト利用者の職業分布を比較するとき、どんなグラフが適しているでしょうか?

ケース4:

これは今回の説明には含まれていませんでしたが、ちょっと考えれば常識でわかるということで確認です。お父さんと私の計算した平均は、なぜ異なっていたのでしょう?

おすすめ記事

記事・ニュース一覧