グラフ仕事人六道数人~陥りやすいデータ分析の誤りと効率的なグラフの利用方法

第18回最後の復習 その3:万能の散布図

本稿では直感でわかるデータ分析⁠2015年9月30日、技術評論社刊)の一部内容を参考にし、データなどを転載しています。

万能の散布図の読者への挑戦について、正解率や誤答パターンを見ながら解説していく予定だったのですが、なぜかこの回は回答者が異様に少なく、正解率や誤答パターンを出すほど集まりませんでした。決して難しくはなかったと思うんですが……

回答してくださったのはお二方のみで、どちらの方も全問正解とはいきませんでした。やっぱり難しかったんでしょうか。

連載第4話 『万能の散布図』

問題と解説ついてはこちら第14回第15回をご参照ください。

この回では、散布図の活用方法について解説しました。散布図というと相関関係を推定するために使うという固定概念を持っている方が多いようですが、実は「ふたつのデータ系列を比較する」ために広く使うことができます。表題にもあるように、データ系列がふたつであった場合には万能に近い力を発揮します。

「散布図は、ふたつのデータ系列を比較する」ための広い用途で使うことのできるグラフと言えます。

散布図も折れ線グラフももっと自由に、その特徴を生かした使い方をすればもっと便利になります。なぜか、すごく昔からの固定観念にとらわれたグラフの使い方をしがちなのでもったいない。

それでは散布図の例を見てみましょう。下図は複数の競合サイトの満足度と必要度を散布図にしたものです。ビジネス情報サイトが会員登録の際に他に利用しているサイトの満足度と必要度を五段階評価で記入してもらったものを平均値からグラフにしたものです。

画像

ふたつのデータ系列の比較というとピンと来ないかもしれません。たとえば、昨対比や前作との比較などもふたつのデータ系列の比較です。

画像

この回の問題の正解は、前述のページを見ていただければわかりますが、記事を読んでいれば簡単にわかりますし、そもそも問題を見た時点で、⁠散布図の回だから散布図が正解だろう」という予想ができると思うんですが……

さらに言うと、連載当初から筆者が「折れ線至上主義」を標榜していることはわかっているはずなので(読んでいれば⁠⁠、残る可能性は折れ線グラフとわかりそうなものです。

最終回に当たって

最後にみなさんに申し上げたいことは、これまでの連載で一通り申し上げました。中でも大事なことを再度ご紹介しておきたいと思います。

  • 折れ線グラフは汎用的に使えるので、どんどん使いましょう
  • データ系列がふたつの時には散布図の利用も検討しましょう。昨対比や前作との比較、競合との比較には有効です

さらにもうひとつ。これはグラフではなく、問題や課題に対処する際の基本的な心構えをお伝えしておきます。

この連載は記事本体と質問は一体のものとして作られています。したがって記事を読まずに正しく答えることは難しいと思います。この連載に限らず、たいていのものは、前提となっているものを把握しないといけません。

記事本文を読まないで問題に回答するのは、買ったお菓子を食べずに捨てておまけだけとっておくようなものです。ほめられたことではないです。

出題者の意図を読むことは重要です。これは単にテストやパズルだけのことではなく、取引先や上司になにか言われた時に相手の言外の意図を慮ることにもつながります。

グラフの使い方にさらに精進するためには拙著直感でわかるデータ分析⁠技術評論社刊)がおすすめです。最後の最後に宣伝で恐縮です。

おすすめ記事

記事・ニュース一覧