どのオフィスでも、今やExcelは必須のツールになっています。財務・管理はもちろん、営業成績や出退勤、在庫の管理など、様々な分野で使われていますが、その多くは集計作業であり、他の業務管理ソフト等でもできることです。Excelが最も得意とするのは、情報(データ)の集計ではなく、「データの分析」にあります。
データ分析とは?
巷にあふれる情報(データ)は、ほとんどの場合、単体では意味を持ちません。
たとえば、学校のテストの成績として、
というデータが1つだけあっても、それだけでは何もわかりません。クラス全員の数学の成績を集め、さらに平均点や偏差値を集計して整理することで、初めて意味のある情報になります。
データ分析とは、その考えをさらに発展させたものです。
データ分析は、一般に「統計解析」と呼ばれる学問の中に含まれますが、よりビジネスの実務に近い一分野として認知されています。単純な計算・集計との違いは、一見意味のないデータの集まりから、新たな意味を生み出すことにあります。
先の例で言えば、単に数学の成績から順位や偏差値を出すだけでなく、卒業するまでの数学の成績の推移を予想(回帰分析)したり、数学の成績と他教科の成績の関連性を調査(相関分析)したりすることで、様々な方向から多角的にデータが持つ意味を分析することが、データ分析の目的となります。
新たな意味を引き出そう
では、実際にデータ分析の例を紹介しましょう。
図1
図1は、ゴルフプレーヤーが一年間で購入したゴルフ関連商品、一年間のプレイ回数、一年間の平均スコアをまとめたものです(データは架空のものです)。この表を使って、相関分析を行いましょう。相関分析には様々な方法がありますが、今回は一目で相関の傾向がわかる散布図を使います。データが3種類ありますので、それぞれを組み合わせて3通りの散布図を作ってみます。
相関図では、2つのデータの相関が強い(片方が変動するとそれに合わせてもう片方も変動する)ほど、1つの線に近くなります。反対に、相関が弱い(2つのデータが連動して変化しない)場合は、バラバラの点の集合になります。
表から作成した3つの散布図は、図2のようになりました。
図2
まず、プレイ回数と購入金額の散布図は、右肩上がりの直線のようになりました。これは、やや弱めの相関関係があることを示しています。次に、平均スコアとプレイ回数の散布図ですが、はっきりした右下下がりの直線に見えます。これは両者に強めの相関関係があることを示しています。最後に平均スコアと購入金額の散布図ですが、こちらはバラバラの点の集合になりました。これは、両者に相関関係が見られないことを示しています。
この散布図から、以下のような結論を引き出すことができます。
- ゴルフ関連商品の購入金額とスコアにはほとんど関係がない
-
- プレイ回数の多い人ほどスコアが良い傾向がある
-
- 購入金額が高い人ほどプレイ回数の多い傾向が少しだけある
-
不用意な分析にご用心
ただし、データ分析の結果を鵜呑みにすることは大変危険です。
まず、分析に使うデータのサンプル数が少ないと、正確な分析結果にはなりません。サンプルに外れ値が多い場合も、事実と異なる結果になる可能性があります。
また、相関関係が明らかになった場合でも、それをそのまま「○○すれば××になる」という因果関係に結びつけるのは危険です。もしかすると、他の要因が影響して、2つのデータが連動している可能性があるからです。先の例だと、この年にゴルフブームが起こったために、プレイ回数と購入金額が例年より大幅に上がっていた場合、分析の結果は意味を持たなくなります。
このように、何らかのビジネス上の決定をする際、データ分析の結果だけを盲信することは非常に危険ですが、自分の考えをしっかり持ち、それを裏付けるために分析結果を利用することはとても有効な手法です。ぜひ、あなたのビジネスの現場で、Excelデータ分析を使いこなしてください。