「売上やお客様データを分析することで、販売促進や購買単価の上昇につながる」
「各店舗の商品ごとの需要を予測することで、過剰在庫を防ぎ、食品ロスを減らせる」
「ユーザーの閲覧履歴や購買履歴から嗜好を分析し、おすすめ商品を提案することで購買確率を上げられる」
データを上手に活用することでビジネスの効果を上げられることが長年言われていますが、以下のような壁にぶつかってないでしょうか?
- データに欠損値や異常な値などが含まれており、使えない。
- 既存のデータ加工処理が複雑で読み解けず、同じような加工処理を一から作成してしまい、効率が悪い。さらに、また加工処理が増えて複雑性が増してしまう。
- 「氏名にスペースが入っている」「住所が省略されている」などの原因で同じデータが複数行に入っている。その結果、同一人物に複数回告知してしまったり、二重カウントとなり誤った分析をおこなってしまったりする。
- データに含まれるコード値の意味がわからず、どこを調べればいいのか、だれに聞けばいいのかわからない。
- 部門をまたがってデータを活用したいが、個別対応のため時間がかかる。
- データに個人情報が入っているため、企業内のポリシーにより分析に利用できない。
データを活用するには、データを適切に管理する「データマネジメント」が不可欠です。
データマネジメントをおこなううえでは、ルールやプロセスを決めることは重要ですが、ツールの選定も同じぐらい大切なポイントになります。利用者にとって使いづらいツールを選んでしまうと、データマネジメントへの協力が得られず、全社的な取り組みが進まなくなってしまう可能性があります。逆に、適切なツールを導入すれば、決めたルールやプロセスの一部を自動化できるため、業務負荷を軽減することができます。
AWSには、データマネジメントに必要な機能が備わっており、常に機能の改善がおこなわれています。たとえば、Amazon DataZoneを使うと、データをカタログ化し、組織で一元的に管理することができます。AWS Glueを使えば、さまざまなデータソースからデータを見つけ出し、加工して統合することができ、データの品質チェックも自動化できます。AWS Lake Formationを活用すれば、データレイク内のデータに対して、行や列レベルでのきめ細かなアクセス制御を実現できます。これらのサービスは、日本でも本番環境ですでに利用されている実績があります。
本書は、データマネジメントの体系的な整理に閉じることなく、6つの実践的な課題から対処法を説明していくことで、自分ごととして理解しやすいようにしています。AWSサービスの操作方法も具体的に記載しているため、何を実施すればいいかがわかります。
5名の著者陣は、さまざまなバックグラウンドを持ちながら、AWS Professional Servicesチームのコンサルタントとして働いており、お客様のデータにまつわる課題を多数解決した経験を持ちます。そのノウハウを本書にはふんだんに盛り込みました。ぜひ楽しみながら読んでいただけると幸いです。