著者の一言

「売上やお客様データを分析することで、販売促進や購買単価の上昇につながる」
⁠各店舗の商品ごとの需要を予測することで、過剰在庫を防ぎ、食品ロスを減らせる」
⁠ユーザーの閲覧履歴や購買履歴から嗜好を分析し、おすすめ商品を提案することで購買確率を上げられる」

データを上手に活用することでビジネスの効果を上げられることが長年言われていますが、以下のような壁にぶつかってないでしょうか?

  • データに欠損値や異常な値などが含まれており、使えない。
  • 既存のデータ加工処理が複雑で読み解けず、同じような加工処理を一から作成してしまい、効率が悪い。さらに、また加工処理が増えて複雑性が増してしまう。
  • 「氏名にスペースが入っている」⁠住所が省略されている」などの原因で同じデータが複数行に入っている。その結果、同一人物に複数回告知してしまったり、二重カウントとなり誤った分析をおこなってしまったりする。
  • データに含まれるコード値の意味がわからず、どこを調べればいいのか、だれに聞けばいいのかわからない。
  • 部門をまたがってデータを活用したいが、個別対応のため時間がかかる。
  • データに個人情報が入っているため、企業内のポリシーにより分析に利用できない。

データを活用するには、データを適切に管理する「データマネジメント」が不可欠です。

データマネジメントをおこなううえでは、ルールやプロセスを決めることは重要ですが、ツールの選定も同じぐらい大切なポイントになります。利用者にとって使いづらいツールを選んでしまうと、データマネジメントへの協力が得られず、全社的な取り組みが進まなくなってしまう可能性があります。逆に、適切なツールを導入すれば、決めたルールやプロセスの一部を自動化できるため、業務負荷を軽減することができます。

AWSには、データマネジメントに必要な機能が備わっており、常に機能の改善がおこなわれています。たとえば、Amazon DataZoneを使うと、データをカタログ化し、組織で一元的に管理することができます。AWS Glueを使えば、さまざまなデータソースからデータを見つけ出し、加工して統合することができ、データの品質チェックも自動化できます。AWS Lake Formationを活用すれば、データレイク内のデータに対して、行や列レベルでのきめ細かなアクセス制御を実現できます。これらのサービスは、日本でも本番環境ですでに利用されている実績があります。

本書は、データマネジメントの体系的な整理に閉じることなく、6つの実践的な課題から対処法を説明していくことで、自分ごととして理解しやすいようにしています。AWSサービスの操作方法も具体的に記載しているため、何を実施すればいいかがわかります。

5名の著者陣は、さまざまなバックグラウンドを持ちながら、AWS Professional Servicesチームのコンサルタントとして働いており、お客様のデータにまつわる課題を多数解決した経験を持ちます。そのノウハウを本書にはふんだんに盛り込みました。ぜひ楽しみながら読んでいただけると幸いです。

赤羽根正則(あかばねまさのり)

アマゾン ウェブ サービス ジャパン合同会社プロフェッショナルサービス本部所属。大手ITベンダーでデータベース関連の製品開発をおこなったのち,インターネット関連企業で社内向けの大規模データ分析基盤の開発,運用やAIを活用した需要予測システムの開発を担当。AWSではデータ分析基盤のアーキテクチャ作成支援やデータエンジニアリングでのパフォーマンスチューニングなどに従事。

佐藤悠(さとうゆう)

アマゾン ウェブ サービス ジャパン合同会社プロフェッショナルサービス本部所属。大手SI会社でデータ分析基盤の構築や運用,加工パイプラインの作成,機械学習モデルのシステム化などに従事。AWSでは,データ分析基盤の構想策定から具体的な実装支援までをおこなう。AWSサービスでは,AWS GlueやAWS Lake Formation,Amazon MWAAが得意。

仲谷岳志(なかたにたけし)

アマゾン ウェブ サービス ジャパン合同会社プロフェッショナルサービス本部所属。エンタープライズITの分野で28年の業務経験を持ち,エンタープライズストレージ,サーバー仮想化などその時々の最先端インフラを通じて顧客への価値提供をおこなってきた。現在はAWSのプリンシパルアーキテクトとして,さまざまな業界のお客様のクラウドインフラやデータ基盤の設計・構築,生成AIプラットフォーム構想の策定支援などを担当。

松浦晋(まつうらしん)

アマゾン ウェブ サービス ジャパン合同会社プロフェッショナルサービス本部プラクティスマネージャー。大手通信会社において,データベースを中心とした情報システムのインフラ設計開発運用を担当。大手金融機関においては,データ戦略の立案からデータマネジメント施策の実行,データプラットフォームの設計構築運用まで,事業会社におけるデータ活用を推進。AWSでは,エンタープライズ向けのデータプラットフォーム構築やデータマネジメント戦略立案に関する支援に従事。

吉濱佐知子(よしはまさちこ)

アマゾン ウェブ サービス ジャパン合同会社プロフェッショナルサービス本部所属。外資系IT企業基礎研究所にてブロックチェーンAI技術,セキュリティなどの先端技術の研究開発を担当。現在はAWSでコンサルタントとして,データ管理・分析基盤の構想策定や基本設計,データ・AI活用のワークショップ実施やAWS技術活用のための研修活動などに従事。日本学術会議連携会員,情報処理学会理事,国立研究開発法人 科学技術振興機構 研究開発戦略センター(JST-CRDS)特任フェローなどを務める。博士(情報学)。