先輩データサイエンティストからの指南書 ―実務で生き抜くためのエンジニアリングスキル

著者: 浅野純季（あさのじゅんき），木村真也（きむらまさや），田中冬馬（たなかとうま），武藤克大（むとうかつひろ），栁泉穂（やなぎみずほ）　著
定価: 2,860円（本体2,600円＋税10%）
発売日: 2025.8.27
判型: A5
頁数: 240ページ
ISBN: 978-4-297-15100-3 978-4-297-15101-0

サポート情報

概要

データサイエンティストに求められるスキルは、いまや分析技術だけではありません。実務で活躍できるデータサイエンティストになるためには、チームでの働き方も身に付けなければいけないでしょう。本書では、分析環境の準備・分析データのチェックから、機械学習モデルの運用やプロトタイプ開発まで、データサイエンティストが抑えるべき「分析前後」の知識を身に付けられます。ワンランク上のデータサイエンティストになるための、強力なガイドとなる本です。

こんな方にオススメ

新人データサイエンティスト
分析技術は学んできて、これからチームで働く人

プロフィール

浅野純季（あさのじゅんき）

株式会社ブレインパッドリードデータサイエンティスト。プロジェクトマネージャーとしてECサイトのマーケティング分析、レコメンド、効果検証、ゲームのチート検知などのプロジェクトをリード。また、データサイエンスpodcast「白金鉱業.FM」の配信、Meetupイベント「白金鉱業Meetup」の主催、大学での寄付講義などでも活動。 1章と3章の執筆を担当。

木村真也（きむらまさや）

株式会社ブレインパッドデータサイエンティスト。金融・食品業界におけるDX推進組織の立ち上げに携わる。DX推進組織のビジョンやアクションプランの策定といった上流の支援に加え、課題整理、分析、運用化までのデータ活用支援も担当。顧客のデータ活用人財の育成や社内コンペの主催など、データ・AI活用の民主化に向けた取り組みも実施。 4章の執筆を担当。

田中冬馬（たなかとうま）

株式会社ブレインパッドデータサイエンティスト。デジタルマーケティングの領域での分析集計・機械学習モデルの構築や、LLMを活用したプロダクト開発などを担当。LLMに関する研究活動にも取り組み、論文の執筆や学会での発表を行なっている。社外では、AutoResというAIを活用した研究を自動化するプロジェクトに参画している。 2章の執筆を担当。

武藤克大（むとうかつひろ）

株式会社Citadel AI ソリューションエンジニア兼ソフトウェアエンジニア。新卒で株式会社ブレインパッドに入社し、機械学習エンジニアとして、製造業・小売・金融業を中心に、MLOpsの推進や生成AIを活用したシステムの検証・開発に携わる。現職では、AIセーフティーやAIガバナンスに関するプロダクトの導入支援や開発を行う。 3章と6章の執筆を担当。

栁泉穂（やなぎみずほ）

株式会社タイミーデータサイエンティスト。新卒で株式会社ブレインパッドに入社し、通信や小売の領域を中心に、予測モデル開発やLLMアプリケーション開発、データ基盤整備などのプロジェクトに携わる。統計学を専攻していた知見を活かし、新卒研修の資料作成や講師も担当。 4章と5章の執筆を担当。

先輩データサイエンティストからの指南書 ―実務で生き抜くためのエンジニアリングスキル

サポート情報

概要

こんな方にオススメ

目次

第1章 実務で生き抜くためのエンジニアリングスキル

1.1 データサイエンティストを取り巻く環境の変遷

1.2 プロジェクトで求められるエンジニアリングスキル

1.3 まとめ

第2章 環境構築

2.1 分析の土台としての環境構築

2.2 リポジトリの構造を整える

2.3 VS Codeでの開発環境の整備

2.4 Dev Container による仮想環境構築

2.5 uv によるパッケージ管理

2.6 まとめ

第3章 コードの品質管理

3.1 Notebookだけのデータサイエンティストからの卒業

3.2 コード品質とは

3.3 品質の高いコードとその実現方法

3.4 コードレビューによる品質管理

3.5 まとめ

第4章 データの品質確認

4.1 データの品質確認の重要性

4.2 分析開始前のデータ確認

4.3 Panderaによるデータフレームのバリデーション

4.4 データ品質管理の継続的な取り組み

4.5 まとめ

第5章 機械学習モデルの実験管理

5.1 実験管理の意義

5.2 Hydraによるパラメータ管理

5.3 MLflowによる実験の比較

5.4 まとめ

第6章 プロトタイプ開発

6.1 プロトタイプ開発の意義

6.2 Streamlitによるプロトタイプ開発

6.3 まとめ

プロフィール

浅野純季（あさのじゅんき）

木村真也（きむらまさや）

田中冬馬（たなかとうま）

武藤克大（むとうかつひろ）

栁泉穂（やなぎみずほ）

第1章　実務で生き抜くためのエンジニアリングスキル

1.1　データサイエンティストを取り巻く環境の変遷

1.2　プロジェクトで求められるエンジニアリングスキル

1.3　まとめ

第2章　環境構築

2.1　分析の土台としての環境構築

2.2　リポジトリの構造を整える

2.3　VS Codeでの開発環境の整備

2.4　Dev Container による仮想環境構築

2.5　uv によるパッケージ管理

2.6　まとめ

第3章　コードの品質管理

3.1　Notebookだけのデータサイエンティストからの卒業

3.2　コード品質とは

3.3　品質の高いコードとその実現方法

3.4　コードレビューによる品質管理

3.5　まとめ

第4章　データの品質確認

4.1　データの品質確認の重要性

4.2　分析開始前のデータ確認

4.3　Panderaによるデータフレームのバリデーション

4.4　データ品質管理の継続的な取り組み

4.5　まとめ

第5章　機械学習モデルの実験管理

5.1　実験管理の意義

5.2　Hydraによるパラメータ管理

5.3　MLflowによる実験の比較

5.4　まとめ

第6章　プロトタイプ開発

6.1　プロトタイプ開発の意義

6.2　Streamlitによるプロトタイプ開発

6.3　まとめ