書籍概要

先輩データサイエンティストからの指南書
―実務で生き抜くためのエンジニアリングスキル

著者: 浅野純季，木村真也，田中冬馬，武藤克大，栁泉穂　著
発売日: 2025年8月27日
更新日: 2025年8月27日

概要

データサイエンティストに求められるスキルは，いまや分析技術だけではありません。実務で活躍できるデータサイエンティストになるためには，チームでの働き方も身に付けなければいけないでしょう。本書では，分析環境の準備・分析データのチェックから，機械学習モデルの運用やプロトタイプ開発まで，データサイエンティストが抑えるべき「分析前後」の知識を身に付けられます。ワンランク上のデータサイエンティストになるための，強力なガイドとなる本です。

こんな方におすすめ

新人データサイエンティスト
分析技術は学んできて，これからチームで働く人

サポート

ダウンロード

本書の参考文献・関連書籍リストをダウンロードできます。

（2025年8月27日更新）

ダウンロード: 先輩データサイエンティストからの指南書_付録.pdf

補足情報

本書のサンプルコードは，下記のリポジトリで公開しています。

（2025年8月27日更新）

https://github.com/eycjur/ds_instructions_guide

先輩データサイエンティストからの指南書―実務で生き抜くためのエンジニアリングスキル

概要

こんな方におすすめ

目次

第1章 実務で生き抜くためのエンジニアリングスキル

1.1 データサイエンティストを取り巻く環境の変遷

1.2 プロジェクトで求められるエンジニアリングスキル

1.3 まとめ

第2章 環境構築

2.1 分析の土台としての環境構築

2.2 リポジトリの構造を整える

2.3 VS Codeでの開発環境の整備

2.4 Dev Container による仮想環境構築

2.5 uv によるパッケージ管理

2.6 まとめ

第3章 コードの品質管理

3.1 Notebookだけのデータサイエンティストからの卒業

3.2 コード品質とは

3.3 品質の高いコードとその実現方法

3.4 コードレビューによる品質管理

3.5 まとめ

第4章 データの品質確認

4.1 データの品質確認の重要性

4.2 分析開始前のデータ確認

4.3 Panderaによるデータフレームのバリデーション

4.4 データ品質管理の継続的な取り組み

4.5 まとめ

第5章 機械学習モデルの実験管理

5.1 実験管理の意義

5.2 Hydraによるパラメータ管理

5.3 MLflowによる実験の比較

5.4 まとめ

第6章 プロトタイプ開発

6.1 プロトタイプ開発の意義

6.2 Streamlitによるプロトタイプ開発

6.3 まとめ

サポート

ダウンロード

補足情報

商品一覧

先輩データサイエンティストからの指南書
―実務で生き抜くためのエンジニアリングスキル

第1章　実務で生き抜くためのエンジニアリングスキル

1.1　データサイエンティストを取り巻く環境の変遷

1.2　プロジェクトで求められるエンジニアリングスキル

1.3　まとめ

第2章　環境構築

2.1　分析の土台としての環境構築

2.2　リポジトリの構造を整える

2.3　VS Codeでの開発環境の整備

2.4　Dev Container による仮想環境構築

2.5　uv によるパッケージ管理

2.6　まとめ

第3章　コードの品質管理

3.1　Notebookだけのデータサイエンティストからの卒業

3.2　コード品質とは

3.3　品質の高いコードとその実現方法

3.4　コードレビューによる品質管理

3.5　まとめ

第4章　データの品質確認

4.1　データの品質確認の重要性

4.2　分析開始前のデータ確認

4.3　Panderaによるデータフレームのバリデーション

4.4　データ品質管理の継続的な取り組み

4.5　まとめ

第5章　機械学習モデルの実験管理

5.1　実験管理の意義

5.2　Hydraによるパラメータ管理

5.3　MLflowによる実験の比較

5.4　まとめ

第6章　プロトタイプ開発

6.1　プロトタイプ開発の意義

6.2　Streamlitによるプロトタイプ開発

6.3　まとめ