Pythonブートキャンプ[データ分析コース] ~コードを書くチカラを鍛える3週間集中プログラム

「Pythonブートキャンプ[データ分析コース]」のカバー画像
著者
はやたす 著
定価
3,080円(本体2,800円+税10%)
発売日
2025.5.27
判型
A5
頁数
552ページ
ISBN
978-4-297-14931-4 978-4-297-14932-1

概要

「コードを書くには基礎学習を完璧にしなきゃ」と思い込んでいませんか?

試験勉強のように,ノートにまとめたり,文法を丸暗記したり……。しかし,本当のプログラミング最短習得の道は「とにかく実践あるのみ」です。

そこで,本書はデータ分析の演習問題を105問掲載。自分でコードを書くトレーニングを1日5問ずつこなし,3週間で実務に通用するレベルを目指します。

「入門書を1冊読んでも,いざ実践となると手が動かない」「転職のためにどうステップアップしよう……」と悩む方は必読です!

こんな方にオススメ

  • Pythonの基礎学習からステップアップしたい人
  • データサイエンティストを目指す人
  • 業務データを分析したい人

目次

  • 本書の効果的な使い方
  • 本書のゴール「分析コンペティション」
  • インストール不要の実行環境「GoogleColab」

Chapter1 データ分析でよく使う「基礎文法」15問

  • [問1-01] リストを作成する
  • [問1-02] Pythonの条件分岐を学ぶ
  • [問1-03] 条件に合う要素を格納したリストを作成する
  • [問1-04] Pythonのループをマスターする
  • [問1-05] リスト内包表記をマスターする
  • [問1-06] リストを結合する
  • [問1-07] リストから要素を取り出す
  • [問1-08] リストのソートを学ぶ
  • [問1-09] スライスをマスターする
  • [問1-10] タプルの基本操作を学ぶ
  • [問1-11] 辞書を作成する
  • [問1-12] 辞書を結合する
  • [問1-13] 関数を作成する
  • [問1-14] lambda式の基本を学ぶ
  • [問1-15] lambda式を使ってリストをソートする
  • COLUMN プログラミング学習は英語や料理の習得と同じ?

Chapter2 基本の流れをおさえる「分析フロー」10問

  • [問2-01] ファイルからデータを読み込む
  • [問2-02] データフレームの基本情報を確認する
  • [問2-03] データフレームの基本操作を学ぶ
  • [問2-04] データを絞り込む
  • [問2-05] データをソートする
  • [問2-06] 欠損値の扱い方を学ぶ
  • [問2-07] グルーピング(集約)を理解する
  • [問2-08] データを可視化する
  • [問2-09] かんたんな統計分析を実行する
  • [問2-10] データを結合する

Chapter3 分析前の下処理をする「データ加工」20問

  • [問3-01] 特定の列のユニークな値を確認する
  • [問3-02] 列の値を置換する
  • [問3-03] 新しい列を追加する
  • [問3-04] 列の値を標準化する
  • [問3-05] 外れ値を検出して対処する
  • [問3-06] 欠損値を特定の値で埋める
  • [問3-07] データを正規化する
  • [問3-08] 特定の行をインデックスで抽出する
  • [問3-09] 特定の行をラベルで抽出する
  • [問3-10] 特定の行と列を抽出する
  • [問3-11] 特定の列に文字列を追加する
  • [問3-12] 特定の列を新しい値で更新する
  • [問3-13] 条件付きで列の値を更新する
  • [問3-14] 複数の条件で列の値を更新する
  • [問3-15] データフレームを分割する
  • [問3-16] 列の値を別のカラムに分割する
  • [問3-17] 特定の列を数値に変換する
  • [問3-18] カテゴリ変数をLabelEncodingする
  • [問3-19] カテゴリ変数をOne-HotEncodingする
  • [問3-20] 数値データをカテゴリデータに変換する
  • COLUMN データサイエンティストにキャリアアップするには?

Chapter4 “見える形”に表現する「データ可視化」10問

  • [問4-01] ヒストグラムを描画する
  • [問4-02] 棒グラフを描画する
  • [問4-03] 散布図を描画する
  • [問4-04] 箱ひげ図を描画する
  • [問4-05] 円グラフを描画する
  • [問4-06] ヒートマップを描画する
  • [問4-07] ラインプロットを描画する
  • [問4-08] バイオリンプロットを描画する
  • [問4-09] 散布図行列を描画する
  • [問4-10] 複数グラフを描画する

Chapter5 データの傾向をくわしく見る「統計学」10問

  • [問5-01] 特定の列の最大値と最小値を確認する
  • [問5-02] データの要約統計量を確認する
  • [問5-03] 相関係数を計算する
  • [問5-04] 最頻値を求める
  • [問5-05] 確率密度関数を推定し描画する
  • [問5-06] 歪度と尖度を計算する
  • [問5-07] 対数変換をおこなう
  • [問5-08] Box-Cox変換をおこなう
  • [問5-09] Yeo-Johnson変換をおこなう
  • [問5-10] カテゴリデータの独立性を検定する
  • COLUMN コードはどのくらい覚えればいいのか?

Chapter6 学習し未来を予測する「機械学習」20問

  • [問6-01] データセットを説明変数と目的変数に分割する
  • [問6-02] 学習用データと評価用データに分割する
  • [問6-03] 線形回帰モデルを作成する
  • [問6-04] 線形回帰モデルを評価する
  • [問6-05] 交差検証をおこなう
  • [問6-06] 機械学習モデル作成の準備をする(分類問題)
  • [問6-07] ロジスティック回帰モデルを作成して評価する
  • [問6-08] 特徴量を標準化し,ロジスティック回帰モデルを作成する
  • [問6-09] 層化交差検証を実装する
  • [問6-10] forループを活用した層化交差検証を実装する
  • [問6-11] 決定木モデルを作成する
  • [問6-12] ランダムフォレストモデルを作成する
  • [問6-13] すべてのデータを特徴量に使う
  • [問6-14] すべてのデータを使ってLightGBMモデルを作成する
  • [問6-15] 特徴量の重要度を可視化する
  • [問6-16] LightGBMモデルのハイパーパラメータを調整する
  • [問6-17] LightGBMモデルのハイパーパラメータを自動で調整する①
  • [問6-18] LightGBMモデルのハイパーパラメータを自動で調整する②
  • [問6-19] アンサンブル学習をおこなう
  • [問6-20] 正解率88.2%を目指して精度改善する

Chapter7 分類問題のKaggleコンペに挑戦しよう

  • 問題
  • 解答解説 STEP1 ベースライン作成
  • 解答解説 STEP2 特徴量エンジニアリング
  • 解答解説 STEP3 モデルチューニング
  • Chapter7 コード全体

Chapter8 回帰問題のKaggleコンペに挑戦しよう

  • 問題
  • 解答解説 STEP1 ベースライン作成
  • 解答解説 STEP2 特徴量エンジニアリング
  • 解答解説 STEP3 モデルチューニング
  • Chapter8 コード全体

プロフィール

はやたす

データサイエンティスト兼YouTuber。新卒で大手メーカーに機械学習エンジニアとして開発業務に従事し,8ヶ月で独立する。東証33区分で売上No.1企業やスタートアップ企業で分析・開発案件を請け負う。現在はサービス業や情報・通信業など,幅広い業界で分析案件に参画中。Pythonやデータサイエンスの効率的な習得法を伝えるため,Udemy講師,情報系大学の講演,YouTubeチャンネル「はやたす/Pythonチャンネル」の運営をおこなう。