書籍概要

Pythonプログラミング&データサイエンスライブラリ活用入門

著者
発売日
更新日

概要

本書は,Pythonによるプログラミングの基本とともに,データサイエンス関連のPythonライブラリの基本的な使い方を1冊で学べる入門書です。書籍の前半では,Pythonの基本文法はもちろん,Pythonならではの表現方法や機能についても解説します。また,さまざまな問題解決に必要となる「プログラミング的思考」「データ構造とアルゴリズム」についても取り上げることで,単に便利なライブラリを使えるようになるだけではなく,問題を解決するための本質的な力を身につけられるようにします。書籍の後半では,ここまで学んできたPythonの知識をもとに,Matplotlib/seaborn/NumPy/NLTK/spaCy/Pandas/scikit-learn/BeautifulSoupの使い方を学んでいきます。

こんな方におすすめ

  • 実戦で使えるPythonの知識を身につけたい人
  • データサイエンス関連ライブラリの基本を身につけたい人

サンプル

samplesamplesamplesamplesample

目次

序章 本書の3つのテーマと構成

  • 0-1 Python流プログラミング
  • 0-2 プログラミング的思考
  • 0-3 データサイエンスライブラリ活用術

第1章 Python文法の基本

  • 1-1 変数と命名規則
  • 1-2 演算子と式
  • 1-3 制御構造
  • 1-4 文字列処理
  • 1-5 リスト処理
  • 1-6 データの入力と出力
  • 1-7 関数とメソッド
  • 1-8 コーディング書式

第2章 Python流プログラミング

  • 2-1 Pythonのデータ型
  • 2-2 タプルとアンパック代入
  • 2-3 辞書
  • 2-4 集合(セット)
  • 2-5 リスト,タプル,辞書,集合の相互関係
  • 2-6 標準ライブラリと外部ライブラリ
  • 2-7 Python特有の表記法
  • 2-8 コールバック関数・高階関数・lambda式
  • 2-9 オブジェクト指向プログラミング

第3章 Pythonの機能を使った各種処理

  • 3-1 ファイル処理
  • 3-2 例外処理[try except文]
  • 3-3 正規表現を用いたマッチング[reライブラリ]
  • 3-4 乱数処理[randomライブラリ]
  • 3-5 高階関数を使ったリスト/辞書の処理

第4章 ColabTurtleを使ったプログラミング的思考

  • 4-1 ColabTurtleの使い方
  • 4-2 ライブラリ(glib.py)の作成
  • 4-3 デザインする
  • 4-4 繰り返し模様
  • 4-5 漢字フォントを作る

第5章 データ構造とアルゴリズム

  • 5-1 データ構造
  • 5-2 アルゴリズム
  • 5-3 再帰的思考
  • 5-4 複雑なデータ型のソート
  • 5-5 CSVファイルのデータから辞書を作る
  • 5-6 正規表現を使ったテキスト解析
  • 5-7 字句解析
  • 5-8 決定木
  • 5-9 木のトラバーサル

第6章 Matplotlibによる可視化

  • 6-1 グラフの作成と描画の概要
  • 6-2 折れ線グラフ
  • 6-3 円グラフ
  • 6-4 棒グラフ
  • 6-5 積み上げ棒グラフ
  • 6-6 重ねて表示
  • 6-7 複数の領域に表示
  • 6-8 レーダーチャート
  • 6-9 箱ひげ図
  • 6-10 3D表示

第7章 seabornによる統計的グラフの作成

  • 7-1 tipsデータセット
  • 7-2 実データでグラフを作る
  • 7-3 グラフをカスタマイズする
  • 7-4 ヒートマップ
  • 7-5 回帰プロットとカーネル密度推定(KDE)

第8章 NumPyによる科学技術計算

  • 8-1 NumPyの概要
  • 8-2 統計データ処理
  • 8-3 行列算と連立方程式の解法
  • 8-4 複素数計算
  • 8-5 データクリーニング
  • 8-6 mpmatライブラリ
  • 8-7 関数グラフの描画
  • 8-8 3次元関数

第9章 NLTKとspaCyを用いた自然言語処理

  • 9-1 品詞タグ付け
  • 9-2 ステミング
  • 9-3 日本語対応[janomeライブラリ]
  • 9-4 構文解析[spaCyライブラリ]
  • 9-5 翻訳

第10章 Pandasによるデータフレームとデータ操作

  • 10-1 Pandasのデータ構造とデータ操作
  • 10-2 ファイル操作
  • 10-3 データクリーニング
  • 10-4 Matplotlibで可視化

第11章 scikit-learnによる機械学習

  • 11-1 標準化と正規化
  • 11-2 単回帰分析
  • 11-3 クラスタリング
  • 11-4 主成分分析(PCA)

第12章 BeautifulSoupを用いたWebスクレイピング

  • 12-1 HTMLの構文解釈
  • 12-2 実際のWebページにアクセスする
  • 12-3 CSSセレクタによる抽出
  • 12-4 結果をファイルに書き出す

サポート

ダウンロード

(2025年7月9日更新)

サンプルファイルダウンロード

本書に掲載した例題,練習問題,および一部のプログラムをダウンロードできます。本書P.339に掲載されたアクセスIDとパスワードを入力してください。ファイルはZIP形式で圧縮されています。

使い方については本書のP.339,およびZIPファイルに含まれている「最初にお読みください.txt」ファイルをお読みください。

Google Colabで本書のサンプルプログラムを利用する際は,新規ノートブックを作成し,「txt」フォルダーにあるサンプルプログラムをコピー&ペーストして順に実行してください。

また,書籍P.341の「本書のその他プログラムを実行する」の手順を実行することで,ノートブックを新たに作り直さなくても,次のプログラムを入力するための欄を追加することができます。ノートブックを最初に1つだけ作成し,必要に応じてプログラムの入力欄を追加するか,もしくは前に入力したコードを上書きして,例題/練習問題の学習を進めることをお勧めします。

サンプルファイル実行時のご注意

Google Colabでは,同時に使用できるセッション数に制限があります。複数のipynbファイルを開くなどしていると,セッション数が多すぎるというメッセージが表示されることがあります。「セッションの管理」で不要なセッションを終了し,再度試してください。

何度も実行を繰り返していると,「バックエンドを割り当てられませんでした」というメッセージが出て接続できなくなることがあります。その場合は,しばらく時間をおいてから再度試してください。

商品一覧