絵と図でわかる
絵と図でわかる
データサイエンス
――難しい数式なしに考え方の基礎が学べる
- 上藤一郎 著
- 定価
- 2,200円(本体2,000円+税10%)
- 発売日
- 2021.5.21 2021.5.17
- 判型
- B5変形
- 頁数
- 192ページ
- ISBN
- 978-4-297-12127-3 978-4-297-12128-0
概要
情報通信技術(ITC)が高度に発展した今日,私たちは,さまざまなデータに囲まれて暮らしています。データがなければ,ありふれた日々の営みですらスムーズには行えません。そんな現代社会で必須の「データ」を扱う科学が,「データサイエンス」です。本書は,データサイエンスの概観がざっくりと把握できるよう,イラストや図をたくさん使って,やさしく解説した「入門の入門書」です。難しい数式は使っていないので,数式が苦手な方にもおすすめです。Excelでデータサイエンスを体験できるダウンロードデータ付き。
こんな方にオススメ
- 数式が苦手だが,データサイエンスを学んでみたい人
- データサイエンスを学ばなければならないが,数式が苦手な人
- データサイエンスについて,ざっくりとわかる入門書を探している人
目次
- はじめに
第1章 データサイエンスとは―データと社会―
- 1-1 データと社会
- 1)私たちの日常生活とデータ
- 2)データ化社会がやってきた
- 1-2 データサイエンスとデータサイエンティスト
- 1)データサイエンスはさまざまな定義が可能な科学
- 2)データ解析の4つの工程
- 3)データサイエンティストの仕事
第2章 データを知る―データ解析の第1工程―
- 2-1 データのタイプを分類する
- 1)調査データと非調査データ
- 2)ビッグデータと非ビッグデータ
- 2-2 データの特徴をつかむ
- 1)変数とデータ
- 2)量的データと質的データ
- 3)個票データと集計データ
- 2-3 データを準備する
- 1)調査によるデータ収集
- 2)Webによるデータ収集
- 2-4 データを整形する
- 1)データを整形するとは
- 2)完全データと不完全データ
- 3)外れ値
- 4)選択バイアス
第3章 データを読む―データ解析の第2工程―
- 3-1 データを集計し可視化する
- 1)データの分布を把握する
- 2)さまざまなグラフ
- 3-2 データの情報を要約する
- 1)データの情報を得る
- 2)1変数のデータの特徴をつかむ
- 3)2変数の関係を見つける
- 4)多次元データの関係を把握する
- 5)結論を一般化するために
第4章 データを分類する―データ解析の第3工程―
- 4-1 似たもの同士を分類する
- 1)クラスター分析の考え方
- 2)クラスター分析で分類する
- 4-2 複数の変数を合成する
- 1)主成分分析の考え方
- 2)主成分分析で分類する
- 4-3 質的データを分類する
- 1)数量化Ⅲ類の考え方
- 2)数量化Ⅲ類で分類する
第5章 データから予測する―データ解析の第4工程―
- 5-1 データに基づいて予測する
- 1)回帰分析の考え方
- 2)回帰分析で予測する
- 5-2 予測のよさを評価する
- 1)重回帰分析の考え方
- 2)よい回帰モデルとは
- 3)さまざまな回帰診断
- 5-3 質的データを予測する
- 1)数量化Ⅰ類
- 2)ロジスティック回帰
第6章 データの倫理を考える―データ化社会への警鐘―
- 6-1 データの倫理とは
- 1)データの倫理とデータ化社会
- 2)情報倫理の4つの原則とデータ倫理の規範例
- 3)分析の倫理
- 6-2 倫理違反の事件簿
- 1)ディオバン事件
- 2)統計不正事件
第7章 データサイエンスとAI―ビッグデータがもたらしたデータ革命―
- 7-1 機械学習の基本
- 1)機械学習・深層学習・AI
- 2)データプレパレーション
- 3)選択アルゴリズム
- 4)パラメータチューニング
- 5)モデル選択
- 7-2 ニューラルネットワークとAI
- 1)AIとデータサイエンスの関係
- 2)ニューラルネットワークとは
- 3)ニューラルネットワークの構成要素
- 付録 データサイエンスを体験する
- データサイエンスの理解を深めるための参考図書
- 索引
プロフィール
上藤一郎
静岡大学人文社会科学部教授。専攻は統計学,科学史(統計学史,確率論史)。データサイエンス関連の著書・訳書に,『データサイエンス入門-Excelで学ぶ統計データの見方・使い方・集め方』オーム社(共著),『調査と分析のための統計-社会・経済のデータサイエンス-』丸善(共著),『数式なしでわかるデータサイエンス-ビッグデータ時代に必要なデータリテラシー』オーム社(訳書),など。