上巻について : データを見る力・見せる技術　分析・可視化のための基本×速習ハンズオン［データ可視化技術入門・上巻］

［参考］上巻・下巻で登場するデータファイルとデータの規模

上巻・下巻向けに読者の方々に向けた解説を目的として、大規模なものを含め、さまざまなデータファイルを作成し、データ分析・データ可視化の対象としました。その規模の参考までに、概要や規模、上巻・下巻におけるおもな登場箇所を以下の【表】にまとめました。

本書の構成

本書の構成を以下の【図⁠】⁠ に示します。本書・上巻と合わせて、別に下巻があります。これらは通読を想定した解説も一部ありますが、それぞれ独立して読むことができます。上巻は「基本⁠」⁠、下巻は「応用」に焦点を当てています。

上巻は大まかに3つのパートで構成されています。第一のパートでは、データ可視化に関する導入を行います。1章では、データ可視化の定義、目的、ツールについて概説します。2章では、データ可視化の構成要素、手法、そして留意点について触れます。多少退屈かもしれませんが、本書の土台となる知識を解説する非常に重要なパートです。

第二のパートでは、作業のイメージを伝えるため、さっそくマンガデータを使ったハンズオンを行います。3章では、下準備となるデータの取得、前処理、基礎分析を取り上げます。4章では、これを受けて、本書で扱うデータ可視化手法を一つ一つ適用します。包括的な解説は下巻で行いますので、習うより慣れろの精神で、まずは分析工程を一通り体験してみましょう。

第三のパートでは、データ可視化を実践する上での基本技術を取り扱います。5章では、本書で使用するツールであるPython・Pandas・Plotlyについて概説します。6章では、データの取得・前処理・基礎分析について、アニメ・ゲームデータを例に解説します。とくにアニメデータに関しては、異なるデータソースを組み合わせるケースを取り上げています。7章では、上巻のまとめとしてデータ可視化の主要な概念をおさらいするとともに、続編の下巻で取り扱う内容の一部を紹介します。

＊　＊　＊

下巻についても簡単に紹介します。下巻は、応用を志向した2つのパートで構成されています。第一のパートでは、リファレンスとして利用することを想定し、質的変数の〈量〉、量的変数の〈分布〉、質的変数の〈内訳〉、変数間の〈関係〉を見るための各可視化手法を包括的に解説しています。第二のパートでは、原作作品の映像化などの昨今の時流に合わせて、メディア展開データを用いたハンズオンを行います。大規模なマンガ作品とアニメ作品のデータの対応付けや、必要なデータが得られない場合など、実務におけるデータ分析でも欠かせない発展的な内容を扱い、実践的なデータ可視化スキルと知識を身につけることを目指します。

［参考］上巻・下巻で登場するデータファイルとデータの規模

本書の構成

kakeami（かけあみ）