[参考]上巻・下巻で登場するデータファイルとデータの規模
上巻・下巻向けに読者の方々に向けた解説を目的として、大規模なものを含め、さまざまなデータファイルを作成し、データ分析・データ可視化の対象としました。その規模の参考までに、概要や規模、上巻・下巻におけるおもな登場箇所を以下の【表】にまとめました。
▼表 上巻・下巻で登場するデータファイルとデータの規模
本書の構成
本書の構成を 以下の【図】 に示します。本書・上巻と合わせて、別に下巻があります。これらは通読を想定した解説も一部ありますが、それぞれ独立して読むことができます。上巻は「基本」、下巻は「応用」に焦点を当てています。
上巻は大まかに3つのパートで構成されています。第一のパートでは、データ可視化に関する導入を行います。1章では、データ可視化の定義、目的、ツールについて概説します。2章では、データ可視化の構成要素、手法、そして留意点について触れます。多少退屈かもしれませんが、本書の土台となる知識を解説する非常に重要なパートです。
第二のパートでは、作業のイメージを伝えるため、さっそくマンガデータを使ったハンズオンを行います。3章では、下準備となるデータの取得、前処理、基礎分析を取り上げます。4章では、これを受けて、本書で扱うデータ可視化手法を一つ一つ適用します。包括的な解説は下巻で行いますので、習うより慣れろの精神で、まずは分析工程を一通り体験してみましょう。
第三のパートでは、データ可視化を実践する上での基本技術を取り扱います。5章では、本書で使用するツールであるPython・Pandas・Plotlyについて概説します。6章では、データの取得・前処理・基礎分析について、アニメ・ゲームデータを例に解説します。とくにアニメデータに関しては、異なるデータソースを組み合わせるケースを取り上げています。7章では、上巻のまとめとしてデータ可視化の主要な概念をおさらいするとともに、続編の下巻で取り扱う内容の一部を紹介します。
下巻についても簡単に紹介します。下巻は、応用を志向した2つのパートで構成されています。第一のパートでは、リファレンスとして利用することを想定し、質的変数の〈量〉、量的変数の〈分布〉、質的変数の〈内訳〉、変数間の〈関係〉を見るための各可視化手法を包括的に解説しています。第二のパートでは、原作作品の映像化などの昨今の時流に合わせて、メディア展開データを用いたハンズオンを行います。大規模なマンガ作品とアニメ作品のデータの対応付けや、必要なデータが得られない場合など、実務におけるデータ分析でも欠かせない発展的な内容を扱い、実践的なデータ可視化スキルと知識を身につけることを目指します。
▼図 本書の構成
kakeami(かけあみ)
都内マーケティング会社で数理モデルの研究に従事する傍ら,ジョージア工科大学大学院で計算機科学を専攻。少年時代はマンガ家に憧れ,現在はデータ分析という形で日本のポップカルチャーに向き合う。難解な概念を身近なデータで解き明かし,学習者が直面する理論と実践の壁を取り払うことを目指す。二児の父。
【GitHub】https://github.com/kakeami
本書について
本書は元々「マンガ・アニメ・ゲームといった豊かな創作物のデータを,自分で可視化できたらどんなに楽しいだろう」という著者の思いから生まれた企画です。この分野のデータ分析には正解がないことも多いため,本書の構成やアプローチは著者の個人的な経験と視点に基づいています。
なお,本書著者は勤務先の規程により本名や所属先を出さず,ペンネーム「Kakeami」で執筆しています。分析内容や見解は著者個人に属し,所属する組織・団体の公式見解ではありません。
本書で扱うデータは,著作権法を遵守した上で参照・分析を行いました。偉大な作品を生み出してくださった創作者・関係者の方々に深く敬意を表しつつ,データを通じて見えてくる新しい視点を読者と共有することを目指し,データ可視化・データ分析の解説を行いました。