本書は、マンガ・アニメ・ゲームの大規模なデータセットを使ってデータ可視化を学ぶ本です。
データ可視化とは、複雑なデータを人間が見てわかる表現に変換できる技術です。本書・下巻は、現実に即した複雑かつ膨大なデータを対象とし、実践を見据えたデータ可視化の世界へと踏み込みます。上巻ではデータを「見る力」「見せる技術」と題して、マンガ・アニメ・ゲームのデータを通してデータ分析・データ可視化の基礎を楽しく学ぶことに重点を置きました。この下巻では、そこから一歩進んで、データに対して自ら問いを立てる「問う力」と、分析の過程や結果を自身で捉え他者に届けるための「伝える技術」を磨きます。
本書は、タイトルに沿って「定石」と「即戦力」をテーマにした2つのパートで構成されています。第一のパートでは、みなさんが「こんなふうにデータを見たい」と思ったときに、適切な表現を選べるよう、グラフ化の「定石」を網羅的に解説します。1〜4章にわたって、質的変数の〈量〉、量的変数の〈分布〉、質的変数の〈内訳〉、そして変数間の〈関係〉を見るための手法を一つ一つ学んでいきます。自分の手元にあるデータがどんな性質で、そこから何を読み解きたいのか。目的に応じて最適な「型」を選び取る力が、このパートで養われるはずです。
第二のパートは、探索的データ分析(EDA)・探索的データ可視化のプロセスを体験するハンズオンです。本物のマンガやアニメのデータを対象にすることで、即戦力となるスキルを身につけます。実際のデータ分析の現場では、求めているデータや綺麗なデータが手に入ることは稀です。すなわち、データがない、あるいは複雑な状態のデータにまず直面するのが現実です。5章・6章を通して、データの取得から前処理、そして分析・可視化までの全工程を体験することで、「整ったデータの分析・可視化」では決して見えてこなかった、データの真の姿を体感できるでしょう。
そして、下巻では、最終的に「メディア展開」というテーマに解説を集約していきます。マンガ・アニメ・ゲームを筆頭に、コンテンツが発展・浸透する局面を考えると、メディア展開は、いま、そしてこれから先も、多くの人にとって関心のある重要なテーマの一つと言えるでしょう。さらには、業界を限定せず、複数の領域を横断しながら目の前の現実や予測を描き出す力・技術は、まさにいま注目を集めているスキルです。その一方で、実際に取り組み始めると一筋縄ではいかず、分析のきっかけをつかむことさえ難しい、巨大なテーマです。だからこそ、持てる技術と知識の総力を挙げて、視野を広く持ち、粛々と目の前のデータに問い続ける力・姿勢が求められます。下巻でもGitHubリポジトリに前処理済みのデータを用意しましたので、コンピュータとネットワークがあれば本格的な分析・可視化の世界に飛び込めます。
上巻が「宝探しのワクワク」を知る旅だとしたら、下巻は「地図を自分で描く」ための感性や技術を磨く旅です。マンガ・アニメ・ゲームという親しみやすい題材はそのままに、内容は第一線のプロの現場でも通用するほどのレベルへと引き上げることを目指します。読み終えた後には、どんなに複雑でもどれほど大規模なデータセットでも、指針をもってデータに問いかけ、その答え・可能性を誰かに伝えることができる、そんな変化が待っているはずです。下巻でもいっそう楽しみながら、さらに大きく広がるデータ可視化の世界を体感してみましょう。
kakeami(かけあみ)
都内マーケティング会社で数理モデルの研究に従事する傍ら,ジョージア工科大学大学院で計算機科学を専攻。少年時代はマンガ家に憧れ,現在はデータ分析という形で日本のポップカルチャーに向き合う。難解な概念を身近なデータで解き明かし,学習者が直面する理論と実践の壁を取り払うことを目指す。二児の父。
【GitHub】https://github.com/kakeami
本書について
本書は元々「マンガ・アニメ・ゲームといった豊かな創作物のデータを,自分で可視化できたらどんなに楽しいだろう」という著者の思いから生まれた企画です。この分野のデータ分析には正解がないことも多いため,本書の構成やアプローチは著者の個人的な経験と視点に基づいています。
なお,本書著者は勤務先の規程により本名や所属先を出さず,ペンネーム「Kakeami」で執筆しています。分析内容や見解は著者個人に属し,所属する組織・団体の公式見解ではありません。
本書で扱うデータは,著作権法を遵守した上で参照・分析を行いました。偉大な作品を生み出してくださった創作者・関係者の方々に深く敬意を表しつつ,データを通じて見えてくる新しい視点を読者と共有することを目指し,データ可視化・データ分析の解説を行いました。