データサイエンスって何?

データサイエンスとは

データサイエンスは、データを収集、蓄積、分析して、社会や企業における意思決定を支援することです。勘や経験に頼らずに、データという客観的に判断可能な情報から意思を決定することで、より間違いの少ない判断ができるようになったり、これまで知らなかった新しい事実を発見したりすることができます。例えば、私たちは「部屋が寒い」「雨が降りそうだ」という課題を感じるときに、温度計や天気予報などの客観的に判断可能な情報があれば、自信をもって具体的なアクションにつなげることができます。

データサイエンスによる課題解決

データサイエンスは、膨大な量のビッグデータを活用し、顧客の行動を分析したり、社会の動きを可視化したりすることで、既存のビジネスの見直しや、社会をより豊かにするための施策を考えることに役立ちます。経験や勘に基づいて行動する場合に比べて、生産性も大幅に向上するかもしれません。データサイエンスはプログラミング、統計学、AIなどの技術を用いた「サイエンス」でありながら、社会や企業の活動の中で大いに役立つため「実学」でもあるとも言えます。

データサイエンスでは、プログラミングを利用してデータを収集、分析、解析して、ビッグデータの中から有益な知見を発見します。分析に用いられるデータは、株価や気温などの数値データだけでなく、画像、音声、動画、テキストなども分析の対象となります。

プログラミングを用いたデータサイエンスは、データ分析の大部分の工程を自動化できるため、超少子高齢化を迎える日本において、生産性を高めて生き生きと働いていくための原動力となるでしょう。単なるビジネスのためのデータサイエンスに終始するのではなく、データサイエンスで明らかになった事実を社会実装し、貧困問題や環境問題などの社会的な課題解決を行うことが期待されています。

データサイエンティストとは

データサイエンティストとは、データを処理、分析して、そこから有用な情報(価値)を引き出すことのできる人材のことです。さまざまな意思決定の局面において、客観的なデータ分析の結果にもとづいて、合理的な判断を行えるように意思決定をサポートすることが求められます。

データサイエンティストは文理融合の職業

膨大なデータを収集し、加工し、分析のための事前処理を行うという作業はとても大変ですので、人手でやろうとするとかなりの時間が必要となります。そこで、これらの作業を人手で行うのではなく、コンピュータに関する知識や、プログラミング能力を駆使して、データ分析の作業を自動化していきます。また、データ分析の際には、統計学やAIに関する理論的な知識も必要となります。このように、データサイエンティストは、コンピュータや数学に関する知識が求められるため「理系の職業」であると思われがちです。

しかし、実際には、人文社会系の科目を学んだ人が得意とするような「文系的な素養」もデータサイエンティストには必要となります。これは、データ分析によってわかることを「社会実装」しなければならないからです。社会実装とは、データサイエンスで得られた結果を、社会に役立つ具体的な価値に変換して応用することです。そのためには、人や社会に関する人文知が必要になるでしょう。また、データサイエンスに関する倫理や法律が必要となる場面もあるかもしれません。そのため、データサイエンティストは、学際的な知識や能力が必要であることから「文理融合の職業」であると言われています。

データサイエンスを学ぶ人たち

AIや統計学の技術発展により、過去10年間でデータサイエンスは大きな発展を遂げました。現在では、多くの企業や大学がデータサイエンスへの積極的な人材投資を続けており、データサイエンティストという職業は、国内外で大変な人気を博しています。例えば、データサイエンスが最も普及しているアメリカでは、大学におけるデータサイエンティストの学位は、⁠統計学(Statistics⁠⁠」や「生物統計学(Biostatistics⁠⁠」という名で授与されています。アメリカでデータサイエンスを専攻し、学部、修士、博士の学位を授与された人数は男女を問わず、近年大幅に増加しています。

日本国内におけるデータサイエンス教育は、諸外国と比較すると若干遅れてはいますが、日本政府が全ての大学生にAIリテラシー教育を実施するという方針を打ち立てたり、大学の文系学部で統計学やAIの講義が必修化されたりするなど、データサイエンスは若手を中心に大きな広まりを見せています。