最短突破最短突破
データサイエンティスト検定（リテラシーレベル）公式リファレンスブック第4版

著者: ディジタルグロースアカデミア　著
定価: 2,860円（本体2,600円＋税10%）
発売日: 2026.6.9 2026.6.1
判型: A5
頁数: 416ページ
ISBN: 978-4-297-15648-0 978-4-297-15649-7

サポート情報

概要

生成AIの発展とともに、データサイエンティストの役割は、ここ数年で大きく変わりました。

従来求められてきた、「データを分析する力」、「分析を意味のある形で使えるようにするための力」に加えて、「戦略的にデータから価値を生み出す力」が問われるようなってきたのです。

最新のデータサイエンティスト検定では、こうした変化に対応し、出題範囲の改訂が行われました。

本書では、問われる項目をひとつひとつピックアップし、現場の第一線でで活躍する著者が詳しく解説しています。

読み込めば読み込むほど力になる、試験対策のための一冊です。

こんな方にオススメ

データサイエンティスト検定の受験者
データサイエンスに必要なひと通りの知識を押さえたい方

データサイエンティスト検定™リテラシーレベルとは
データサイエンティスト協会™とデータサイエンティストスキルチェックリストとは
データサイエンティスト検定™リテラシーレベル試験概要
出題範囲①　スキルチェックリスト
出題範囲②　数学・データサイエンス・AI（リテラシーレベル）モデルカリキュラム
本検定と、全てのビジネスパーソンが持つべきデジタル時代の共通リテラシー「Di-Lite」
DX推進が目指す人材であることを示す「DX推進パスポート」
本書の構成
スキルチェックリスト ver.6の改訂について

第2章　基盤

スキルチェックリスト ver.6の新規分類「基盤」について
K1　ビジネスにおける「論理とデータの重要性」を認識し、分析的でデータドリブンな考え方に基づき行動できる
K2　「目的やゴールの設定がないままデータを分析しても、意味合いが出ない」ことを理解している
K3　課題や仮説を言語化することの重要性を理解している
K4　現場に出向いてヒアリングするなど、一次情報に接することの重要性を理解している
K6　データを取り扱う人間として相応しい倫理を身に着けている（データのねつ造、改ざん、盗用を行わないなど）
K7　データ、AI、機械学習の意図的な悪用（真偽の識別が困難なレベルの画像・音声作成、フェイク情報の作成、Botによる企業・国家への攻撃など）があり得ることを勘案し、技術に関する基礎的な知識と倫理を身につけている
K8　データ分析者・利活用者として、データの倫理的な活用上の許容される範囲や、ユーザサイドへの必要な許諾について概ね理解している（直近の個人情報に関する法令：個人情報保護法、EU一般データ保護規則、データポータビリティなど）
K9　データや事象の重複に気づくことができる
K12　与えられた分析課題に対し、初動として様々な情報を収集し、大まかな構造を把握することの重要性を理解している
K14　対象となる事象が通常見受けられる場合において、分析結果の意味合いを正しく言語化できる
K16　担当する分析プロジェクトにおいて、当該事業の収益モデルと主要な変数を理解している
K17　大規模言語モデルにおいては、事実と異なる内容がさも正しいかのように生成されることがあること（ハルシネーション）、これらが根本的に避けることができないことを踏まえ、利用に際しては出力を鵜呑みにしない等の注意が必要であることを知っている
K18　ハルシネーションが起きていることに気づくための適切なアクションをとることができる（検索等によるリサーチ結果との比較や、他LLMの出力結果との比較、正確な追加情報を入力データに付与することによる出力結果の変化比較など）
K20　単なるローデータとしての実数だけを見ても判断出来ない事象が大多数であり、母集団に占める割合などの比率的な指標でなければ数字の比較に意味がないことがわかっている
K21　ニュース記事などで統計情報に接したときに、数字やグラフの不適切な解釈に気づくことができる
K24　ビジネス観点で仮説を持ってデータをみることの重要性と、仮に仮説と異なる結果となった場合にも、それが重大な知見である可能性を理解している
K27　分析結果を元に、起きている事象の背景や意味合い（真実）を見抜くことができる
K30　データが生み出される経緯・背景を考え、データを鵜呑みにはしないことの重要性を理解している
K31　データの性質を理解するために、データを可視化し眺めて考えることの重要性を理解している
K32　マルウェアなどによる深刻なリスクの種類（消失・漏洩・サービスの停止など）を理解している
K33　生成AIの仕組みを理解し、業務や課題解決に活用できる。生成AIについて基礎的な知識や活用方法を理解している。
コラム

第3章　価値創造力

スキルチェックリスト ver.6の新規分類「価値想像力」について
VC1 主要な技術・社会トレンドを理解し、基本的な因果関係を説明できる
VC2 単一領域での因果関係の仮説を整理し、説明できる
VC3 変化の出来事を整理し、概要を説明できる
VC4 顕在化した課題を整理し、既存の枠組みで説明できる
VC5 現状の課題構造を整理し、説明できる
VC6 他分野や他視点を取り入れて新しい切り口を提示できる
VC7 異なる立場の視点や言葉の意図の違いを理解できる
VC8 現行の価値や方向性を整理し、説明できる
VC9 変化要素を整理し、基本的なシナリオを描ける
VC10　経済的成果を評価できる
VC11　既存事業の構造を説明できる
VC12　価値提案を要約して伝えられる
VC13　PoCを計画できる
VC14　人とAIの基本的な役割分担を説明できる
VC15　現状のアーキテクチャを整理し、説明できる
VC16　目的に応じた指標を設計できる
VC17　主要リスクを列挙できる
VC18　既存の規程を自身の業務・タスクに適用できる
VC19　基本的な評価観点を示せる
VC20　実験の場を企画できる
VC21　多様な背景を持つ人々と協働する意義を理解し、関係者を特定できる
VC22　既存の枠を超えた協働の必要性を理解し、小規模な連携を企画できる
VC23　既存データ資産を把握し活用範囲を整理・説明できる
VC24　データの品質課題を特定し、AI活用目的に沿った改善提案ができる
VC25　契約内のデータの取り扱いにおける基本的な条件を理解・遵守できる
VC26　検証目的を定義し、小規模なPoCを自ら実装・検証できる
VC27　基本機能を持つ試作を実装できる
VC28　業務手順を整理し構造を説明できる
VC29　主要な運用指標をモニタリングできる
VC30　再学習の必要性を判断できる
VC31　モデル評価の基本指標を理解できる
VC32　AIガバナンスの枠組みを理解・遵守できる
VC33　ナレッジを記録・共有できる
VC34　成功要因を整理し、共有できる
VC35　既存資産を把握し、再利用の可能性を見出せる
VC36　新旧構造を比較・整理できる
VC37　知識・技術を伝達できる
VC38　経済的な成果を定量・定性の両面で評価できる
VC39　改善点を特定し、次の行動を設計できる
VC40　得られた知識を記録・共有できる
VC41　変革の意図を理解し、実行できる
VC42　制度変更の影響を説明できる
VC43　変化の阻害要因を察知し、対応できる
VC44　パイロット導入の成果を整理し再利用できる
VC45　他組織と成果を共有できる
VC46　自身の実践における暗黙知を認識し、言語化できる
VC47　困難に直面しても諦めず、指示された課題を粘り強く完遂できる
VC48　新たなサービスや技術に対して直感的にわくわくし、その裏にある仕組みや技術に興味を持ち、自らリサーチ・試行できる
VC49　情報が不十分な状況でも、最も影響の大きい要素を見極めて行動を選べる（「ザックリ感」をもった判断）
VC50　自らの経験や出来事を整理し、わかりやすく説明できる
VC51　自らの行動や発言について、社会的に何が「不適切」かを理解しており、基本的な倫理・法・文化の境界を踏まえて行動できる
コラム

第4章　データサイエンス力

DS1　ベクトルの内積に関する計算方法を理解し、線形式をベクトルの内積で表現できる
DS2　行列同士、および行列とベクトルの計算方法を正しく理解し、複数の線形式を行列の積で表現できる
DS3　逆行列の定義、および逆行列を求めることにより行列表記された連立方程式が解けることを理解している
DS4　固有ベクトルおよび固有値の意味を理解している
DS5　テンソルの基本概念（次元数、軸、形状）と深層学習で用いる代表的な操作（転置、リシェイプ、インデックシング、ブロードキャストなど）を理解している
DS6　微分により計算する導関数が傾きを求めるための式であることを理解し、多変数関数においての微分（偏微分、勾配など）も必要に応じて求めることができる
DS7　積分と面積の関係を理解し、確率密度関数を定積分することで確率が得られることを説明できる
DS8　関数の停留点が必ずしも極値にならないことを理解し、局所最適解と大域最適解の違いを説明できる
DS9　和集合、積集合、差集合、対称差集合、補集合についてベン図を用いて説明できる
DS10　論理演算と集合演算の対応を理解している（ANDが積集合に対応するなど）
DS11　順列や組合せの式 nPr, nCr を理解し、適切に使い分けることができる
DS12　確率に関する基本的な概念の意味を説明できる（確率、条件付き確率、期待値、独立など）
DS13　平均、中央値、最頻値の算出方法の違いを説明できる
DS14　分散、標準偏差、四分位、パーセンタイルを理解し、目的に応じて適切に使い分けることができる
DS15　母（集団）平均と標本平均、不偏分散と標本分散がそれぞれ異なることを説明できる
DS16　標準正規分布の平均と分散の値を知っている
DS17　相関関係と因果関係の違いを説明できる
DS18　名義尺度、順序尺度、間隔尺度、比例尺度の違いを説明できる
DS19　ピアソンの相関係数の分母と分子を説明できる
DS20　５つ以上の代表的な確率分布を説明できる
DS21　二項分布は試行回数が増えていくとどのような分布に近似されるかを知っている
DS22　変数が量的、質的どちらの場合でも関係の強さを算出できる
DS23　指数関数とlog関数の関係を理解し、片対数グラフ、両対数グラフ、対数化されていないグラフを適切に使いわけることができる
DS24　ベイズの定理を説明できる
DS30　業務課題から検証可能な仮説を抽出できる
DS33　分析、図表から直接的な意味合いを抽出できる（バラツキ、有意性、分布傾向、特異性、関連性、変曲点、関連度の高低など）
DS34　当初立てた仮説を否定する結果であっても、それを『ノイズ』として排除せず『新たな知見』として客観的に受容し、正確に報告できる
DS37　適切なデータ区間設定でヒストグラムを作成し、データのバラつき方を把握できる
DS38　適切な軸設定でクロス集計表を作成し、属性間のデータの偏りを把握できる
DS39　量的変数の散布図を描き、2変数の関係性を把握できる
DS40　条件Xと事象Yの関係性を信頼度、支持度、リフト値を用いて評価できる
DS50　点推定と区間推定（信頼区間など）の違いを理解し、推定における不確実性を評価する上での区間推定の重要性を説明できる
DS51　統計的仮説検定において帰無仮説と対立仮説の違いを説明できる
DS52　検定における判断の誤り（第1種の過誤、第2種の過誤）と、p値、有意水準の意味、およびこれら相互の関係性を説明できる
DS53　片側検定と両側検定の違いを理解し、適切に使い分けられる
DS54　検定する対象となるデータの対応の有無を考慮した上で適切な検定手法（t検定, z検定など）を選択し、適用できる
DS57　ある特定の処置に対して、その他の変数や外部の影響を除いた効果を測定するためには、処置群（実験群）と対照群に分けて比較・分析する必要があることを知っている
DS58　ある変数が他の変数に与える影響（因果効果）を推定したい場合、その双方に影響を与える共変量（交絡因子）の考慮が重要であると理解している（喫煙の有無と疾病発症の双方に年齢が影響している場合など）
DS59　分析の対象を定める段階で選択バイアスが生じる可能性があることを理解している（途中離脱者の除外時、欠損データの除外時など）
DS72　仮説や課題に対して必要なデータを特定できる
DS75　スコープ、検討範囲・内容が明確に設定されていれば、必要な分析プロセスが理解できる（データ、分析手法、可視化の方法など）
DS82　単独のグラフに対して、集計ミスや記載ミスなどがないかチェックできる
DS83　データ項目やデータの量・質について、指示のもと正しく検証し、結果を説明できる
DS90　どのような知見を得たいのか、目的に即して集計し、データから事実を把握できる
DS91　データから事実を正しく浮き彫りにするために、集計の切り口や比較対象の設定が重要であることを理解している
DS92　普段業務で扱っているデータの発生トリガー・タイミング・頻度などを説明でき、また基本統計量や分布の形状を把握している
DS101　標本誤差およびサンプリングバイアス、およびそれぞれの違いについて説明できる
DS102　実験計画法の基本的な3原則（局所管理化、反復、無作為化）について説明できる
DS106　外れ値・異常値・欠損値とは何かを理解し、指示のもと適切に検出と除去・変換などの対応ができる
DS109　標準化とは何かを理解し、適切に標準化が行える
DS110　名義尺度の変数をダミー変数に変換できる
DS113　数値データの特徴量化（二値化／離散化、対数変換、スケーリング／正規化、交互作用特徴量の作成など）を行うことができる
DS122　可視化における目的の広がりについて概略を説明できる（単に現場の作業支援する場合から、ビッグデータ中の要素間の関連性をダイナミックに表示する場合など）
DS125　散布図などの軸出しにおいて、目的やデータに応じて縦軸・横軸の候補を適切に洗い出せる
DS126　積み上げ縦棒グラフでの属性の選択など、目的やデータに応じて適切な層化（比較軸）の候補を出せる
DS130　サンプリングやアンサンブル平均によって適量にデータ量を減らすことができる
DS131　読み取りたい特徴を効果的に可視化するために、統計量を使ってデータを加工できる
DS137　データ解析部門以外の方に、データの意味を可視化して伝える重要性を理解している
DS138　情報提示の相手や場に応じて適切な情報濃度を判断できる（データインク比の考え方など）
DS139　不必要な誇張をしないための軸表現の基礎を理解できている（コラムチャートのY軸の基準点は「0」からを原則とし軸を切らないなど）
DS140　強調表現がもたらす効果と、不適切な強調表現を理解している（計量データに対しては位置やサイズ表現が色表現よりも効果的など）
DS141　1～3次元の比較において目的（比較、構成、分布、変化など）に応じ、BIツール、スプレッドシートなどを用いて図表化できる
DS142　端的に図表の変化をアニメーションで可視化できる（人口動態のヒストグラムが経年変化する様子を表現するなど）
DS143　1～3次元の図表を拡張した多変量の比較を適切に可視化できる（平行座標、散布図行列、テーブルレンズ、ヒートマップなど）
DS152　外れ値を見出すための適切な表現手法を選択できる
DS153　データの可視化における基本的な視点を挙げることができる（特異点、相違性、傾向性、関連性を見出すなど）
DS158　単回帰分析において最小二乗法、回帰係数、標準誤差、決定係数を理解し、モデルを構築できる
DS159　重回帰分析において偏回帰係数と標準偏回帰係数、重相関係数、自由度調整済み決定係数について説明できる
DS160　線形回帰分析とロジスティック回帰分析のそれぞれが予測する対象の違いを理解し、適切に使い分けられる
DS172　ROC曲線、AUC(Area under the curve)を用いてモデルの精度を評価できる
DS173　混同行列（正誤分布のクロス表）、Accuracy、Precision、Recall、F値、特異度を理解し、精度を評価できる
DS174　RMSE（Root Mean Square Error）、MAE（Mean Absolute Error）、MAPE（Mean Absolute Percentage Error）、決定係数といった評価尺度を理解し、精度を評価できる
DS181　機械学習の手法を3つ以上知っており、それぞれの概要と解決できる問題（回帰・分類・クラスター分析など）を説明できる
DS182　「教師あり学習」「教師なし学習」の違いを理解している
DS183　過学習とは何か、それがもたらす問題について説明できる
DS184　次元の呪いとは何か、その問題について説明できる
DS185　教師あり学習におけるアノテーションの必要性を説明できる
DS186　観測されたデータにバイアスが含まれる場合や、学習した予測モデルが少数派のデータをノイズと認識してしまった場合などに、モデルの出力が差別的な振る舞いをしてしまうリスクを理解している
DS187　機械学習における大域的(global)な説明（モデル単位の各変数の寄与度など）と局所的(local)な説明（予測するレコード単位の各変数の寄与度など）の違いを理解している
DS188　ホールドアウト法、交差検証（クロスバリデーション）法の仕組みを理解し、訓練データ、パラメータチューニング用の検証データ、テストデータを作成できる
DS189　機械学習モデルは、データ構成の変化(データドリフト)により学習完了後から精度が劣化していくため、運用時は精度をモニタリングする必要があることを理解している
DS190　ニューラルネットワークの基本的な考え方を理解し、入力層、隠れ層、出力層の概要と、活性化関数の重要性を理解している
DS191　決定木をベースとしたアンサンブル学習（Random Forest、勾配ブースティング[Gradient Boosting Decision Tree：GBDT]、その派生形であるXGBoost、LightGBMなど）による分析を、ライブラリを使って実行でき、変数の寄与度を正しく解釈できる
DS192　連合学習では、データは共有せず、モデルのパラメータを共有して複数のモデルを統合していることを理解している
DS193　モデルの性能を改善するためには、モデルの改善よりもデータの質と量を向上させる方が効果的な場合があることを理解している
DS219　深層学習（ディープラーニング）モデルの活用による主なメリットを理解している（特徴量抽出が可能になるなど）
DS220　CNN、RNN、Transformerなど主要な深層学習アーキテクチャの特徴と用途を説明できる
DS221　データサイエンスやAIの分野におけるモダリティの意味を説明できる（データがどのような形式や方法で得られるか、など）
DS234　強化学習の基本概念（マルコフ決定過程（状態、行動、報酬）や方策など）を、特定のタスク（例：ゲーム、ロボット制御）の文脈に当てはめて説明できる
DS235　教師あり学習と強化学習の違いを、前提、定義、応用先といった観点で説明できる
DS240　時系列データとは何か、その基礎的な扱いについて説明できる（時系列グラフによる周期性やトレンドの確認、移動平均、回帰や相関計算における注意点など）
DS241　時系列データの場合は、時間軸で訓練データとテストデータに分割する理由を理解している
DS242　時系列分析を行う際にもつべき視点を理解している（長期トレンド、季節成分、周期性、ノイズ、定常性など）
DS249　教師なし学習のグループ化（クラスター分析）と教師あり学習の分類（判別）モデルの違いを説明できる
DS250　階層クラスタリングと非階層クラスタリングの違い、ソフトクラスタリングとハードクラスタリングの違いを説明できる
DS251　階層クラスター分析において、デンドログラムの見方を理解し、適切に解釈できる
DS263　ネットワーク分析におけるグラフの基本概念（有向・無向グラフ、エッジ、ノード等）を理解している。
DS270　レコメンドアルゴリズムにおけるコンテンツベースフィルタリングと協調フィルタリングの違いを説明できる
DS288　テキストデータに対する代表的なクリーニング処理（小文字化、数値置換、半角変換、記号除去、ステミングなど）を目的に応じて適切に実施できる
DS289　形態素解析や係り受け解析のライブラリを適切に使い、基本的な文書構造解析を行うことができる
DS290　自然言語処理を用いて解けるタスクを理解し、各タスクの入出力を説明できる（GLUEタスクや固有表現抽出、機械翻訳など）
DS301　画像のデジタル表現の仕組みと代表的な画像フォーマットを知っている
DS302　画像に対して、目的に応じた適切な色変換や簡単なフィルタ処理などを行うことができる
DS303　画像データに対する代表的なクリーニング処理（リサイズ、パディング、正規化など）を目的に応じて適切に実施できる
DS304　画像認識を用いて解けるタスクを理解し、入出力とともに説明できる（識別、物体検出、セグメンテーションなどの基本的タスクや、姿勢推定、自動運転などの応用的タスク）
DS311　動画のデジタル表現の仕組みと代表的な動画フォーマットを理解しており、動画から画像を抽出する既存方法を使うことができる
DS317　wavやmp3などの代表的な音声フォーマットの特徴や用途、基本的な変換処理について説明できる（サンプリングレート、符号化、量子化など）
DS324　大規模言語モデル（LLM）でハルシネーションが起こる理由を学習に使われているデータの観点から説明できる（学習用データが誤りや歪みを含んでいる場合や、入力された問いに対応する学習用データが存在しない場合など）
コラム

第5章　データエンジリアリング力

DE1　オープンデータを収集して活用する分析システムの要件を整理できる
DE8　サーバー1～10台規模のシステム構築、システム運用を手順書を元に実行できる
DE9　オンプレミス環境もしくはIaaS上のデータベースに格納された分析データのバックアップやアーカイブ作成などの定常運用ができる
DE20　ノーコード・ローコードツールを組み合わせ、要件に応じたアプリやツールを設計できる
DE21　コンテナ技術の概要を理解しており、既存のDockerイメージを活用して効率的に分析環境を構築できる
DE22　分析環境を提供するクラウド上のマネージドサービス(Amazon SageMaker、Azure Machine Learning、Google Cloud Vertex AI、IBM watsonx.ai Studioなど)を利用して、機械学習モデルを開発できる
DE23　YAMLやJSONなど、プロジェクトで指定される形式を理解し、構成・設定ファイルを適切に記述・管理できる
DE36　対象プラットフォーム（クラウドサービス、分析ソフトウェア）が提供する機能（SDKやAPIなど）の概要を説明できる
DE37　Webクローラー・スクレイピングツールを用いてWebサイト上の静的コンテンツを分析用データとして収集できる
DE41　システムやネットワーク機器に用意された通信機能（HTTPS、SFTPなど）を用い、データを収集先に格納するための機能を実装できる
DE47　社内のシステムやサービスから必要な情報を取り出し、Excel形式の小規模なデータセットを作成できる
DE48　既存のサービスやアプリケーションに対して、分析をするためのログ出力の仕様を整理することができる
DE55　扱うデータが、構造化データ（顧客データ、商品データ、在庫データなど）か非構造化データ（雑多なテキスト、音声、画像、動画など）なのかを判断できる
DE56　ER図を読んでテーブル間のリレーションシップを理解できる
DE59　正規化手法（第一正規化～第三正規化）を用いてテーブルを正規化できる
DE66　DWHアプライアンス（Oracle Exadata Database Machine、IBM Integrated Analytics Systemなど）に接続し、複数テーブルを結合したデータを抽出できる
DE68　HadoopやSparkの分散技術の基本的な仕組みと構成を理解している
DE69　NoSQLデータストア（Cassandra、Mongo DB、CouchDB、Amazon DynamoDB、Azure Cosmos DB、Google Cloud Firestoreなど）にAPIを介してアクセスし、新規データを登録できる
DE73　クラウド上のオブジェクトストレージサービス（Amazon S3、Azure Blob Storage、Google Cloud Storage、IBM Cloud Object Storageなど）に接続しデータを格納できる
DE80　データマートやDWHなどの集中型データ基盤と、データファブリックやデータメッシュなどの分散型データ基盤の設計思想の違いを理解し、ユースケースや組織構造に応じて適切に選択できる
DE85　表計算ソフトを用いて、フィルタ・ソート・欠損補完・ランダム抽出・集計・演算や、データ変換（数値データの日時データ化や都道府県名からのジオコード変換など）といった基本的なデータ加工処理ができる
DE86　正規表現を活用して条件に合致するデータを抽出できる（メールアドレスの書式を満たしているか判定をするなど）
DE87　表計算ソフトのデータファイルに対して、単一条件による内部結合、外部結合、自己結合ができ、UNION処理ができる
DE91　変換元データと変換先データの文字コードが異なる場合、変換処理のコードがかける
DE94　加工・分析処理結果をCSV、XML、JSON、Excelなどの指定フォーマット形式に変換してエクスポートできる
DE95　加工・分析処理結果を、接続先DBのテーブル仕様に合わせてレコード挿入できる
DE96　RESTなどのデータ取得用Web APIを用いて、必要なデータを取得できる
DE103　SFTPサーバー、ファイル共有サーバーなどから必要なデータファイルをダウンロードして、Excelなどの表計算ソフトに取り込み活用できる
DE104　BIツールからデータベース上のDBテーブルを参照して新規レポートやダッシュボードを作成し、指定のユーザグループに公開できる
DE105　BIツールの自由検索機能を活用し、必要なデータを抽出して、グラフを作成できる
DE110　小規模な構造化データ（CSV、RDBなど）を扱うデータ処理（抽出・加工・分析など）を、設計書に基づき、プログラム実装できる
DE111　プログラム言語や環境によって、変数のデータ型ごとに確保するメモリサイズや自動型変換の仕様が異なることを理解し、プログラムの設計・実装ができる
DE112　データ処理プログラミングのため分岐や繰り返しを含んだフローチャートを作成できる
DE113　オブジェクト指向言語の基本概念を理解し、スーパークラス（親クラス）を継承して、スーパークラスのプロパティやメソッドを適切に活用できる
DE114　ホワイトボックステストとブラックボックステストの違いを理解し、テストケースの作成とテストを実施できる
DE115　JSON、XMLなど標準的なフォーマットのデータを受け渡すために、APIを使用したプログラムを設計・実装できる
DE116　外部ライブラリが提供する関数の引数や戻り値の型や仕様を調べて、適切に呼び出すことができる
DE123　他サービスが提供する分析機能や学習済み予測モデルをWeb API（REST）で呼び出し分析結果を活用することができる
DE124　目的に応じ音声認識関連のAPIを選択し、適用できる（Speech to Text など）
DE127　AIを用いたソースコードのレビュー機能・チェック機能を活用してプログラムのバグ修正や性能改善を実現できる
DE128　入れ子の繰り返し処理（二重ループ）など計算負荷の高いロジックを特定しアルゴリズムの改善策を検討できる
DE131　Jupyter Notebook（Pythonなど）やRStudio（R）などの対話型の開発環境を用いて、データの分析やレポートの作成ができる
DE132　クラウド上の統合開発環境（AWS SageMaker Studio Lab、Google Colab、Azure Data Studio、IBM watsonx.ai Studioなど）で提供されるNotebookを用いてPythonやRのコードを開発して実行できる
DE135　SQLの構文を一通り知っていて、記述・実行できる（DML・DDLの理解、各種JOINの使い分け、集計関数とGROUP BY、CASE文を使用した縦横変換、副問合せやEXISTSの活用など）
DE139　セキュリティの3要素（機密性、完全性、可用性）について具体的な事例を用いて説明できる
DE141　OS、ネットワーク、アプリケーション、データなどの各レイヤーに対して、ユーザーごとのアクセスレベルを設定する必要性を理解している
DE149　暗号化されていないデータは、不正取得された際に容易に不正利用される恐れがあることを理解し、データの機密度合いに応じてソフトウェアを使用した暗号化と復号ができる
DE150　なりすましや改ざんされた文書でないことを証明するために、電子署名が用いられることを理解している
DE151　公開鍵暗号化方式において、受信者の公開鍵で暗号化されたデータを復号化するためには受信者の秘密鍵が必要であることを知っている
DE152　ハッシュ関数を用いて、データの改ざんを検出できる
DE154　OAuthに対応したデータ提供サービスに対して、認可サーバから取得したアクセストークンを付与してデータ取得用のREST APIを呼び出すことができる
DE159　AutoMLを用いて予測対象を判定するために最適な入力データの組み合わせと予測モデルを抽出できる
DE160　Gitなどのバージョン管理ソフトウェアを活用して、開発した分析プログラムのソースをリポジトリに登録しチームメンバーと共有できる
DE162　MLOpsの概要を理解し、AIモデル性能の維持管理作業の基本的な流れを説明できる
DE163　AIシステムのモニタリング項目を理解し、AIモデルの劣化状況や予測対象データの不備、AIシステムの異常を検知できる
DE169　ITシステムの運用におけるAIOpsの概要とメリットを説明できる
DE173　大規模言語モデルを利用して、データ分析やサービス、システム開発のためのコードを作成、修正、改良できる
DE174　大規模言語モデル（LLM）を利用して、開発した機能のテストや分析検証用のダミーデータを生成できる
コラム

第6章　数理・データサイエンス・AI（リテラシーレベル）モデルカリキュラム

6-1.　数理・データサイエンス・AI（リテラシーレベル）モデルカリキュラム
6-2-1.　社会におけるデータ・AI利活用（導入）で学ぶこと
6-2-2.　社会におけるデータ・AI利活用（導入）で学ぶ／スキル知識
6-2-3.　社会におけるデータ・AI利活用（導入）の重要キーワード解説
6-3-1.　データリテラシー（基礎）で学ぶこと
6-3-2.　データリテラシー（基礎）で学ぶスキル／知識
6-3-3.　データリテラシー（基礎）の重要キーワード
6-4-1.　データ・AI利活用における留意事項（心得）で学ぶこと
6-4-2.　データ・AI利活用における留意事項（心得）で学ぶスキル／知識
6-4-3.　データ・AI利活用における留意事項（心得）の重要キーワード
6-5.　数理・データサイエンス・AI（リテラシーレベル）を詳しく学ぶ

データサイエンティスト検定TMリテラシーレベル模擬試験　問題

データサイエンティスト検定TMリテラシーレベル模擬試験　解答例

おわりに
索引
執筆者紹介
参考文献

プロフィール

ディジタルグロースアカデミア

「デジタルを武器に、人と企業が成長し、日本に変革をもたらす」をビジョンに掲げるデジタル人材育成企業。株式会社チェンジとKDDI株式会社の合弁会社として2021年4月に営業を開始。前身の株式会社チェンジでは、2013年より製造業や官公庁・自治体などを中心にデータサイエンス案件の受託や人材育成を運営。

最短突破最短突破
データサイエンティスト検定（リテラシーレベル）公式リファレンスブック第4版

サポート情報

概要

こんな方にオススメ

目次

第1章　DS検定とは

第2章　基盤

第3章　価値創造力

第4章　データサイエンス力

第5章　データエンジリアリング力

第6章　数理・データサイエンス・AI（リテラシーレベル）モデルカリキュラム

データサイエンティスト検定TMリテラシーレベル模擬試験　問題

データサイエンティスト検定TMリテラシーレベル模擬試験　解答例

プロフィール

ディジタルグロースアカデミア

最短突破 最短突破 データサイエンティスト検定（リテラシーレベル）公式リファレンスブック 第4版

サポート情報

概要

こんな方にオススメ

目次

第1章 DS検定とは

第2章 基盤

第3章 価値創造力

第4章 データサイエンス力

第5章 データエンジリアリング力

第6章 数理・データサイエンス・AI（リテラシーレベル）モデルカリキュラム

データサイエンティスト検定TMリテラシーレベル模擬試験 問題

データサイエンティスト検定TMリテラシーレベル模擬試験 解答例

プロフィール

ディジタルグロースアカデミア

最短突破最短突破
データサイエンティスト検定（リテラシーレベル）公式リファレンスブック第4版

第1章　DS検定とは

第2章　基盤

第3章　価値創造力

第4章　データサイエンス力

第5章　データエンジリアリング力

第6章　数理・データサイエンス・AI（リテラシーレベル）モデルカリキュラム

データサイエンティスト検定TMリテラシーレベル模擬試験　問題

データサイエンティスト検定TMリテラシーレベル模擬試験　解答例