目次
- はじめに
第1章 DS検定とは
- データサイエンティスト検定™リテラシーレベルとは
- データサイエンティスト協会™とデータサイエンティストスキルチェックリストとは
- データサイエンティスト検定™リテラシーレベル試験概要
- 出題範囲① スキルチェックリスト
- 出題範囲② 数学・データサイエンス・AI(リテラシーレベル)モデルカリキュラム
- 本検定と,全てのビジネスパーソンが持つべきデジタル時代の共通リテラシー「Di-Lite」
- DX推進が目指す人材であることを示す「DX推進パスポート」
- 本書の構成
- スキルチェックリスト ver.6の改訂について
第2章 基盤
- スキルチェックリスト ver.6の新規分類「基盤」について
- K1 ビジネスにおける「論理とデータの重要性」を認識し,分析的でデータドリブンな考え方に基づき行動できる
- K2 「目的やゴールの設定がないままデータを分析しても,意味合いが出ない」ことを理解している
- K3 課題や仮説を言語化することの重要性を理解している
- K4 現場に出向いてヒアリングするなど,一次情報に接することの重要性を理解している
- K6 データを取り扱う人間として相応しい倫理を身に着けている(データのねつ造,改ざん,盗用を行わないなど)
- K7 データ,AI,機械学習の意図的な悪用(真偽の識別が困難なレベルの画像・音声作成,フェイク情報の作成,Botによる企業・国家への攻撃など)があり得ることを勘案し,技術に関する基礎的な知識と倫理を身につけている
- K8 データ分析者・利活用者として,データの倫理的な活用上の許容される範囲や,ユーザサイドへの必要な許諾について概ね理解している(直近の個人情報に関する法令:個人情報保護法,EU一般データ保護規則,データポータビリティなど)
- K9 データや事象の重複に気づくことができる
- K12 与えられた分析課題に対し,初動として様々な情報を収集し,大まかな構造を把握することの重要性を理解している
- K14 対象となる事象が通常見受けられる場合において,分析結果の意味合いを正しく言語化できる
- K16 担当する分析プロジェクトにおいて,当該事業の収益モデルと主要な変数を理解している
- K17 大規模言語モデルにおいては,事実と異なる内容がさも正しいかのように生成されることがあること(ハルシネーション),これらが根本的に避けることができないことを踏まえ,利用に際しては出力を鵜呑みにしない等の注意が必要であることを知っている
- K18 ハルシネーションが起きていることに気づくための適切なアクションをとることができる(検索等によるリサーチ結果との比較や,他LLMの出力結果との比較,正確な追加情報を入力データに付与することによる出力結果の変化比較など)
- K20 単なるローデータとしての実数だけを見ても判断出来ない事象が大多数であり,母集団に占める割合などの比率的な指標でなければ数字の比較に意味がないことがわかっている
- K21 ニュース記事などで統計情報に接したときに,数字やグラフの不適切な解釈に気づくことができる
- K24 ビジネス観点で仮説を持ってデータをみることの重要性と,仮に仮説と異なる結果となった場合にも,それが重大な知見である可能性を理解している
- K27 分析結果を元に,起きている事象の背景や意味合い(真実)を見抜くことができる
- K30 データが生み出される経緯・背景を考え,データを鵜呑みにはしないことの重要性を理解している
- K31 データの性質を理解するために,データを可視化し眺めて考えることの重要性を理解している
- K32 マルウェアなどによる深刻なリスクの種類(消失・漏洩・サービスの停止など)を理解している
- K33 生成AIの仕組みを理解し,業務や課題解決に活用できる。生成AIについて基礎的な知識や活用方法を理解している。
- コラム
第3章 価値創造力
- スキルチェックリスト ver.6の新規分類「価値想像力」について
- VC1 主要な技術・社会トレンドを理解し,基本的な因果関係を説明できる
- VC2 単一領域での因果関係の仮説を整理し,説明できる
- VC3 変化の出来事を整理し,概要を説明できる
- VC4 顕在化した課題を整理し,既存の枠組みで説明できる
- VC5 現状の課題構造を整理し,説明できる
- VC6 他分野や他視点を取り入れて新しい切り口を提示できる
- VC7 異なる立場の視点や言葉の意図の違いを理解できる
- VC8 現行の価値や方向性を整理し,説明できる
- VC9 変化要素を整理し,基本的なシナリオを描ける
- VC10 経済的成果を評価できる
- VC11 既存事業の構造を説明できる
- VC12 価値提案を要約して伝えられる
- VC13 PoCを計画できる
- VC14 人とAIの基本的な役割分担を説明できる
- VC15 現状のアーキテクチャを整理し,説明できる
- VC16 目的に応じた指標を設計できる
- VC17 主要リスクを列挙できる
- VC18 既存の規程を自身の業務・タスクに適用できる
- VC19 基本的な評価観点を示せる
- VC20 実験の場を企画できる
- VC21 多様な背景を持つ人々と協働する意義を理解し,関係者を特定できる
- VC22 既存の枠を超えた協働の必要性を理解し,小規模な連携を企画できる
- VC23 既存データ資産を把握し活用範囲を整理・説明できる
- VC24 データの品質課題を特定し,AI活用目的に沿った改善提案ができる
- VC25 契約内のデータの取り扱いにおける基本的な条件を理解・遵守できる
- VC26 検証目的を定義し,小規模なPoCを自ら実装・検証できる
- VC27 基本機能を持つ試作を実装できる
- VC28 業務手順を整理し構造を説明できる
- VC29 主要な運用指標をモニタリングできる
- VC30 再学習の必要性を判断できる
- VC31 モデル評価の基本指標を理解できる
- VC32 AIガバナンスの枠組みを理解・遵守できる
- VC33 ナレッジを記録・共有できる
- VC34 成功要因を整理し,共有できる
- VC35 既存資産を把握し,再利用の可能性を見出せる
- VC36 新旧構造を比較・整理できる
- VC37 知識・技術を伝達できる
- VC38 経済的な成果を定量・定性の両面で評価できる
- VC39 改善点を特定し,次の行動を設計できる
- VC40 得られた知識を記録・共有できる
- VC41 変革の意図を理解し,実行できる
- VC42 制度変更の影響を説明できる
- VC43 変化の阻害要因を察知し,対応できる
- VC44 パイロット導入の成果を整理し再利用できる
- VC45 他組織と成果を共有できる
- VC46 自身の実践における暗黙知を認識し,言語化できる
- VC47 困難に直面しても諦めず,指示された課題を粘り強く完遂できる
- VC48 新たなサービスや技術に対して直感的にわくわくし,その裏にある仕組みや技術に興味を持ち,自らリサーチ・試行できる
- VC49 情報が不十分な状況でも,最も影響の大きい要素を見極めて行動を選べる(「ザックリ感」をもった判断)
- VC50 自らの経験や出来事を整理し,わかりやすく説明できる
- VC51 自らの行動や発言について,社会的に何が「不適切」かを理解しており,基本的な倫理・法・文化の境界を踏まえて行動できる
- コラム
第4章 データサイエンス力
- DS1 ベクトルの内積に関する計算方法を理解し,線形式をベクトルの内積で表現できる
- DS2 行列同士,および行列とベクトルの計算方法を正しく理解し,複数の線形式を行列の積で表現できる
- DS3 逆行列の定義,および逆行列を求めることにより行列表記された連立方程式が解けることを理解している
- DS4 固有ベクトルおよび固有値の意味を理解している
- DS5 テンソルの基本概念(次元数,軸,形状)と深層学習で用いる代表的な操作(転置,リシェイプ,インデックシング,ブロードキャストなど)を理解している
- DS6 微分により計算する導関数が傾きを求めるための式であることを理解し,多変数関数においての微分(偏微分,勾配など)も必要に応じて求めることができる
- DS7 積分と面積の関係を理解し,確率密度関数を定積分することで確率が得られることを説明できる
- DS8 関数の停留点が必ずしも極値にならないことを理解し,局所最適解と大域最適解の違いを説明できる
- DS9 和集合,積集合,差集合,対称差集合,補集合についてベン図を用いて説明できる
- DS10 論理演算と集合演算の対応を理解している(ANDが積集合に対応するなど)
- DS11 順列や組合せの式 nPr, nCr を理解し,適切に使い分けることができる
- DS12 確率に関する基本的な概念の意味を説明できる(確率,条件付き確率,期待値,独立など)
- DS13 平均,中央値,最頻値の算出方法の違いを説明できる
- DS14 分散,標準偏差,四分位,パーセンタイルを理解し,目的に応じて適切に使い分けることができる
- DS15 母(集団)平均と標本平均,不偏分散と標本分散がそれぞれ異なることを説明できる
- DS16 標準正規分布の平均と分散の値を知っている
- DS17 相関関係と因果関係の違いを説明できる
- DS18 名義尺度,順序尺度,間隔尺度,比例尺度の違いを説明できる
- DS19 ピアソンの相関係数の分母と分子を説明できる
- DS20 5つ以上の代表的な確率分布を説明できる
- DS21 二項分布は試行回数が増えていくとどのような分布に近似されるかを知っている
- DS22 変数が量的,質的どちらの場合でも関係の強さを算出できる
- DS23 指数関数とlog関数の関係を理解し,片対数グラフ,両対数グラフ,対数化されていないグラフを適切に使いわけることができる
- DS24 ベイズの定理を説明できる
- DS30 業務課題から検証可能な仮説を抽出できる
- DS33 分析,図表から直接的な意味合いを抽出できる(バラツキ,有意性,分布傾向,特異性,関連性,変曲点,関連度の高低など)
- DS34 当初立てた仮説を否定する結果であっても,それを『ノイズ』として排除せず『新たな知見』として客観的に受容し,正確に報告できる
- DS37 適切なデータ区間設定でヒストグラムを作成し,データのバラつき方を把握できる
- DS38 適切な軸設定でクロス集計表を作成し,属性間のデータの偏りを把握できる
- DS39 量的変数の散布図を描き,2変数の関係性を把握できる
- DS40 条件Xと事象Yの関係性を信頼度,支持度,リフト値を用いて評価できる
- DS50 点推定と区間推定(信頼区間など)の違いを理解し,推定における不確実性を評価する上での区間推定の重要性を説明できる
- DS51 統計的仮説検定において帰無仮説と対立仮説の違いを説明できる
- DS52 検定における判断の誤り(第1種の過誤,第2種の過誤)と,p値,有意水準の意味,およびこれら相互の関係性を説明できる
- DS53 片側検定と両側検定の違いを理解し,適切に使い分けられる
- DS54 検定する対象となるデータの対応の有無を考慮した上で適切な検定手法(t検定, z検定など)を選択し,適用できる
- DS57 ある特定の処置に対して,その他の変数や外部の影響を除いた効果を測定するためには,処置群(実験群)と対照群に分けて比較・分析する必要があることを知っている
- DS58 ある変数が他の変数に与える影響(因果効果)を推定したい場合,その双方に影響を与える共変量(交絡因子)の考慮が重要であると理解している(喫煙の有無と疾病発症の双方に年齢が影響している場合など)
- DS59 分析の対象を定める段階で選択バイアスが生じる可能性があることを理解している(途中離脱者の除外時,欠損データの除外時など)
- DS72 仮説や課題に対して必要なデータを特定できる
- DS75 スコープ,検討範囲・内容が明確に設定されていれば,必要な分析プロセスが理解できる(データ,分析手法,可視化の方法など)
- DS82 単独のグラフに対して,集計ミスや記載ミスなどがないかチェックできる
- DS83 データ項目やデータの量・質について,指示のもと正しく検証し,結果を説明できる
- DS90 どのような知見を得たいのか,目的に即して集計し,データから事実を把握できる
- DS91 データから事実を正しく浮き彫りにするために,集計の切り口や比較対象の設定が重要であることを理解している
- DS92 普段業務で扱っているデータの発生トリガー・タイミング・頻度などを説明でき,また基本統計量や分布の形状を把握している
- DS101 標本誤差およびサンプリングバイアス,およびそれぞれの違いについて説明できる
- DS102 実験計画法の基本的な3原則(局所管理化,反復,無作為化)について説明できる
- DS106 外れ値・異常値・欠損値とは何かを理解し,指示のもと適切に検出と除去・変換などの対応ができる
- DS109 標準化とは何かを理解し,適切に標準化が行える
- DS110 名義尺度の変数をダミー変数に変換できる
- DS113 数値データの特徴量化(二値化/離散化,対数変換,スケーリング/正規化,交互作用特徴量の作成など)を行うことができる
- DS122 可視化における目的の広がりについて概略を説明できる(単に現場の作業支援する場合から,ビッグデータ中の要素間の関連性をダイナミックに表示する場合など)
- DS125 散布図などの軸出しにおいて,目的やデータに応じて縦軸・横軸の候補を適切に洗い出せる
- DS126 積み上げ縦棒グラフでの属性の選択など,目的やデータに応じて適切な層化(比較軸)の候補を出せる
- DS130 サンプリングやアンサンブル平均によって適量にデータ量を減らすことができる
- DS131 読み取りたい特徴を効果的に可視化するために,統計量を使ってデータを加工できる
- DS137 データ解析部門以外の方に,データの意味を可視化して伝える重要性を理解している
- DS138 情報提示の相手や場に応じて適切な情報濃度を判断できる(データインク比の考え方など)
- DS139 不必要な誇張をしないための軸表現の基礎を理解できている(コラムチャートのY軸の基準点は「0」からを原則とし軸を切らないなど)
- DS140 強調表現がもたらす効果と,不適切な強調表現を理解している(計量データに対しては位置やサイズ表現が色表現よりも効果的など)
- DS141 1~3次元の比較において目的(比較,構成,分布,変化など)に応じ,BIツール,スプレッドシートなどを用いて図表化できる
- DS142 端的に図表の変化をアニメーションで可視化できる(人口動態のヒストグラムが経年変化する様子を表現するなど)
- DS143 1~3次元の図表を拡張した多変量の比較を適切に可視化できる(平行座標,散布図行列,テーブルレンズ,ヒートマップなど)
- DS152 外れ値を見出すための適切な表現手法を選択できる
- DS153 データの可視化における基本的な視点を挙げることができる(特異点,相違性,傾向性,関連性を見出すなど)
- DS158 単回帰分析において最小二乗法,回帰係数,標準誤差,決定係数を理解し,モデルを構築できる
- DS159 重回帰分析において偏回帰係数と標準偏回帰係数,重相関係数,自由度調整済み決定係数について説明できる
- DS160 線形回帰分析とロジスティック回帰分析のそれぞれが予測する対象の違いを理解し,適切に使い分けられる
- DS172 ROC曲線,AUC(Area under the curve)を用いてモデルの精度を評価できる
- DS173 混同行列(正誤分布のクロス表),Accuracy,Precision,Recall,F値,特異度を理解し,精度を評価できる
- DS174 RMSE(Root Mean Square Error),MAE(Mean Absolute Error),MAPE(Mean Absolute Percentage Error),決定係数といった評価尺度を理解し,精度を評価できる
- DS181 機械学習の手法を3つ以上知っており,それぞれの概要と解決できる問題(回帰・分類・クラスター分析など)を説明できる
- DS182 「教師あり学習」「教師なし学習」の違いを理解している
- DS183 過学習とは何か,それがもたらす問題について説明できる
- DS184 次元の呪いとは何か,その問題について説明できる
- DS185 教師あり学習におけるアノテーションの必要性を説明できる
- DS186 観測されたデータにバイアスが含まれる場合や,学習した予測モデルが少数派のデータをノイズと認識してしまった場合などに,モデルの出力が差別的な振る舞いをしてしまうリスクを理解している
- DS187 機械学習における大域的(global)な説明(モデル単位の各変数の寄与度など)と局所的(local)な説明(予測するレコード単位の各変数の寄与度など)の違いを理解している
- DS188 ホールドアウト法,交差検証(クロスバリデーション)法の仕組みを理解し,訓練データ,パラメータチューニング用の検証データ,テストデータを作成できる
- DS189 機械学習モデルは,データ構成の変化(データドリフト)により学習完了後から精度が劣化していくため,運用時は精度をモニタリングする必要があることを理解している
- DS190 ニューラルネットワークの基本的な考え方を理解し,入力層,隠れ層,出力層の概要と,活性化関数の重要性を理解している
- DS191 決定木をベースとしたアンサンブル学習(Random Forest,勾配ブースティング[Gradient Boosting Decision Tree:GBDT], その派生形であるXGBoost,LightGBMなど)による分析を,ライブラリを使って実行でき,変数の寄与度を正しく解釈できる
- DS192 連合学習では,データは共有せず,モデルのパラメータを共有して複数のモデルを統合していることを理解している
- DS193 モデルの性能を改善するためには,モデルの改善よりもデータの質と量を向上させる方が効果的な場合があることを理解している
- DS219 深層学習(ディープラーニング)モデルの活用による主なメリットを理解している(特徴量抽出が可能になるなど)
- DS220 CNN,RNN,Transformerなど主要な深層学習アーキテクチャの特徴と用途を説明できる
- DS221 データサイエンスやAIの分野におけるモダリティの意味を説明できる(データがどのような形式や方法で得られるか,など)
- DS234 強化学習の基本概念(マルコフ決定過程(状態,行動,報酬)や方策など)を,特定のタスク(例:ゲーム,ロボット制御)の文脈に当てはめて説明できる
- DS235 教師あり学習と強化学習の違いを,前提,定義,応用先といった観点で説明できる
- DS240 時系列データとは何か,その基礎的な扱いについて説明できる(時系列グラフによる周期性やトレンドの確認,移動平均,回帰や相関計算における注意点など)
- DS241 時系列データの場合は,時間軸で訓練データとテストデータに分割する理由を理解している
- DS242 時系列分析を行う際にもつべき視点を理解している(長期トレンド,季節成分,周期性,ノイズ,定常性など)
- DS249 教師なし学習のグループ化(クラスター分析)と教師あり学習の分類(判別)モデルの違いを説明できる
- DS250 階層クラスタリングと非階層クラスタリングの違い,ソフトクラスタリングとハードクラスタリングの違いを説明できる
- DS251 階層クラスター分析において,デンドログラムの見方を理解し,適切に解釈できる
- DS263 ネットワーク分析におけるグラフの基本概念(有向・無向グラフ,エッジ,ノード等)を理解している。
- DS270 レコメンドアルゴリズムにおけるコンテンツベースフィルタリングと協調フィルタリングの違いを説明できる
- DS288 テキストデータに対する代表的なクリーニング処理(小文字化,数値置換,半角変換,記号除去,ステミングなど)を目的に応じて適切に実施できる
- DS289 形態素解析や係り受け解析のライブラリを適切に使い,基本的な文書構造解析を行うことができる
- DS290 自然言語処理を用いて解けるタスクを理解し,各タスクの入出力を説明できる(GLUEタスクや固有表現抽出,機械翻訳など)
- DS301 画像のデジタル表現の仕組みと代表的な画像フォーマットを知っている
- DS302 画像に対して,目的に応じた適切な色変換や簡単なフィルタ処理などを行うことができる
- DS303 画像データに対する代表的なクリーニング処理(リサイズ,パディング,正規化など)を目的に応じて適切に実施できる
- DS304 画像認識を用いて解けるタスクを理解し,入出力とともに説明できる(識別,物体検出,セグメンテーションなどの基本的タスクや,姿勢推定,自動運転などの応用的タスク)
- DS311 動画のデジタル表現の仕組みと代表的な動画フォーマットを理解しており,動画から画像を抽出する既存方法を使うことができる
- DS317 wavやmp3などの代表的な音声フォーマットの特徴や用途,基本的な変換処理について説明できる(サンプリングレート,符号化,量子化など)
- DS324 大規模言語モデル(LLM)でハルシネーションが起こる理由を学習に使われているデータの観点から説明できる(学習用データが誤りや歪みを含んでいる場合や,入力された問いに対応する学習用データが存在しない場合など)
- コラム
第5章 データエンジリアリング力
- DE1 オープンデータを収集して活用する分析システムの要件を整理できる
- DE8 サーバー1~10台規模のシステム構築,システム運用を手順書を元に実行できる
- DE9 オンプレミス環境もしくはIaaS上のデータベースに格納された分析データのバックアップやアーカイブ作成などの定常運用ができる
- DE20 ノーコード・ローコードツールを組み合わせ,要件に応じたアプリやツールを設計できる
- DE21 コンテナ技術の概要を理解しており,既存のDockerイメージを活用して効率的に分析環境を構築できる
- DE22 分析環境を提供するクラウド上のマネージドサービス(Amazon SageMaker,Azure Machine Learning,Google Cloud Vertex AI,IBM watsonx.ai Studioなど)を利用して,機械学習モデルを開発できる
- DE23 YAMLやJSONなど,プロジェクトで指定される形式を理解し,構成・設定ファイルを適切に記述・管理できる
- DE36 対象プラットフォーム(クラウドサービス,分析ソフトウェア)が提供する機能(SDKやAPIなど)の概要を説明できる
- DE37 Webクローラー・スクレイピングツールを用いてWebサイト上の静的コンテンツを分析用データとして収集できる
- DE41 システムやネットワーク機器に用意された通信機能(HTTPS,SFTPなど)を用い,データを収集先に格納するための機能を実装できる
- DE47 社内のシステムやサービスから必要な情報を取り出し,Excel形式の小規模なデータセットを作成できる
- DE48 既存のサービスやアプリケーションに対して,分析をするためのログ出力の仕様を整理することができる
- DE55 扱うデータが,構造化データ(顧客データ,商品データ,在庫データなど)か非構造化データ(雑多なテキスト,音声,画像,動画など)なのかを判断できる
- DE56 ER図を読んでテーブル間のリレーションシップを理解できる
- DE59 正規化手法(第一正規化~第三正規化)を用いてテーブルを正規化できる
- DE66 DWHアプライアンス(Oracle Exadata Database Machine,IBM Integrated Analytics Systemなど)に接続し,複数テーブルを結合したデータを抽出できる
- DE68 HadoopやSparkの分散技術の基本的な仕組みと構成を理解している
- DE69 NoSQLデータストア(Cassandra,Mongo DB,CouchDB,Amazon DynamoDB,Azure Cosmos DB,Google Cloud Firestoreなど)にAPIを介してアクセスし,新規データを登録できる
- DE73 クラウド上のオブジェクトストレージサービス(Amazon S3,Azure Blob Storage,Google Cloud Storage,IBM Cloud Object Storageなど)に接続しデータを格納できる
- DE80 データマートやDWHなどの集中型データ基盤と,データファブリックやデータメッシュなどの分散型データ基盤の設計思想の違いを理解し,ユースケースや組織構造に応じて適切に選択できる
- DE85 表計算ソフトを用いて,フィルタ・ソート・欠損補完・ランダム抽出・集計・演算や,データ変換(数値データの日時データ化や都道府県名からのジオコード変換など)といった基本的なデータ加工処理ができる
- DE86 正規表現を活用して条件に合致するデータを抽出できる(メールアドレスの書式を満たしているか判定をするなど)
- DE87 表計算ソフトのデータファイルに対して,単一条件による内部結合,外部結合,自己結合ができ,UNION処理ができる
- DE91 変換元データと変換先データの文字コードが異なる場合,変換処理のコードがかける
- DE94 加工・分析処理結果をCSV,XML,JSON,Excelなどの指定フォーマット形式に変換してエクスポートできる
- DE95 加工・分析処理結果を,接続先DBのテーブル仕様に合わせてレコード挿入できる
- DE96 RESTなどのデータ取得用Web APIを用いて,必要なデータを取得できる
- DE103 SFTPサーバー,ファイル共有サーバーなどから必要なデータファイルをダウンロードして,Excelなどの表計算ソフトに取り込み活用できる
- DE104 BIツールからデータベース上のDBテーブルを参照して新規レポートやダッシュボードを作成し,指定のユーザグループに公開できる
- DE105 BIツールの自由検索機能を活用し,必要なデータを抽出して,グラフを作成できる
- DE110 小規模な構造化データ(CSV,RDBなど)を扱うデータ処理(抽出・加工・分析など)を,設計書に基づき,プログラム実装できる
- DE111 プログラム言語や環境によって,変数のデータ型ごとに確保するメモリサイズや自動型変換の仕様が異なることを理解し,プログラムの設計・実装ができる
- DE112 データ処理プログラミングのため分岐や繰り返しを含んだフローチャートを作成できる
- DE113 オブジェクト指向言語の基本概念を理解し,スーパークラス(親クラス)を継承して,スーパークラスのプロパティやメソッドを適切に活用できる
- DE114 ホワイトボックステストとブラックボックステストの違いを理解し,テストケースの作成とテストを実施できる
- DE115 JSON,XMLなど標準的なフォーマットのデータを受け渡すために,APIを使用したプログラムを設計・実装できる
- DE116 外部ライブラリが提供する関数の引数や戻り値の型や仕様を調べて,適切に呼び出すことができる
- DE123 他サービスが提供する分析機能や学習済み予測モデルをWeb API(REST)で呼び出し分析結果を活用することができる
- DE124 目的に応じ音声認識関連のAPIを選択し,適用できる(Speech to Text など)
- DE127 AIを用いたソースコードのレビュー機能・チェック機能を活用してプログラムのバグ修正や性能改善を実現できる
- DE128 入れ子の繰り返し処理(二重ループ)など計算負荷の高いロジックを特定しアルゴリズムの改善策を検討できる
- DE131 Jupyter Notebook(Pythonなど)やRStudio(R)などの対話型の開発環境を用いて,データの分析やレポートの作成ができる
- DE132 クラウド上の統合開発環境(AWS SageMaker Studio Lab,Google Colab,Azure Data Studio,IBM watsonx.ai Studioなど)で提供されるNotebookを用いてPythonやRのコードを開発して実行できる
- DE135 SQLの構文を一通り知っていて,記述・実行できる(DML・DDLの理解,各種JOINの使い分け,集計関数とGROUP BY,CASE文を使用した縦横変換,副問合せやEXISTSの活用など)
- DE139 セキュリティの3要素(機密性,完全性,可用性) について具体的な事例を用いて説明できる
- DE141 OS,ネットワーク,アプリケーション,データなどの各レイヤーに対して,ユーザーごとのアクセスレベルを設定する必要性を理解している
- DE149 暗号化されていないデータは,不正取得された際に容易に不正利用される恐れがあることを理解し,データの機密度合いに応じてソフトウェアを使用した暗号化と復号ができる
- DE150 なりすましや改ざんされた文書でないことを証明するために,電子署名が用いられることを理解している
- DE151 公開鍵暗号化方式において,受信者の公開鍵で暗号化されたデータを復号化するためには受信者の秘密鍵が必要であることを知っている
- DE152 ハッシュ関数を用いて,データの改ざんを検出できる
- DE154 OAuthに対応したデータ提供サービスに対して,認可サーバから取得したアクセストークンを付与してデータ取得用のREST APIを呼び出すことができる
- DE159 AutoMLを用いて予測対象を判定するために最適な入力データの組み合わせと予測モデルを抽出できる
- DE160 Gitなどのバージョン管理ソフトウェアを活用して,開発した分析プログラムのソースをリポジトリに登録しチームメンバーと共有できる
- DE162 MLOpsの概要を理解し,AIモデル性能の維持管理作業の基本的な流れを説明できる
- DE163 AIシステムのモニタリング項目を理解し,AIモデルの劣化状況や予測対象データの不備,AIシステムの異常を検知できる
- DE169 ITシステムの運用におけるAIOpsの概要とメリットを説明できる
- DE173 大規模言語モデルを利用して,データ分析やサービス,システム開発のためのコードを作成,修正,改良できる
- DE174 大規模言語モデル(LLM)を利用して,開発した機能のテストや分析検証用のダミーデータを生成できる
- コラム
第6章 数理・データサイエンス・AI(リテラシーレベル)モデルカリキュラム
- 6-1. 数理・データサイエンス・AI(リテラシーレベル)モデルカリキュラム
- 6-2-1. 社会におけるデータ・AI利活用(導入)で学ぶこと
- 6-2-2. 社会におけるデータ・AI利活用(導入)で学ぶ/スキル知識
- 6-2-3. 社会におけるデータ・AI利活用(導入)の重要キーワード解説
- 6-3-1. データリテラシー(基礎)で学ぶこと
- 6-3-2. データリテラシー(基礎)で学ぶスキル/知識
- 6-3-3. データリテラシー(基礎)の重要キーワード
- 6-4-1. データ・AI利活用における留意事項(心得)で学ぶこと
- 6-4-2. データ・AI利活用における留意事項(心得)で学ぶスキル/知識
- 6-4-3. データ・AI利活用における留意事項(心得)の重要キーワード
- 6-5. 数理・データサイエンス・AI(リテラシーレベル)を詳しく学ぶ
データサイエンティスト検定TMリテラシーレベル模擬試験 問題
データサイエンティスト検定TMリテラシーレベル模擬試験 解答例
- おわりに
- 索引
- 執筆者紹介
- 参考文献