概要
Rには多くの分析手法を実行するパッケージが提供されていますが,同じ用途であってもパッケージごとに関数の記法が違ったり,データの入力形式や出力形式が違ったりするため,データの前処理やモデルの評価といった工程におけるコーディングは,意識しなければバラバラになってしまいます。また,これが原因でスムーズな分析パイプラインを作成できず,分析環境で行ったモデリングを本番システムへ移行することを考えると,その保守は困難を極めます。
これらの問題を解消するために開発され,統一的なインターフェースを提供するのがtidymodelsです。データ整形における同様のコーディングの問題を解決するためのパッケージ群で知られるtidyverseのプロジェクトの1つとして注目を浴びています。
データ分析の工程には,データ準備,モデルの作成,モデルの評価,モデルの改善,モデルの運用といった一連の工程があります。本書ではそれぞれの工程をtidymodelsパッケージ群で行う方法について解説します。tidymodelsパッケージ群を利用することで,スムーズなデータ分析パイプラインを効率的に構築できるようになるでしょう。
こんな方におすすめ
- 統計・機械学習モデルの作成を効率化したいデータ分析者
- Rユーザ