お詫びと訂正(正誤表)
本書の以下の部分に誤りがありました。ここに訂正するとともに、ご迷惑をおかけしたことを深くお詫び申し上げます。
(2026年2月25日最終更新)
P.2
| 誤 |
CUDA コア*4をも言いた学習や推論より |
| 正 |
CUDA コア*4を用いた学習や推論より |
P.44
| 誤 |
レイテンシを用いて異なるシステムを比較する際には、単位に気をつけましょう。 |
| 正 |
スループットを用いて異なるシステムを比較する際には、単位に気をつけましょう。 |
P.44-45
| 誤 |
よりハードウェアに近い階層では、演算とI/Oのそれぞれの観点で、以下のようなレイテンシが評価指標として用いられます。 |
| 正 |
よりハードウェアに近い階層では、演算とI/Oのそれぞれの観点で、以下のようなスループットが評価指標として用いられます。 |
P.47
| 誤 |
例えば、レイテンシとスループットの代表値を求めたい場合には、レイテンシには算術平均を、レイテンシには調和平均を使用すべきです。 |
| 正 |
例えば、レイテンシとスループットの代表値を求めたい場合には、レイテンシには算術平均を、スループットには調和平均を使用すべきです。 |
P.162 数式(4.3)内
P.162
| 誤 |
ここで、TPOP*3(Time Per Output Token)*4は1ステップ |
| 正 |
ここで、TPOT*3(Time Per Output Token)*4は1ステップ |
| 誤 |
システム全体のスループットは Throughput ≈ Batch Size / TPOPと近似できるため、 |
| 正 |
システム全体のスループットは Throughput ≈ Batch Size / TPOT と近似できるため、 |
| 誤 |
なお、このスループットとTPOPの近似は、システムが常にフルバッチで稼働する理想的なオフラインベンチマーク状態を仮定したものであり、厳密なものではないことに注意してください。 |
| 正 |
なお、このスループットとTPOTの近似は、システムが常にフルバッチで稼働する理想的なオフラインベンチマーク状態を仮定したものであり、厳密なものではないことに注意してください。 |
P.340 表7.6の備考
| 誤 |
バッチサイズを倍の64に設定る |
| 正 |
バッチサイズを倍の64に設定する |