用途別ガイド

先に workload を決めて、モデルを比較する。

各ガイドは具体的な token scenario を使い、checked-in model database から低コスト候補を表示し、compare preset へ進める入口です。

token 数を変えて見たい場合

近い scenario を選んだあと、calculator で input、output、volume、cache assumptions を調整できます。

計算機を開く