用途別ガイド
先に workload を決めて、モデルを比較する。
各ガイドは具体的な token scenario を使い、checked-in model database から低コスト候補を表示し、compare preset へ進める入口です。
短い会話
チャットボット
短い input、短い output、月間 message 数から、support chat や product chat の cost を見積もります。
500 input tokens、300 output tokens、1 user あたり 100 messages、月 1,000 users
context-heavy answers
RAG
retrieved document context を含めた回答で、context window と input cost を先に確認します。
100 question tokens、2,000 retrieved tokens、500 answer tokens、月 10,000 questions
長い入力
要約
report、article、note など、長い document を読む input-heavy な workload の cost を比較します。
10,000 input tokens、500 output tokens、月 1,000 documents
反復する repo 作業
コーディングエージェント
長い prompt、repo context、多めの output、複数 iteration を前提に cost を見ます。
2,000 prompt tokens、5,000 context tokens、1,500 output tokens、3 iterations、月 500 tasks
token 数を変えて見たい場合
近い scenario を選んだあと、calculator で input、output、volume、cache assumptions を調整できます。