GPT-5.4 Mini
tool support、reasoning、prompt caching、128k context window を重視し、新しい GPT-5 系 route を使いたい場合に向く候補です。
見るべき点: この write-heavy な sample では Gemini より高く、Claude に近い費用になります。GPT-5.4 の capability surface が必要かを確認する必要があります。
Data-led article
3 つとも、flagship pricing へ進む前に候補に入りやすい compact model です。同じ product conversation で比較できますが、費用が出る場所は違います。Gemini は output cost、Azure の GPT-5.4 route は新しい GPT-5 capability、Claude は Anthropic 固有の agent feature が判断軸になります。
At a glance
数値は 2026-05-31 時点で site data に入っている model data に基づきます。下の sample monthly cost には、追加 tool charge、cache write、grounded request、computer-use fee は含めていません。
tool support、reasoning、prompt caching、128k context window を重視し、新しい GPT-5 系 route を使いたい場合に向く候補です。
見るべき点: この write-heavy な sample では Gemini より高く、Claude に近い費用になります。GPT-5.4 の capability surface が必要かを確認する必要があります。
低コストな multimodal app、出力コストを抑えたい用途、Google-native retrieval option を使う構成に向く候補です。
見るべき点: output price は魅力的ですが、context window は GPT-5.4 Mini より小さく、agent workflow では Claude ほど定番の surface ではありません。
prompt caching、computer use、PDF-heavy assistant など、Anthropic workflow をすでに使う team に向く候補です。
見るべき点: write-heavy app では 3 候補の中で費用が大きくなります。その分、Anthropic 固有の feature fit があるかを見ます。
3 モデルを選択済みの compare tool へ進み、必要なら model detail page で個別の source と metadata を確認できます。
Scenario
Sample workload: 月 100,000 requests、1 request あたり input 1,000 tokens、output 400 tokens。
| Model | Input / 1M | Output / 1M | Monthly cost | Read |
|---|---|---|---|---|
| GPT-5.4 Mini Azure AI | $0.75 | $4.50 | $255.00 | この比較では最新の GPT-5 family option。OpenAI-style の tool / reasoning surface が強い候補です。 |
| Gemini 3.1 Flash Lite Google | $0.25 | $1.50 | $85.00 | この比較では output cost が最安。multimodal input と URL context も見ます。 |
| Claude Haiku 4.5 Anthropic | $1.00 | $5.00 | $300.00 | この workload では最も高い候補ですが、Anthropic-native agent surface が判断材料になります。 |
$85.00 で、GPT-5.4 Mini よりも Claude Haiku 4.5 よりも output price が低いため、この sample では先行します。
長い thread や大きな retrieved chunk を 1 call に入れる app では、input price の小さな差より context の余裕が効くことがあります。
Gemini 3.1 Flash Lite がここでは最も低い input rate です。GPT-5.4 Mini は高くなりますが、新しい GPT-5 route とより大きい context window を得ます。
How to choose
GPT-5.4 line、tool calling、prompt caching、web search、image input、reasoning support、128k context window を重視し、pro-tier route まで上げたくない場合。
app が多く書く場合、または raw context size より multimodal input が重要な場合。この 3 候補では最も economical な writer で、audio、video、URL input も広く見られます。
prompt caching、computer use、PDF-heavy agent pattern など、Anthropic の workflow surface が必要な場合。token bill は高くなるため、その fit があるかを見ます。
Sources
最終的な pricing check は provider docs で確認してください。この比較は input / output token price の shared baseline に絞っていますが、caching、tools、grounded request は provider ごとにルールが分かれます。
Azure AI