← 記事一覧へ戻る

Data-led article

GPT-5.4 Mini、Gemini 3.1 Flash Lite、Claude Haiku 4.5 の料金比較

3 つとも、flagship pricing へ進む前に候補に入りやすい compact model です。同じ product conversation で比較できますが、費用が出る場所は違います。Gemini は output cost、Azure の GPT-5.4 route は新しい GPT-5 capability、Claude は Anthropic 固有の agent feature が判断軸になります。

Updated May 31, 2026 Compact model comparison Built from site data

At a glance

3 つの current model は、費用の伸び方が違う

数値は 2026-05-31 時点で site data に入っている model data に基づきます。下の sample monthly cost には、追加 tool charge、cache write、grounded request、computer-use fee は含めていません。

Azure AI

GPT-5.4 Mini

モデル詳細

tool support、reasoning、prompt caching、128k context window を重視し、新しい GPT-5 系 route を使いたい場合に向く候補です。

Input
$0.75
Output
$4.50
Context
128,000
Sample monthly
$255.00
VisionFunction callingPrompt cachingReasoningWeb search

見るべき点: この write-heavy な sample では Gemini より高く、Claude に近い費用になります。GPT-5.4 の capability surface が必要かを確認する必要があります。

Google

Gemini 3.1 Flash Lite

モデル詳細

低コストな multimodal app、出力コストを抑えたい用途、Google-native retrieval option を使う構成に向く候補です。

Input
$0.25
Output
$1.50
Context
65,536
Sample monthly
$85.00
VisionAudio inputVideo inputURL context

見るべき点: output price は魅力的ですが、context window は GPT-5.4 Mini より小さく、agent workflow では Claude ほど定番の surface ではありません。

Anthropic

Claude Haiku 4.5

モデル詳細

prompt caching、computer use、PDF-heavy assistant など、Anthropic workflow をすでに使う team に向く候補です。

Input
$1.00
Output
$5.00
Context
64,000
Sample monthly
$300.00
VisionPrompt cachingComputer usePDF input

見るべき点: write-heavy app では 3 候補の中で費用が大きくなります。その分、Anthropic 固有の feature fit があるかを見ます。

live comparison で確認する

3 モデルを選択済みの compare tool へ進み、必要なら model detail page で個別の source と metadata を確認できます。

Scenario

同じ workload ではいくらかかるか

Sample workload: 月 100,000 requests、1 request あたり input 1,000 tokens、output 400 tokens。

Model Input / 1M Output / 1M Monthly cost Read
GPT-5.4 Mini
Azure AI
$0.75 $4.50 $255.00 この比較では最新の GPT-5 family option。OpenAI-style の tool / reasoning surface が強い候補です。
Gemini 3.1 Flash Lite
Google
$0.25 $1.50 $85.00 この比較では output cost が最安。multimodal input と URL context も見ます。
Claude Haiku 4.5
Anthropic
$1.00 $5.00 $300.00 この workload では最も高い候補ですが、Anthropic-native agent surface が判断材料になります。
Cheapest in this scenario
Gemini 3.1 Flash Lite

$85.00 で、GPT-5.4 Mini よりも Claude Haiku 4.5 よりも output price が低いため、この sample では先行します。

Largest context
GPT-5.4 Mini

長い thread や大きな retrieved chunk を 1 call に入れる app では、input price の小さな差より context の余裕が効くことがあります。

Lowest input cost
Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite がここでは最も低い input rate です。GPT-5.4 Mini は高くなりますが、新しい GPT-5 route とより大きい context window を得ます。

How to choose

product の圧力がどこにあるかで選ぶ

GPT-5.4 Mini を選ぶ場合

GPT-5.4 line、tool calling、prompt caching、web search、image input、reasoning support、128k context window を重視し、pro-tier route まで上げたくない場合。

Gemini 3.1 Flash Lite を選ぶ場合

app が多く書く場合、または raw context size より multimodal input が重要な場合。この 3 候補では最も economical な writer で、audio、video、URL input も広く見られます。

Claude Haiku 4.5 を選ぶ場合

prompt caching、computer use、PDF-heavy agent pattern など、Anthropic の workflow surface が必要な場合。token bill は高くなるため、その fit があるかを見ます。

Sources

detail を確認する場所

最終的な pricing check は provider docs で確認してください。この比較は input / output token price の shared baseline に絞っていますが、caching、tools、grounded request は provider ごとにルールが分かれます。