10k token 文書要約で安い LLM API モデル

シナリオ

このページで見積もる要約条件

数値は、このサイトの現在の価格データから生成しています。請求額は、キャッシュ、割引、リージョン、利用量ティア、提供元ごとの課金ルールによって変わる場合があります。

文書

10.0K 入力 token

長い文書をモデルに読ませる想定です。

要約

500 出力 token

短い要約として返す出力量です。

月間件数

1.0K 文書

月間のバッチ処理やプロダクト機能として見積もります。

コスト確認

表は月間 API コスト見積もりの安い順です。本番候補として扱う前に、各モデルページと提供元の料金ページを確認してください。

モデル	入力 / 100万token	出力 / 100万token	月額コスト
Qwen2.5-Coder-3B-Instruct nscale	$0.0100 / 1M tokens	$0.0300 / 1M tokens	$0.12
Qwen2.5-Coder-7B-Instruct nscale	$0.0100 / 1M tokens	$0.0300 / 1M tokens	$0.12
Qwen2.5-Coder-7B nebius	$0.0100 / 1M tokens	$0.0300 / 1M tokens	$0.12
llama3.2-11b-vision-instruct lambda_ai	$0.0150 / 1M tokens	$0.0250 / 1M tokens	$0.16
llama3.2-3b-instruct lambda_ai	$0.0150 / 1M tokens	$0.0250 / 1M tokens	$0.16
gpt-oss-20b Darkbloom	$0.0145 / 1M tokens	$0.0700 / 1M tokens	$0.18
Llama-3.2-3B-Instruct deepinfra	$0.0200 / 1M tokens	$0.0200 / 1M tokens	$0.21
paddleocr-vl novita	$0.0200 / 1M tokens	$0.0200 / 1M tokens	$0.21

#1 nscale

この条件での推定月額 API コストは $0.12 です。入力は $0.0100 / 1M tokens / 100万token、出力は $0.0300 / 1M tokens / 100万token です。

#2 nscale

この条件での推定月額 API コストは $0.12 です。入力は $0.0100 / 1M tokens / 100万token、出力は $0.0300 / 1M tokens / 100万token です。

#3 nebius

この条件での推定月額 API コストは $0.12 です。入力は $0.0100 / 1M tokens / 100万token、出力は $0.0300 / 1M tokens / 100万token です。

要約は入力寄りの使い方です。チャットボット、RAG、コーディングエージェントと並べると、token の使い方の違いが見えやすくなります。

2,000 token のメモと 50,000 token の文字起こしでは、最安候補が変わることがあります。要約計算機でトークン数を変えてから、候補ルートを比較してください。

注意点

このページは要約品質、事実性、引用の挙動、レイテンシ、レート制限、プロンプトキャッシュ、割引、リージョン別料金、提供元ごとの追加料金を順位付けしません。コスト優先の候補リストとして使い、自分のドキュメントで試したうえで、最終的な料金は提供元でも確認してください。