500 token のチャットボットで安い LLM API モデル

シナリオ

このページで見積もるチャットボット条件

数値は、このサイトの現在の価格データから生成しています。請求額は、キャッシュ、割引、リージョン、利用量ティア、提供元ごとの課金ルールによって変わる場合があります。

1メッセージあたりの入力

500 tokens

短いユーザーメッセージと直近の会話文脈を想定します。

1メッセージあたりの出力

300 tokens

サポート回答やプロダクト内の返答として、短く返す想定です。

1ユーザーあたりのメッセージ数

100

月内に繰り返し使われるサポート用途として見ます。

月間ユーザー数

1,000

合計 100,000 メッセージです。

コスト確認

この条件で低コストな価格付きチャットルート

表は月間 API コスト見積もりの安い順です。本番候補として扱う前に、各モデルページと提供元の料金ページを確認してください。

モデル	コンテキスト	入力 / 100万token	出力 / 100万token	月額コスト
Qwen2.5-Coder-3B-Instruct nscale	N/A	$0.0100 / 1M tokens	$0.0300 / 1M tokens	$1.40
Qwen2.5-Coder-7B-Instruct nscale	N/A	$0.0100 / 1M tokens	$0.0300 / 1M tokens	$1.40
Qwen2.5-Coder-7B nebius	32.8K	$0.0100 / 1M tokens	$0.0300 / 1M tokens	$1.40
llama3.2-11b-vision-instruct lambda_ai	131.1K	$0.0150 / 1M tokens	$0.0250 / 1M tokens	$1.50
llama3.2-3b-instruct lambda_ai	131.1K	$0.0150 / 1M tokens	$0.0250 / 1M tokens	$1.50
Llama-3.2-3B-Instruct deepinfra	131.1K	$0.0200 / 1M tokens	$0.0200 / 1M tokens	$1.60
paddleocr-vl novita	16.4K	$0.0200 / 1M tokens	$0.0200 / 1M tokens	$1.60
Meta-Llama-3.1-8B-Instruct-Turbo deepinfra	131.1K	$0.0200 / 1M tokens	$0.0300 / 1M tokens	$1.90

nscale

Qwen2.5-Coder-3B-Instruct

この条件での推定月額 API コストは $1.40 です。掲載コンテキスト上限は N/A です。

モデル詳細を開く

nscale

Qwen2.5-Coder-7B-Instruct

この条件での推定月額 API コストは $1.40 です。掲載コンテキスト上限は N/A です。

モデル詳細を開く

nebius

Qwen2.5-Coder-7B

この条件での推定月額 API コストは $1.40 です。掲載コンテキスト上限は 32.8K です。

モデル詳細を開く

近い用途ガイドと比較する

チャットボットのコストは、短い文脈と繰り返しのメッセージが中心です。文脈量、文書の長さ、エージェントのターン数が支配的になると、低コストなモデル候補は変わります。

ルートを選ぶ前にワークロードを変えて試す

チャットボットの文脈が長い場合、出力が長い場合、月間セッション数が少ない場合は、計算機でトークン数を変えて見積もり直してください。

チャットボット計算機を開く上位3件を比較

注意点

この比較だけでは判断できないこと

このページは回答品質、レイテンシ、安全性の挙動、ツール呼び出し、多言語対応、レート制限を順位付けしません。低コストなチャットルートの中には、特定用途向け、利用制限付き、または一般的なサポートチャットボットに向かないものがあります。価格候補の絞り込みとして使い、実際のモデルルートを試したうえで、最終的な料金は提供元でも確認してください。

500 token のチャットボットで安い LLM API モデル

このページで見積もるチャットボット条件

この条件で低コストな価格付きチャットルート

Qwen2.5-Coder-3B-Instruct

Qwen2.5-Coder-7B-Instruct

Qwen2.5-Coder-7B

近い用途ガイドと比較する

2,100 token の RAG 回答

10k token 文書の要約

7k 入力のコーディングエージェント

ルートを選ぶ前にワークロードを変えて試す

この比較だけでは判断できないこと