Coding agent
repo context、長めの prompt、複数 turn の出力をまとめて見積もります。coding agent は context window と output price の両方が効きます。
見るべき点
coding agent は repository context、instructions、multi-step replies の余白が必要です。安さだけでなく、必要な context が入るかも確認してください。
初期シナリオ
このページは 2,000 prompt tokens、5,000 context tokens、1,500 output tokens、3 iterations、月 500 tasks から開始します。
初期シナリオで低コストな coding-agent models
| Model | Context window | Input | Output | Monthly cost |
|---|---|---|---|---|
| Qwen2.5-Coder-7B | 32.8K | $0.0100 / 1M tokens | $0.0300 / 1M tokens | $0.17 |
| llama3.2-11b-vision-instruct | 131.1K | $0.0150 / 1M tokens | $0.0250 / 1M tokens | $0.21 |
| llama3.2-3b-instruct | 131.1K | $0.0150 / 1M tokens | $0.0250 / 1M tokens | $0.21 |
| Llama-3.2-3B-Instruct | 131.1K | $0.0200 / 1M tokens | $0.0200 / 1M tokens | $0.26 |
| paddleocr-vl | 16.4K | $0.0200 / 1M tokens | $0.0200 / 1M tokens | $0.26 |
| Meta-Llama-3.1-8B-Instruct-Turbo | 131.1K | $0.0200 / 1M tokens | $0.0300 / 1M tokens | $0.28 |
| Mistral-Nemo-Instruct-2407 | 131.1K | $0.0200 / 1M tokens | $0.0400 / 1M tokens | $0.30 |
| llama-3.1-8b-instruct | 16.4K | $0.0200 / 1M tokens | $0.0500 / 1M tokens | $0.32 |