长夜月门
1049 字
5 分钟
大模型价格列表
汇总了一些国内外大语言模型(LLM)的 API 定价信息。仅供参考。
国内大模型
更新时间:2026-03-02 (单位统一为元/1M Tokens)
百度 (Baidu)
数据来源:百度智能云千帆大模型平台
| 模型名称 | 输入价格 (元/1M Tokens) | 输出价格 (元/1M Tokens) | 说明 |
|---|---|---|---|
| ERNIE 5.0 (Thinking-Preview/Latest/Exp) | 6 (≤32k) 10 (>32k) | 24 (≤32k) 40 (>32k) | |
| ERNIE X1.1 (ERNIE-X1.1-Preview) | 1 | 4 | 搜索增强: 0.004元/次 |
| ERNIE X1 Turbo (ERNIE-X1-Turbo-32K) | 1 | 4 | Batch调用半价 |
| ERNIE 4.5 Turbo (128K Preview/Latest) | 0.8 | 3.2 | 输入缓存命中: 0.2 搜索增强: 0.004元/次 |
阿里云 (Aliyun)
| 模型名称 | 输入价格 (元/1M Tokens) | 输出价格 (元/1M Tokens) | 说明 |
|---|---|---|---|
| Qwen-Max (qwen3-max) | 2.5 (≤32k) 4 (≤128k) 7 (≤252k) | 10 (≤32k) 16 (≤128k) 28 (≤252k) | Batch调用半价 输入缓存命中: 20%(隐式)/10%(显式) |
| Qwen-Plus (qwen3.5-plus) | 0.8 (≤128k) 2 (≤256k) 4 (≤1M) | 4.8 (≤128k) 12 (≤256k) 24 (≤1M) | 覆盖旧版 qwen-plus 系列 |
| Qwen-Flash (qwen3.5-flash) | 0.2 (≤128k) 0.8 (≤256k) 1.2 (≤1M) | 2 (≤128k) 8 (≤256k) 12 (≤1M) | Batch调用半价 |
智谱AI (ZhipuAI)
数据来源:智谱AI开放平台
| 模型名称 | 输入价格 (元/1M Tokens) | 输出价格 (元/1M Tokens) | 说明 |
|---|---|---|---|
| GLM-5 | 4 (≤32k) 6 (>32k) | 18 (≤32k) 22 (>32k) | 输入缓存命中: 1 / 1.5 |
| GLM-5-Code | 6 (≤32k) 8 (>32k) | 28 (≤32k) 32 (>32k) | 输入缓存命中: 1.5 / 2 |
| GLM-4.7 | 2 (≤32k, 短输出) 3 (≤32k, 长输出) 4 (>32k) | 8 (≤32k, 短输出) 14 (≤32k, 长输出) 16 (>32k) | 短输出: <0.2k 长输出: ≥0.2k 输入缓存命中: 0.4/0.6/0.8 |
| GLM-4.7-FlashX | 0.5 | 3 | 输入缓存命中: 0.1 |
| GLM-4.7-Flash | 免费 | 免费 | 输入缓存命中: 免费 |
DeepSeek
数据来源:DeepSeek API Docs
| 模型名称 | 输入价格 (元/1M Tokens) | 输出价格 (元/1M Tokens) | 说明 |
|---|---|---|---|
| DeepSeek-V3.2 (deepseek-chat/deepseek-reasoner) | 2 | 3 | 输入缓存命中: 0.2 |
火山引擎 (Volcengine)
数据来源:火山方舟大模型服务平台
| 模型名称 | 输入价格 (元/1M Tokens) | 输出价格 (元/1M Tokens) | 说明 |
|---|---|---|---|
| doubao-seed-2.0-pro | 3.2 (≤32k) 4.8 (32k-128k] 9.6 (128k-256k] | 16 (≤32k) 24 (32k-128k] 48 (128k-256k] | 输入缓存命中: 0.64/0.96/1.92 缓存存储: 0.017元/1M/小时 |
| doubao-seed-2.0-lite | 0.6 (≤32k) 0.9 (32k-128k] 1.8 (128k-256k] | 3.6 (≤32k) 5.4 (32k-128k] 10.8 (128k-256k] | 输入缓存命中: 0.12/0.18/0.36 缓存存储: 0.017元/1M/小时 |
| doubao-seed-2.0-mini | 0.2 (≤32k) 0.4 (32k-128k] 0.8 (128k-256k] | 2 (≤32k) 4 (32k-128k] 8 (128k-256k] | 输入缓存命中: 0.04/0.08/0.16 缓存存储: 0.017元/1M/小时 |
| doubao-seed-2.0-code | 3.2 (≤32k) 4.8 (32k-128k] 9.6 (128k-256k] | 16 (≤32k) 24 (32k-128k] 48 (128k-256k] | 输入缓存命中: 0.64/0.96/1.92 缓存存储: 0.017元/1M/小时 |
MiniMax
数据来源:MiniMax 开放平台
| 模型名称 | 输入价格 (元/1M Tokens) | 输出价格 (元/1M Tokens) | 说明 |
|---|---|---|---|
| MiniMax-M2.5 | 2.1 | 8.4 | 输入缓存命中: 0.21 缓存写入: 2.625 |
| MiniMax-M2.5-highspeed | 4.2 | 16.8 | 输入缓存命中: 0.21 缓存写入: 2.625 |
月之暗面 (Moonshot AI)
数据来源:Moonshot AI 开放平台
| 模型名称 | 输入价格 (元/1M Tokens) | 输出价格 (元/1M Tokens) | 说明 |
|---|---|---|---|
| kimi-k2.5 | 4 | 21 | 缓存命中: 0.7 |
| kimi-k2 (0905/0711/thinking) | 4 | 16 | 缓存命中: 1 |
| kimi-k2-turbo (turbo/thinking-turbo) | 8 | 58 | 缓存命中: 1 |
| moonshot-v1-8k | 2 | 10 | |
| moonshot-v1-32k | 5 | 20 | |
| moonshot-v1-128k | 10 | 30 |
国外大模型
更新时间:2026-03-02 (单位统一为美元/1M Tokens)
OpenAI
| 模型名称 | 输入价格 ($/1M Tokens) | 输出价格 ($/1M Tokens) | 说明 |
|---|---|---|---|
| gpt-5.3-codex | 1.75 | 14.00 | 缓存命中: 0.175 |
| gpt-5.2 | 1.75 | 14.00 | 缓存命中: 0.175 |
| gpt-5.2-chat-latest | 1.75 | 14.00 | 缓存命中: 0.175 |
| gpt-5.2-codex | 1.75 | 14.00 | 缓存命中: 0.175 |
| gpt-5.2-pro | 21.00 | 168.00 | |
| gpt-5.1-chat-latest | 1.25 | 10.00 | 缓存命中: 0.125 |
| gpt-5.1-codex-max | 1.25 | 10.00 | 缓存命中: 0.125 |
| gpt-5-chat-latest | 1.25 | 10.00 | 缓存命中: 0.125 |
| gpt-4o | 2.50 | 10.00 | 缓存命中: 1.25 |
| gpt-realtime | 4.00 | 16.00 | 文本 token 价格;缓存命中: 0.40 |
Anthropic (Claude)
数据来源:Claude Pricing
| 模型名称 | 输入价格 ($/1M Tokens) | 输出价格 ($/1M Tokens) | 说明 |
|---|---|---|---|
| Claude Opus 4.5/4.6 | 5.00 (≤200K) 10.00 (>200K) | 25.00 (≤200K) 37.50 (>200K) | 缓存写入: 6.25/10.00 (5m/1h) 输入缓存命中: 0.50 / 1.00 |
| Claude Sonnet 4.5/4.6 | 3.00 | 15.00 | 缓存写入: 3.75/6.00 (5m/1h) 输入缓存命中: 0.30 |
| Claude Haiku 4.5 | 1.00 | 5.00 | 缓存写入: 1.25/2.00 (5m/1h) 输入缓存命中: 0.10 |
备注:1M 长上下文(Beta)仅适用于 Claude Opus 4.6、Sonnet 4.5、Sonnet 4。
当输入 token 总量超过 200K 时,按长上下文高档费率计费。
详情参阅 Claude Pricing。
Google (Gemini)
数据来源:Gemini API Pricing
| 模型名称 | 输入价格 ($/1M Tokens) | 输出价格 ($/1M Tokens) | 说明 |
|---|---|---|---|
| Gemini 3.1 Pro (preview) | 2.00 (≤200k) 4.00 (>200k) | 12.00 (≤200k) 18.00 (>200k) | 输入缓存命中: 0.20 / 0.40 缓存存储: 4.50/1M/小时 |
| Gemini 3.1 Flash Image (preview) | 0.25 (文本/图片) | 1.50 (文本/思考) 60.00 (图片) | 面向图像生成的轻量模型 |
| Gemini 3 Flash (preview) | 0.50 (文本/图片/视频) 1.00 (音频) | 3.00 | 输入缓存命中: 0.05 (文本/图片/视频) / 0.10 (音频) 缓存存储: 1.00/1M/小时 |
| Gemini 2.5 Pro | 1.25 (≤200k) 2.50 (>200k) | 10.00 (≤200k) 15.00 (>200k) | 输入缓存命中: 0.125 / 0.25 缓存存储: 4.50/1M/小时 |
| Gemini 2.5 Flash | 0.30 (文本/图片/视频) 1.00 (音频) | 2.50 | 输入缓存命中: 0.03 (文本/图片/视频) / 0.10 (音频) 缓存存储: 1.00/1M/小时 |
| Gemini 2.5 Flash-Lite | 0.10 (文本/图片/视频) 0.30 (音频) | 0.40 | 输入缓存命中: 0.01 (文本/图片/视频) / 0.03 (音频) 缓存存储: 1.00/1M/小时 |
最后更新于 2026-02-08,距今已过 37 天
部分内容可能已过时