1049 字
5 分钟

大模型价格列表

2026-02-08

汇总了一些国内外大语言模型(LLM)的 API 定价信息。仅供参考。

国内大模型#

更新时间:2026-03-02 (单位统一为元/1M Tokens)

百度 (Baidu)#

数据来源:百度智能云千帆大模型平台

模型名称输入价格 (元/1M Tokens)输出价格 (元/1M Tokens)说明
ERNIE 5.0
(Thinking-Preview/Latest/Exp)
6 (≤32k)
10 (>32k)
24 (≤32k)
40 (>32k)
ERNIE X1.1
(ERNIE-X1.1-Preview)
14搜索增强: 0.004元/次
ERNIE X1 Turbo
(ERNIE-X1-Turbo-32K)
14Batch调用半价
ERNIE 4.5 Turbo
(128K Preview/Latest)
0.83.2输入缓存命中: 0.2
搜索增强: 0.004元/次

阿里云 (Aliyun)#

数据来源:阿里云百炼模型价格 | 上下文缓存说明

模型名称输入价格 (元/1M Tokens)输出价格 (元/1M Tokens)说明
Qwen-Max
(qwen3-max)
2.5 (≤32k)
4 (≤128k)
7 (≤252k)
10 (≤32k)
16 (≤128k)
28 (≤252k)
Batch调用半价
输入缓存命中: 20%(隐式)/10%(显式)
Qwen-Plus
(qwen3.5-plus)
0.8 (≤128k)
2 (≤256k)
4 (≤1M)
4.8 (≤128k)
12 (≤256k)
24 (≤1M)
覆盖旧版 qwen-plus 系列
Qwen-Flash
(qwen3.5-flash)
0.2 (≤128k)
0.8 (≤256k)
1.2 (≤1M)
2 (≤128k)
8 (≤256k)
12 (≤1M)
Batch调用半价

智谱AI (ZhipuAI)#

数据来源:智谱AI开放平台

模型名称输入价格 (元/1M Tokens)输出价格 (元/1M Tokens)说明
GLM-54 (≤32k)
6 (>32k)
18 (≤32k)
22 (>32k)
输入缓存命中: 1 / 1.5
GLM-5-Code6 (≤32k)
8 (>32k)
28 (≤32k)
32 (>32k)
输入缓存命中: 1.5 / 2
GLM-4.72 (≤32k, 短输出)
3 (≤32k, 长输出)
4 (>32k)
8 (≤32k, 短输出)
14 (≤32k, 长输出)
16 (>32k)
短输出: <0.2k
长输出: ≥0.2k
输入缓存命中: 0.4/0.6/0.8
GLM-4.7-FlashX0.53输入缓存命中: 0.1
GLM-4.7-Flash免费免费输入缓存命中: 免费

DeepSeek#

数据来源:DeepSeek API Docs

模型名称输入价格 (元/1M Tokens)输出价格 (元/1M Tokens)说明
DeepSeek-V3.2
(deepseek-chat/deepseek-reasoner)
23输入缓存命中: 0.2

火山引擎 (Volcengine)#

数据来源:火山方舟大模型服务平台

模型名称输入价格 (元/1M Tokens)输出价格 (元/1M Tokens)说明
doubao-seed-2.0-pro3.2 (≤32k)
4.8 (32k-128k]
9.6 (128k-256k]
16 (≤32k)
24 (32k-128k]
48 (128k-256k]
输入缓存命中: 0.64/0.96/1.92
缓存存储: 0.017元/1M/小时
doubao-seed-2.0-lite0.6 (≤32k)
0.9 (32k-128k]
1.8 (128k-256k]
3.6 (≤32k)
5.4 (32k-128k]
10.8 (128k-256k]
输入缓存命中: 0.12/0.18/0.36
缓存存储: 0.017元/1M/小时
doubao-seed-2.0-mini0.2 (≤32k)
0.4 (32k-128k]
0.8 (128k-256k]
2 (≤32k)
4 (32k-128k]
8 (128k-256k]
输入缓存命中: 0.04/0.08/0.16
缓存存储: 0.017元/1M/小时
doubao-seed-2.0-code3.2 (≤32k)
4.8 (32k-128k]
9.6 (128k-256k]
16 (≤32k)
24 (32k-128k]
48 (128k-256k]
输入缓存命中: 0.64/0.96/1.92
缓存存储: 0.017元/1M/小时

MiniMax#

数据来源:MiniMax 开放平台

模型名称输入价格 (元/1M Tokens)输出价格 (元/1M Tokens)说明
MiniMax-M2.52.18.4输入缓存命中: 0.21
缓存写入: 2.625
MiniMax-M2.5-highspeed4.216.8输入缓存命中: 0.21
缓存写入: 2.625

月之暗面 (Moonshot AI)#

数据来源:Moonshot AI 开放平台

模型名称输入价格 (元/1M Tokens)输出价格 (元/1M Tokens)说明
kimi-k2.5421缓存命中: 0.7
kimi-k2
(0905/0711/thinking)
416缓存命中: 1
kimi-k2-turbo
(turbo/thinking-turbo)
858缓存命中: 1
moonshot-v1-8k210
moonshot-v1-32k520
moonshot-v1-128k1030

国外大模型#

更新时间:2026-03-02 (单位统一为美元/1M Tokens)

OpenAI#

数据来源:OpenAI Pricing (Standard)

模型名称输入价格 ($/1M Tokens)输出价格 ($/1M Tokens)说明
gpt-5.3-codex1.7514.00缓存命中: 0.175
gpt-5.21.7514.00缓存命中: 0.175
gpt-5.2-chat-latest1.7514.00缓存命中: 0.175
gpt-5.2-codex1.7514.00缓存命中: 0.175
gpt-5.2-pro21.00168.00
gpt-5.1-chat-latest1.2510.00缓存命中: 0.125
gpt-5.1-codex-max1.2510.00缓存命中: 0.125
gpt-5-chat-latest1.2510.00缓存命中: 0.125
gpt-4o2.5010.00缓存命中: 1.25
gpt-realtime4.0016.00文本 token 价格;缓存命中: 0.40

Anthropic (Claude)#

数据来源:Claude Pricing

模型名称输入价格 ($/1M Tokens)输出价格 ($/1M Tokens)说明
Claude Opus 4.5/4.65.00 (≤200K)
10.00 (>200K)
25.00 (≤200K)
37.50 (>200K)
缓存写入: 6.25/10.00 (5m/1h)
输入缓存命中: 0.50 / 1.00
Claude Sonnet 4.5/4.63.0015.00缓存写入: 3.75/6.00 (5m/1h)
输入缓存命中: 0.30
Claude Haiku 4.51.005.00缓存写入: 1.25/2.00 (5m/1h)
输入缓存命中: 0.10

备注:1M 长上下文(Beta)仅适用于 Claude Opus 4.6、Sonnet 4.5、Sonnet 4。
当输入 token 总量超过 200K 时,按长上下文高档费率计费。
详情参阅 Claude Pricing

Google (Gemini)#

数据来源:Gemini API Pricing

模型名称输入价格 ($/1M Tokens)输出价格 ($/1M Tokens)说明
Gemini 3.1 Pro
(preview)
2.00 (≤200k)
4.00 (>200k)
12.00 (≤200k)
18.00 (>200k)
输入缓存命中: 0.20 / 0.40
缓存存储: 4.50/1M/小时
Gemini 3.1 Flash Image
(preview)
0.25 (文本/图片)1.50 (文本/思考)
60.00 (图片)
面向图像生成的轻量模型
Gemini 3 Flash
(preview)
0.50 (文本/图片/视频)
1.00 (音频)
3.00输入缓存命中: 0.05 (文本/图片/视频) / 0.10 (音频)
缓存存储: 1.00/1M/小时
Gemini 2.5 Pro1.25 (≤200k)
2.50 (>200k)
10.00 (≤200k)
15.00 (>200k)
输入缓存命中: 0.125 / 0.25
缓存存储: 4.50/1M/小时
Gemini 2.5 Flash0.30 (文本/图片/视频)
1.00 (音频)
2.50输入缓存命中: 0.03 (文本/图片/视频) / 0.10 (音频)
缓存存储: 1.00/1M/小时
Gemini 2.5 Flash-Lite0.10 (文本/图片/视频)
0.30 (音频)
0.40输入缓存命中: 0.01 (文本/图片/视频) / 0.03 (音频)
缓存存储: 1.00/1M/小时
大模型价格列表
https://xtower.site/posts/llm-cost/
作者
Xtower
发布于
2026-02-08
许可协议
CC BY-NC-SA 4.0
最后更新于 2026-02-08,距今已过 37 天

部分内容可能已过时

目录