国内外模型和云厂商汇总
国内云厂商与大模型厂商全景纪要(2026)
一、国内主要云厂商及其自研模型
| 云厂商 | 自研大模型 | 模型系列 | 定价模式 | 免费额度 |
|---|---|---|---|---|
| 火山引擎 | 豆包 (Doubao) | Doubao-Pro/Lite | 按 Token 计费 | 有免费额度 |
| 阿里云 | 通义千问 (Qwen) | Qwen-Max/Plus/Turbo | 按 Token 计费 | 部分模型免费 |
| 腾讯云 | 混元 (Hunyuan) | Hunyuan-Pro/Standard | 按 Token 计费 | 有免费额度 |
| 百度云 | 文心一言 (ERNIE) | ERNIE-4.0/3.5 | 按 Token 计费 | 有免费额度 |
| 华为云 | 盘古 (Pangu) | Pangu-5.0/NLP/CV | 按量/包年包月 | 试用额度 |
💡 最新定价更新(2026 年):火山引擎、阿里百炼推出包月套餐;百度、腾讯有限时打折活动。详见下方「1.6 最新定价与优惠活动」。
1.1 火山引擎 - 豆包
- 模型系列:豆包-Pro、豆包-Lite、豆包-1.5
- 价格参考:
- 豆包-Lite:输入 ¥0.0003/1K tokens,输出 ¥0.0006/1K tokens
- 豆包-Pro:输入 ¥0.003/1K tokens,输出 ¥0.006/1K tokens
- 特点:字节系生态整合,短视频/推荐场景优化
- 免费政策:新用户赠送额度,部分轻量模型免费调用
1.2 阿里云 - 通义千问
- 模型系列:Qwen-Max、Qwen-Plus、Qwen-Turbo、Qwen-Long
- 价格参考:
- Qwen-Turbo:输入 ¥0.0005/1K tokens,输出 ¥0.001/1K tokens
- Qwen-Plus:输入 ¥0.002/1K tokens,输出 ¥0.006/1K tokens
- Qwen-Max:输入 ¥0.04/1K tokens,输出 ¥0.12/1K tokens
- 特点:开源生态完善,Qwen 系列开源模型全球知名
- 免费政策:Qwen-Turbo 有一定免费额度,开源模型可免费使用
1.3 腾讯云 - 混元
- 模型系列:Hunyuan-Pro、Hunyuan-Standard、Hunyuan-Lite
- 价格参考:
- Hunyuan-Lite:输入 ¥0.0008/1K tokens,输出 ¥0.0008/1K tokens
- Hunyuan-Standard:输入 ¥0.005/1K tokens,输出 ¥0.005/1K tokens
- Hunyuan-Pro:输入 ¥0.05/1K tokens,输出 ¥0.05/1K tokens
- 特点:微信/游戏生态整合,多模态能力强
- 免费政策:新用户赠送 100 万 tokens 额度
1.4 百度云 - 文心一言
- 模型系列:ERNIE-4.0、ERNIE-3.5、ERNIE-Speed
- 价格参考:
- ERNIE-Speed:输入 ¥0.0004/1K tokens,输出 ¥0.0008/1K tokens
- ERNIE-3.5:输入 ¥0.0012/1K tokens,输出 ¥0.0012/1K tokens
- ERNIE-4.0:输入 ¥0.03/1K tokens,输出 ¥0.09/1K tokens
- 特点:搜索场景优化,知识更新快
- 免费政策:标准版有一定免费调用次数
1.5 华为云 - 盘古
- 模型系列:盘古 NLP、盘古 CV、盘古多模态
- 价格参考:
- 按量计费:约 ¥0.005-0.05/1K tokens(视模型而定)
- 包年包月:企业定制方案
- 特点:政企市场深耕,行业大模型(矿山、铁路、电力等)
- 免费政策:试用额度,需申请
1.6 最新定价与优惠活动(2026 年更新)
火山引擎 - 豆包 包月套餐
| 套餐类型 | 价格 | 每月调用次数 | 单次 Token 上限 | 适合场景 |
|---|---|---|---|---|
| Lite 套餐 | ¥40/月 | 18,000 次 | 8K tokens | 轻量应用、个人开发者 |
| Pro 套餐 | ¥200/月 | 90,000 次 | 32K tokens | 企业应用、高频调用 |
说明:包月套餐超出额度后按量计费;套餐内未用完次数不结转至下月。
阿里百炼 - 通义千问 包月套餐
| 套餐类型 | 价格 | 每月调用次数 | 单次 Token 上限 | 适合场景 |
|---|---|---|---|---|
| Lite 套餐 | ¥40/月 | 18,000 次 | 8K tokens | 轻量应用、个人开发者 |
| Pro 套餐 | ¥200/月 | 90,000 次 | 32K tokens | 企业应用、高频调用 |
说明:百炼平台统一计费,支持 Qwen 全系列模型调用。
百度云 - 文心一言 打折活动
| 活动类型 | 折扣力度 | 活动时间 | 适用模型 |
|---|---|---|---|
| 新用户专享 | 首充 5 折 | 长期 | 全模型 |
| 企业套餐 | 包年 7 折 | 长期 | ERNIE-3.5/4.0 |
| 限时促销 | 充值返 30% | 2026 Q1 | 全模型 |
说明:打折活动可与免费额度叠加使用;企业套餐需签订合同。
腾讯云 - 混元 打折活动
| 活动类型 | 折扣力度 | 活动时间 | 适用模型 |
|---|---|---|---|
| 新用户专享 | 首月 1 元 | 长期 | Hunyuan-Lite |
| 预付费套餐 | 充 1000 送 200 | 长期 | 全模型 |
| 限时促销 | 5 折优惠 | 2026 Q1-Q2 | Hunyuan-Standard |
说明:预付费套餐额度永久有效;限时促销需关注官方公告。
各平台套餐对比
| 平台 | 入门套餐 | 专业套餐 | 性价比推荐 |
|---|---|---|---|
| 火山引擎 | ¥40/18K 次 | ¥200/90K 次 | ⭐⭐⭐⭐⭐ Pro 套餐 |
| 阿里百炼 | ¥40/18K 次 | ¥200/90K 次 | ⭐⭐⭐⭐⭐ Pro 套餐 |
| 百度云 | 折扣后约 ¥50/月 | 折扣后约 ¥300/月 | ⭐⭐⭐⭐ 企业套餐 |
| 腾讯云 | 首月¥1 后约 ¥60/月 | 折扣后约 ¥250/月 | ⭐⭐⭐⭐ 预付费 |
| 华为云 | 需定制报价 | 需定制报价 | ⭐⭐⭐ 政企优选 |
选购建议:
- 个人开发者/小项目:火山引擎/阿里百炼 Lite 套餐(¥40/月)性价比最高
- 中型企业应用:火山引擎/阿里百炼 Pro 套餐(¥200/月)或腾讯预付费
- 大型企业/政企:百度/华为企业定制套餐,享受专属折扣和技术支持
二、国内第三方大模型厂商
| 厂商 | 代表模型 | 类型 | 免费政策 | 商业化程度 |
|---|---|---|---|---|
| DeepSeek | DeepSeek-V2/V3 | 开源 + 闭源 | 开源免费,API 收费 | 高 |
| Kimi (月之暗面) | Kimi Chat | 闭源 | 有限免费,会员制 | 高 |
| MiniMax | ABAB 系列 | 闭源 | 有免费额度 | 高 |
| GLM (智谱 AI) | GLM-4/ChatGLM | 开源 + 闭源 | 开源免费,API 收费 | 高 |
| 科大讯飞 | 星火认知 | 闭源 | 有免费额度 | 高 |
| 百川智能 | Baichuan 系列 | 开源 + 闭源 | 开源免费 | 中 |
| 零一万物 | Yi 系列 | 开源 + 闭源 | 开源免费 | 中 |
| 360 | 360 智脑 | 闭源 | 有限免费 | 中 |
2.1 DeepSeek(深度求索)
- 模型:DeepSeek-V2、DeepSeek-V3、DeepSeek-Coder
- 定价:
- DeepSeek-V3:输入 ¥0.0002/1K tokens,输出 ¥0.0008/1K tokens
- DeepSeek-Coder:输入 ¥0.001/1K tokens,输出 ¥0.002/1K tokens
- 特点:代码能力突出,性价比极高
- 开源情况:部分模型开源(HuggingFace 可下载)
2.2 Kimi(月之暗面)
- 模型:Kimi Chat(基于 Moonshot 模型)
- 定价:会员制 + 按量计费
- 免费版:有限调用次数
- 会员:¥20-50/月
- 特点:超长上下文(200K+),文档处理能力强
- 开源情况:闭源
2.3 MiniMax
- 模型:ABAB-6.5、ABAB-7、Speech-01
- 定价:
- ABAB-6.5:输入 ¥0.005/1K tokens,输出 ¥0.005/1K tokens
- 特点:语音合成、虚拟人、游戏 NPC 场景
- 开源情况:闭源
2.4 GLM / 智谱 AI
- 模型:GLM-4、GLM-3-Turbo、ChatGLM3
- 定价:
- GLM-3-Turbo:输入 ¥0.001/1K tokens,输出 ¥0.001/1K tokens
- GLM-4:输入 ¥0.05/1K tokens,输出 ¥0.05/1K tokens
- 特点:清华系背景,学术能力强,开源生态好
- 开源情况:ChatGLM 系列开源
2.5 科大讯飞 - 星火认知
- 模型:星火 4.0、星火 Pro
- 定价:
- 标准版:有免费额度
- Pro 版:按量计费或包月
- 特点:语音交互、教育场景、硬件整合
- 开源情况:闭源
2.6 百川智能
- 模型:Baichuan-7B/13B/53B
- 定价:开源免费,API 服务收费
- 特点:开源模型性能优秀,中文优化
- 开源情况:完全开源
2.7 零一万物 (01.AI)
- 模型:Yi-6B/34B/65B
- 定价:开源免费
- 特点:李开复创办,开源模型全球榜单表现优异
- 开源情况:完全开源
2.8 360 智脑
- 模型:360 智脑 4.0
- 定价:有限免费,企业定制
- 特点:安全场景优化,与 360 产品整合
- 开源情况:闭源
三、云厂商与第三方模型的关系
3.1 合作/托管关系
| 云平台 | 托管的第三方模型 | 合作形式 |
|---|---|---|
| 火山引擎 | MiniMax、智谱 GLM | API 代理/模型市场 |
| 阿里云 | 百川、智谱 AI、MiniMax | 百炼平台模型市场 |
| 腾讯云 | 智谱 AI、MiniMax | 模型即服务 (MaaS) |
| 百度云 | 部分开源模型 | 千帆平台 |
| 华为云 | 智谱 AI、百川 | 盘古 + 生态模型 |
3.2 投资/战略关系
| 云厂商 | 投资的模型公司 | 备注 |
|---|---|---|
| 阿里 | 月之暗面 (Kimi)、MiniMax、智谱 AI | 多轮投资 |
| 腾讯 | 月之暗面、MiniMax、智谱 AI、百川 | 广泛布局 |
| 字节 | MiniMax、月之暗面 | 战略投资 |
| 百度 | - | 主要自研 |
| 华为 | - | 主要自研 + 开源合作 |
3.3 关系图谱
┌─────────────────────────────────────────────────────────────┐
│ 国内大模型生态关系图 │
├─────────────────────────────────────────────────────────────┤
│ │
│ 阿里云 ──投资──→ 月之暗面 (Kimi) │
│ │ 智谱 AI (GLM) │
│ │ MiniMax │
│ │ 百川智能 │
│ └──自研──→ 通义千问 (Qwen) │
│ │
│ 腾讯云 ──投资──→ 月之暗面 (Kimi) │
│ │ 智谱 AI (GLM) │
│ │ MiniMax │
│ │ 百川智能 │
│ └──自研──→ 混元 (Hunyuan) │
│ │
│ 火山引擎 ─投资──→ 月之暗面 (Kimi) │
│ │ MiniMax │
│ └──自研──→ 豆包 (Doubao) │
│ │
│ 百度云 ──自研──→ 文心一言 (ERNIE) │
│ │
│ 华为云 ──自研──→ 盘古 (Pangu) │
│ │
│ 独立厂商:DeepSeek、零一万物、360 智脑、科大讯飞 │
│ │
└─────────────────────────────────────────────────────────────┘
四、免费 vs 商业模型汇总
4.1 完全免费(开源)
| 模型 | 厂商 | 许可协议 | 商用限制 |
|---|---|---|---|
| Qwen-7B/14B/72B | 阿里云 | Apache 2.0 / Qwen License | 部分可商用 |
| ChatGLM3-6B | 智谱 AI | Apache 2.0 | 可商用 |
| Baichuan-7B/13B | 百川智能 | Apache 2.0 | 可商用 |
| Yi-6B/34B | 零一万物 | Apache 2.0 / Yi License | 部分可商用 |
| DeepSeek-Coder | DeepSeek | Apache 2.0 | 可商用 |
4.2 有限免费(免费额度)
| 平台 | 免费政策 | 限制说明 |
|---|---|---|
| 火山引擎豆包 | 新用户赠送额度 | 约 100 万 tokens |
| 阿里云百炼 | Qwen-Turbo 免费 | 每日限额 |
| 腾讯云混元 | 新用户 100 万 tokens | 一次性 |
| 百度文心一言 | 标准版免费调用 | 每日次数限制 |
| 讯飞星火 | 标准版免费 | 每日限额 |
| Kimi | 基础功能免费 | 高级功能会员 |
| 智谱 AI | 新用户赠送额度 | 约 100 万 tokens |
| MiniMax | 新用户赠送额度 | 有限额度 |
4.3 纯商业(API 收费)
| 模型 | 厂商 | 起步价格 |
|---|---|---|
| Qwen-Max | 阿里云 | ¥0.04/1K tokens |
| ERNIE-4.0 | 百度云 | ¥0.03/1K tokens |
| Hunyuan-Pro | 腾讯云 | ¥0.05/1K tokens |
| 豆包-Pro | 火山引擎 | ¥0.003/1K tokens |
| GLM-4 | 智谱 AI | ¥0.05/1K tokens |
| 星火 4.0 | 科大讯飞 | 定制报价 |
| 360 智脑 | 360 | 企业定制 |
五、选型建议
5.1 按场景推荐
| 场景 | 推荐模型 | 理由 |
|---|---|---|
| 代码生成 | DeepSeek-Coder、Qwen-Coder | 代码能力专项优化 |
| 长文档处理 | Kimi、Qwen-Long | 超长上下文支持 |
| 多模态 | 混元、豆包、通义千问 | 图文理解能力强 |
| 语音交互 | 讯飞星火、MiniMax | 语音技术积累深 |
| 企业定制 | 盘古、文心一言 | 行业方案成熟 |
| 性价比 | DeepSeek-V3、Qwen-Turbo | 价格低效果好 |
| 开源部署 | Qwen、ChatGLM、Baichuan、Yi | 开源生态完善 |
5.2 价格对比(每 1K tokens)
| 模型 | 输入价格 | 输出价格 | 性价比 |
|---|---|---|---|
| DeepSeek-V3 | ¥0.0002 | ¥0.0008 | ⭐⭐⭐⭐⭐ |
| Qwen-Turbo | ¥0.0005 | ¥0.001 | ⭐⭐⭐⭐⭐ |
| ERNIE-Speed | ¥0.0004 | ¥0.0008 | ⭐⭐⭐⭐ |
| 豆包-Lite | ¥0.0003 | ¥0.0006 | ⭐⭐⭐⭐ |
| Hunyuan-Lite | ¥0.0008 | ¥0.0008 | ⭐⭐⭐⭐ |
| GLM-3-Turbo | ¥0.001 | ¥0.001 | ⭐⭐⭐ |
| Qwen-Plus | ¥0.002 | ¥0.006 | ⭐⭐⭐ |
| 豆包-Pro | ¥0.003 | ¥0.006 | ⭐⭐⭐ |
| ERNIE-4.0 | ¥0.03 | ¥0.09 | ⭐⭐ |
| Qwen-Max | ¥0.04 | ¥0.12 | ⭐⭐ |
| GLM-4 | ¥0.05 | ¥0.05 | ⭐⭐ |
| Hunyuan-Pro | ¥0.05 | ¥0.05 | ⭐⭐ |
六、总结
6.1 市场格局
- 云厂商自研:阿里、腾讯、百度、华为、字节五大云厂商均有自研大模型,形成"云 + 模型"一体化服务
- 第三方独立厂商:DeepSeek、月之暗面、智谱 AI、MiniMax 等专注模型研发,通过 API 或开源提供服务
- 投资绑定:阿里、腾讯、字节通过投资广泛布局第三方模型公司,形成生态护城河
6.2 趋势观察
- 价格战激烈:2024-2025 年各大厂商持续降价,DeepSeek 引领"价格屠夫"策略
- 开源成主流:Qwen、ChatGLM、Baichuan、Yi 等开源模型推动行业技术普及
- 模型即服务:云平台纷纷推出 MaaS(Model as Service),聚合多家模型
- 垂直场景深化:行业大模型(医疗、法律、金融、教育)成为竞争焦点
6.3 选型要点
- 成本敏感 → DeepSeek、Qwen-Turbo
- 效果优先 → Qwen-Max、ERNIE-4.0、GLM-4
- 私有部署 → Qwen、ChatGLM、Baichuan、Yi(开源)
- 生态整合 → 对应云厂商自研模型
- 特殊场景 → 语音选讯飞,长文档选 Kimi,代码选 DeepSeek
文档生成时间:2026 年 3 月 注:价格信息可能随时变动,请以各平台官网最新报价为准
国外云厂商与大模型厂商全景纪要(2026)
一、美国三大云厂商及其 AI 服务
| 云厂商 | 自研/合作模型 | AI 服务平台 | 定价模式 | 免费额度 |
|---|---|---|---|---|
| AWS (Amazon) | Nova 系列 + 第三方模型 | Bedrock | 按 Token/包月 | 有限免费 |
| Google Cloud | Gemini 系列 | Vertex AI | 按 Token/包月 | 有限免费 |
| Microsoft Azure | GPT 系列 + Copilot | Azure OpenAI | 按 Token | 有限免费 |
二、国外模型四强
| 模型 | 厂商 | 最新版本 | 定价模式 | 免费政策 |
|---|---|---|---|---|
| ChatGPT | OpenAI | GPT-5.4 | 订阅 + 按量 | 有限免费 |
| Claude | Anthropic | Claude 4.6 | 订阅 + 按量 | 有限免费 |
| Gemini | Gemini 3.1 Pro | 订阅 + 按量 | 有限免费 | |
| Grok | xAI | Grok 4.20 | 订阅制 | X Premium 捆绑 |
2.1 ChatGPT (OpenAI)
-
模型系列:GPT-5.4、GPT-5.4-mini、GPT-4o、o3/o4(推理模型)
-
订阅套餐:
套餐 价格 权益 Free $0 GPT-4o 有限调用 Plus $20/月 无限 GPT-5.4,优先访问新功能 Pro $200/月 更高调用限额,o4 模型访问 Team $25/人/月 团队协作功能 Enterprise 定制 企业级安全与合规 -
API 定价(按 Token 计费):
模型 输入价格 输出价格 上下文长度 GPT-5.4 $2.50/1M tokens $15/1M tokens 105 万 tokens GPT-5.4-mini $0.15/1M tokens $0.60/1M tokens 50 万 tokens GPT-4o $2.50/1M tokens $10/1M tokens 12.8 万 tokens o3 $15/1M tokens $60/1M tokens 20 万 tokens o4 $20/1M tokens $80/1M tokens 20 万 tokens -
特点:行业标杆,生态最完善,插件和应用市场丰富
-
免费政策:免费版可使用有限次 GPT-4o
2.2 Claude (Anthropic)
-
模型系列:Claude 4.6 Sonnet、Claude 4.6 Opus、Claude 4.6 Haiku
-
订阅套餐:
套餐 价格 权益 Free $0 有限调用,Claude 4.6 Sonnet Pro $20/月 5 倍调用限额,优先访问 Team $25/人/月 团队协作,管理后台 Enterprise 定制 企业级功能 -
API 定价:
模型 输入价格 输出价格 上下文长度 Claude 4.6 Sonnet $3/1M tokens $15/1M tokens 20 万 tokens Claude 4.6 Opus $5/1M tokens $25/1M tokens 100 万 tokens (beta) Claude 4.6 Haiku $0.25/1M tokens $1.25/1M tokens 20 万 tokens -
特点:安全性强,长上下文(200K+),代码和写作能力优秀
-
免费政策:免费版有每日调用限制
2.3 Gemini (Google)
-
模型系列:Gemini 3.1 Flash、Gemini 3.1 Pro、Gemini 3.1 Ultra
-
订阅套餐(Google One AI Premium):
套餐 价格 存储 权益 Plus $7.99/月 200GB Gemini Advanced,Google 应用整合 Pro $19.99/月 2TB 更高优先级,家庭共享 Ultra $249.99/月 30TB 企业级功能,最高优先级 -
API 定价(Vertex AI):
模型 输入价格 输出价格 上下文长度 Gemini 3.1 Flash $0.075/1M tokens $0.30/1M tokens 100 万 tokens Gemini 3.1 Pro $2/1M tokens $12/1M tokens 100 万 tokens Gemini 3.1 Ultra 定制报价 定制报价 200 万 tokens -
特点:Google 生态整合(Search、Workspace、Android),多模态能力强
-
免费政策:Gemini 基础版免费,Advanced 需订阅
2.4 Grok (xAI)
-
模型系列:Grok 4.20、Grok 4.20V(多模态)
-
订阅套餐:
套餐 价格 权益 X Premium $8/月 Grok 基础访问 X Premium+ $16/月 无限 Grok,无广告 X Enterprise 定制 企业功能 -
特点:实时 X(Twitter) 数据整合,幽默风格,实时信息获取
-
免费政策:需订阅 X Premium 才能使用
三、其他小众模型厂商
| 厂商 | 代表模型 | 类型 | 定价模式 | 特点 |
|---|---|---|---|---|
| Cohere | Command R+ | 闭源 | 按量 + 订阅 | 企业 NLP,多语言 |
| Mistral AI | Mistral Large、Mixtral | 开源 + 闭源 | 按量 + 订阅 | 欧洲之星,高效模型 |
| AI21 Labs | Jurassic-2 | 闭源 | 按量计费 | 以色列,长文本生成 |
| Inflection AI | Pi | 闭源 | 免费 + 订阅 | 个人 AI 助手 |
| Character.ai | Character 模型 | 闭源 | 订阅制 | 角色扮演,虚拟人物 |
| Perplexity | Pro 模型 | 闭源 | 订阅制 | AI 搜索,引用来源 |
| Stability AI | Stable Diffusion 3 | 开源 + 闭源 | 开源免费,API 收费 | 图像生成 |
| Midjourney | MJ v6 | 闭源 | 订阅制 | 图像生成,艺术风格 |
| Runway | Gen-2 | 闭源 | 订阅制 | 视频生成 |
| D-ID | D-ID 模型 | 闭源 | 订阅制 | 数字人,视频合成 |
3.1 Cohere
- 总部:加拿大
- 模型:Command R、Command R+、Embed
- 定价:
- Command R:$0.50/1M tokens(输入),$1.50/1M tokens(输出)
- Command R+:$2.50/1M tokens(输入),$10/1M tokens(输出)
- 特点:企业级 NLP,多语言支持,RAG 优化
3.2 Mistral AI
- 总部:法国
- 模型:Mistral 7B、Mixtral 8x7B、Mistral Large、Codestral
- 定价:
- Mistral Small:€0.20/1M tokens(输入),€0.60/1M tokens(输出)
- Mistral Large:€2/1M tokens(输入),€6/1M tokens(输出)
- 特点:开源模型性能优异,欧洲 AI 代表,代码模型 Codestral
3.3 AI21 Labs
- 总部:以色列
- 模型:Jurassic-2、Jurassic-2 Ultra
- 定价:按量计费,具体价格需咨询
- 特点:长文本生成,文档理解
3.4 Inflection AI - Pi
- 总部:美国
- 模型:Pi(Personal Intelligence)
- 定价:基础免费,高级功能订阅中
- 特点:情感化 AI 助手,对话体验优秀
3.5 Perplexity AI
-
总部:美国
-
模型:Perplexity Pro(基于多模型)
-
订阅套餐:
套餐 价格 权益 Free $0 基础搜索,有限查询 Pro $20/月 无限搜索,文件上传,API 访问 Team $25/人/月 团队协作 -
特点:AI 搜索引擎,实时信息,引用来源
3.6 Stability AI
- 总部:英国
- 模型:Stable Diffusion 3、Stable Video、Stable Audio
- 定价:
- 开源模型:免费(本地部署)
- API:$0.0035/生成(SD 3)
- 特点:开源图像生成领导者
3.7 Midjourney
-
总部:美国
-
模型:Midjourney v6、Niji(动漫风格)
-
订阅套餐:
套餐 价格 生成限额 Basic $10/月 200 张 Standard $30/月 15 小时/月(约 900 张) Pro $60/月 30 小时/月(约 1800 张) Mega $120/月 60 小时/月(约 3600 张) -
特点:艺术风格图像生成,Discord 社区
3.8 Runway
-
总部:美国
-
模型:Gen-2、Gen-3 Alpha
-
订阅套餐:
套餐 价格 权益 Free $0 有限生成 Standard $15/人/月 125 积分/月 Pro $35/人/月 625 积分/月 Unlimited $95/人/月 无限生成 -
特点:视频生成,创意工具套件
四、云厂商 AI 服务详解
4.1 AWS (Amazon Web Services)
AI 服务平台:Amazon Bedrock
-
提供模型:
- 自研:Nova 系列
- 第三方:Claude (Anthropic)、Llama (Meta)、Cohere、AI21、Mistral
-
定价模式:
套餐类型 价格 权益 按需付费 按 Token 计费 无承诺,灵活使用 普通套餐 $3/月 基础模型访问 专业套餐 $20/月 高级模型,更高限额 企业套餐 定制报价 专属支持,SLA 保障 -
API 定价示例:
模型 输入价格 输出价格 Claude 3.5 Sonnet $3/1M tokens $15/1M tokens Llama 3 70B $0.72/1M tokens $0.72/1M tokens Mistral Large $2/1M tokens $6/1M tokens Nova Pro $1/1M tokens $4/1M tokens -
特点:模型选择最多,企业级安全,与 AWS 生态深度整合
-
免费政策:新用户 AWS Free Tier 包含有限额度
4.2 Google Cloud
AI 服务平台:Vertex AI + Google AI Studio
-
提供模型:
- 自研:Gemini 系列、PaLM 2、Codey
- 第三方:Claude、Llama、Mistral(通过 API)
-
定价模式:
套餐类型 价格 权益 按需付费 按 Token 计费 无承诺,灵活使用 Google One AI Plus $7.99/月 Gemini Advanced,200GB 存储 Google One AI Pro $19.99/月 更高优先级,2TB 存储 Google One AI Ultra $249.99/月 企业级,30TB 存储 -
API 定价示例(Vertex AI):
模型 输入价格 输出价格 Gemini 2.0 Flash $0.075/1M tokens $0.30/1M tokens Gemini 2.0 Pro $1.25/1M tokens $5/1M tokens Claude 3.5 Sonnet $3/1M tokens $15/1M tokens -
特点:Google 生态整合,多模态能力强,价格竞争力强
-
免费政策:Google AI Studio 有免费额度(约 60 次/分钟)
4.3 Microsoft Azure
AI 服务平台:Azure OpenAI Service + Azure AI
-
提供模型:
- OpenAI:GPT-4o、GPT-5、DALL-E 3、Whisper
- 自研:Phi 系列、MAI-1
- 第三方:Meta Llama、Mistral、Cohere
-
定价模式:
套餐类型 价格 权益 按需付费 按 Token 计费 无承诺,灵活使用 Copilot Pro $20/月 Office 整合,优先访问 Copilot Enterprise $30/用户/月 企业级功能 企业套餐 定制报价 专属部署,SLA 保障 -
API 定价示例(Azure OpenAI):
模型 输入价格 输出价格 上下文长度 GPT-5.4 $2.50/1M tokens $15/1M tokens 105 万 tokens GPT-5.4-mini $0.15/1M tokens $0.60/1M tokens 50 万 tokens GPT-4o $2.50/1M tokens $10/1M tokens 12.8 万 tokens GPT-5.4 Cached Input $0.18/1M tokens - - o3 $15/1M tokens $60/1M tokens 20 万 tokens o4 $20/1M tokens $80/1M tokens 20 万 tokens -
特点:OpenAI 独家合作,Office 365 整合,企业市场领先
-
免费政策:新用户 Azure Free Tier 包含 $200 额度
五、云厂商与模型厂商的关系
5.1 投资/独家合作关系
| 云厂商 | 合作模型公司 | 关系类型 | 投资金额 |
|---|---|---|---|
| Microsoft | OpenAI | 独家合作 + 投资 | $130 亿+ |
| Anthropic | 投资 + 合作 | $20 亿+ | |
| AWS | Anthropic | 战略合作 | $40 亿+ |
| AWS | Cohere | 投资 + 合作 | 未披露 |
| Mistral AI | 合作 | 未披露 |
5.2 模型托管关系
| 云平台 | 托管的第三方模型 |
|---|---|
| AWS Bedrock | Claude、Llama、Cohere、AI21、Mistral、Nova |
| Google Vertex AI | Claude、Llama、Mistral、Gemini |
| Azure AI | GPT、Llama、Mistral、Cohere、Phi |
5.3 关系图谱
┌─────────────────────────────────────────────────────────────┐
│ 国外大模型生态关系图 │
├─────────────────────────────────────────────────────────────┤
│ │
│ Microsoft ──投资$130 亿──→ OpenAI (ChatGPT/GPT-5.4) │
│ │ Azure OpenAI 独家合作 │
│ └──自研──→ Phi 系列、MAI-1、Copilot │
│ │
│ Google ───投资$20 亿───→ Anthropic (Claude 4.6) │
│ │ 多平台合作 │
│ └──自研──→ Gemini 3.1 系列、PaLM、Codey │
│ │
│ AWS ─────投资$40 亿───→ Anthropic (Claude 4.6) │
│ │ Bedrock 主力模型 │
│ └──自研──→ Nova 系列 │
│ │
│ xAI (Elon Musk) ──自研──→ Grok 4.20 系列 │
│ 与 X(Twitter) 整合 │
│ │
│ Meta ───自研开源──→ Llama 系列 │
│ 通过云平台提供 API │
│ │
│ 独立厂商:Cohere、Mistral、AI21、Stability AI、Midjourney │
│ │
└─────────────────────────────────────────────────────────────┘
六、免费 vs 商业模型汇总
6.1 完全免费(开源)
| 模型 | 厂商 | 许可协议 | 商用限制 |
|---|---|---|---|
| Llama 3/3.1/3.2 | Meta | Llama Community License | 可商用(有限制) |
| Mistral 7B / Mixtral | Mistral AI | Apache 2.0 | 可商用 |
| Stable Diffusion | Stability AI | CreativeML Open RAIL | 可商用 |
| Falcon | TII (阿联酋) | Apache 2.0 | 可商用 |
| Gemma | Gemma License | 可商用 |
6.2 有限免费(免费额度/试用)
| 平台 | 免费政策 | 限制说明 |
|---|---|---|
| ChatGPT | GPT-3.5 免费,GPT-4o 有限 | 每日限额 |
| Claude | 免费版可用 Sonnet | 每日调用限制 |
| Gemini | 基础版免费 | Advanced 需订阅 |
| Perplexity | 基础搜索免费 | Pro 功能需订阅 |
| Pi (Inflection) | 基础功能免费 | - |
| AWS Bedrock | 新用户 Free Tier | 有限额度 |
| Azure OpenAI | 新用户$200 额度 | 一次性 |
| Google Vertex AI | 免费额度 | 约 60 次/分钟 |
6.3 纯商业(订阅/API 收费)
| 模型/服务 | 厂商 | 起步价格 |
|---|---|---|
| GPT-5.4/GPT-4o | OpenAI | $20/月 (Plus) |
| Claude 4.6 Opus | Anthropic | $20/月 (Pro) |
| Gemini Advanced | $7.99/月 | |
| Grok 4.20 | xAI | $8/月 (X Premium) |
| Command R+ | Cohere | 按量计费 |
| Mistral Large | Mistral | €2/1M tokens |
| Midjourney | Midjourney | $10/月 |
| Runway Gen-3 | Runway | $15/月 |
七、价格对比与选型建议
7.1 订阅套餐对比
| 服务 | 基础套餐 | 专业套餐 | 企业套餐 |
|---|---|---|---|
| ChatGPT Plus | $20/月 | Pro $200/月 | Enterprise 定制 |
| Claude Pro | $20/月 | Team $25/人/月 | Enterprise 定制 |
| Gemini Advanced | $7.99/月 | Pro $19.99/月 | Ultra $249.99/月 |
| Grok (X Premium) | $8/月 | Premium+ $16/月 | Enterprise 定制 |
| Copilot Pro | $20/月 | Enterprise $30/人/月 | - |
| Perplexity Pro | $20/月 | Team $25/人/月 | - |
| Midjourney | Basic $10/月 | Pro $60/月 | Mega $120/月 |
7.2 API 价格对比(每 1M tokens)
| 模型 | 输入价格 | 输出价格 | 上下文长度 | 性价比 |
|---|---|---|---|---|
| Gemini 3.1 Flash | $0.075 | $0.30 | 100 万 | ⭐⭐⭐⭐⭐ |
| GPT-5.4-mini | $0.15 | $0.60 | 50 万 | ⭐⭐⭐⭐⭐ |
| Claude 4.6 Haiku | $0.25 | $1.25 | 20 万 | ⭐⭐⭐⭐ |
| Llama 3 70B (AWS) | $0.72 | $0.72 | 12.8 万 | ⭐⭐⭐⭐ |
| Gemini 3.1 Pro | $2.00 | $12.00 | 100 万 | ⭐⭐⭐⭐ |
| GPT-4o | $2.50 | $10.00 | 12.8 万 | ⭐⭐⭐ |
| GPT-5.4 | $2.50 | $15.00 | 105 万 | ⭐⭐⭐ |
| Claude 4.6 Sonnet | $3.00 | $15.00 | 20 万 | ⭐⭐⭐ |
| Claude 4.6 Opus | $5.00 | $25.00 | 100 万 | ⭐⭐ |
| o3 (推理) | $15 | $60 | 20 万 | ⭐⭐ |
| o4 (推理) | $20 | $80 | 20 万 | ⭐ |
7.3 按场景推荐
| 场景 | 推荐模型 | 理由 |
|---|---|---|
| 通用对话 | GPT-5.4、Claude 4.6 Sonnet | 综合能力最强 |
| 代码生成 | GPT-5.4、Claude 4.6、Codestral | 代码能力专项优化 |
| 长文档处理 | Claude 4.6 (200K)、Gemini 3.1 (1M+) | 超长上下文支持 |
| 实时信息 | Grok 4.20、Perplexity | 实时数据整合 |
| 图像生成 | Midjourney、DALL-E 3、SD3 | 图像质量优秀 |
| 视频生成 | Runway Gen-3、Pika | 视频生成专业 |
| 企业应用 | Azure OpenAI、AWS Bedrock | 企业级安全与合规 |
| 性价比 | Gemini 3.1 Flash、GPT-5.4-mini | 价格低效果好 |
| 开源部署 | Llama 3、Mistral、Gemma | 开源生态完善 |
八、总结
8.1 市场格局
- 三云鼎立:AWS、Google、Microsoft 三大云厂商通过投资和合作控制主流模型资源
- 模型四强:ChatGPT、Claude、Gemini、Grok 代表不同技术路线和生态定位
- 开源力量:Meta Llama、Mistral 等开源模型推动技术普及
- 垂直领域:Midjourney(图像)、Runway(视频)、Perplexity(搜索)等深耕细分场景
8.2 投资关系总结
| 投资方 | 被投公司 | 金额 | 战略意义 |
|---|---|---|---|
| Microsoft | OpenAI | $130 亿+ | GPT 独家云合作 |
| AWS | Anthropic | $40 亿+ | Claude 主力托管 |
| Anthropic | $20 亿+ | 多平台合作 | |
| Salesforce | Cohere | 未披露 | 企业 NLP |
| NVIDIA | Mistral | 未披露 | 硬件 + 模型合作 |
8.3 趋势观察
- 订阅制主流:C 端产品普遍采用 $20/月订阅模式
- 价格分层:Lite/Pro/Ultra 多层套餐满足不同需求
- 生态整合:模型与云、办公、搜索产品深度整合
- 开源闭源并行:大厂同时提供开源和闭源模型
- 多模态竞争:文本、图像、视频、语音全栈能力
8.4 选型要点
- 个人用户:ChatGPT Plus、Claude Pro、Gemini Advanced($20/月三选一)
- 开发者:根据云平台选择(AWS/Azure/GCP)
- 企业用户:Azure OpenAI(合规)、AWS Bedrock(模型多样)
- 成本敏感:Gemini 3.1 Flash、GPT-5.4-mini、开源模型
- 特殊需求:
- 实时信息 → Grok 4.20、Perplexity
- 图像生成 → Midjourney、DALL-E 3
- 视频生成 → Runway、Pika
- 长文档 → Claude 4.6、Gemini 3.1
文档生成时间:2026 年 3 月 注:价格信息可能随时变动,请以各平台官网最新报价为准
中美云厂商大模型套餐与生态差异:为什么国内更"卷"?
一、核心差异:套餐丰富度与生态开放度
1. 包月套餐差异对比
| 对比维度 | 国内云厂商(阿里/火山/百度/腾讯/华为) | 国外云厂商(AWS/Azure/Google Cloud) | 核心原因 |
|---|---|---|---|
| 套餐类型 | 多档位细分(Lite/Pro/企业版),覆盖个人→团队→企业全场景 | 以按需计费(Token)和预留容量(PTU)为主,个人包月少 | 国内个人开发者与中小企业需求旺盛,国外以大型企业为主 |
| 价格门槛 | 极低(如阿里云Coding Plan首月7.9元起) | 偏高(GPT-5.2约$0.01/1K Token,Claude约$3/1M Token) | 国内竞争激烈,主打"普惠AI";国外走"高价值服务"路线 |
| 模型组合 | 多模型打包订阅(如阿里云Coding Plan接入8款编程模型) | 单模型独立计费,跨模型组合少 | 国内第三方模型多,云厂商主打"一站式选择";国外模型集中度高 |
| 附加权益 | 赠送API调用次数、算力资源、开发工具 | 以基础模型服务为主,附加服务少 | 国内注重用户粘性,国外强调核心价值交付 |
2. 生态丰富度差异
| 对比维度 | 国内云厂商 | 国外云厂商 | 关键区别 |
|---|---|---|---|
| 接入模型数量 | 多(单平台支持10+第三方模型,如火山引擎接入GLM/DeepSeek/MiniMax等) | 少(AWS Bedrock约10款,Azure Foundry约8款) | 国内第三方模型百花齐放,云厂商"来者不拒";国外模型集中度高,头部效应明显 |
| 开源模型支持 | 全面(通义千问/GLM/MiniMax/Kimi等主流开源模型全覆盖) | 有限(以闭源商业模型为主,开源仅Llama/Cohere等少数) | 国内开源生态活跃,国外商业模型主导 |
| 场景化解决方案 | 垂直场景定制(如编程/Chat/多模态/企业智能体专项套餐) | 通用解决方案为主,场景化订阅少 | 国内场景碎片化,国外企业需求标准化 |
| 本土化适配 | 中文优化、合规适配、本土工具集成(如飞书/钉钉/微信) | 英文为主,全球通用,与本土工具集成弱 | 国内市场本地化需求强,国外追求全球一致性 |
二、五大核心原因解析
1. 市场竞争格局不同
-
国内:大模型领域呈现"百模大战",第三方模型厂商(智谱GLM、MiniMax、月之暗面Kimi等)数量众多,云厂商为抢占市场份额,采取"全量接入+低价促销“策略,形成"模型超市"模式
-
国外:大模型市场集中度高,形成”寡头垄断"(OpenAI、Anthropic、Google Gemini、xAI Grok四强),云厂商更多是"战略投资+独家合作"(如AWS投资OpenAI,Anthropic首选AWS),而非"广撒网"
2. 用户结构与需求差异
-
国内:
- 个人开发者与中小企业占比高,对低成本、低门槛的包月套餐需求强烈
- 追求"模型自由",希望在一个平台上切换使用不同模型
- 价格敏感度高,促销活动(首月低价、续费折扣)对用户决策影响大
-
国外:
- 大型企业客户占主导,更注重稳定性、安全性、可扩展性
- 预算充足,倾向按使用量计费(Token-based)或预留容量(PTU),而非固定包月
- 对价格敏感度低,更看重模型性能与服务质量
3. 商业模式与盈利逻辑差异
-
国内:云厂商将大模型视为流量入口,通过低价包月吸引用户,再通过增值服务(如算力升级、定制开发、企业版服务)盈利
-
国外:大模型本身就是核心盈利产品,云厂商与模型厂商分成,定价策略更注重成本回收与利润最大化
4. 技术路线与开放程度不同
-
国内:
- 模型厂商与云厂商分工明确:模型厂商专注研发,云厂商提供基础设施与分发渠道
- 开源模型生态发达(如通义千问开源300+模型),降低了云厂商接入门槛
-
国外:
- 云厂商自研+投资双管齐下(如Google Gemini、Microsoft Copilot),与第三方模型存在竞争关系
- 商业模型更倾向闭源,保护核心技术与市场份额
5. 监管环境与合规要求差异
-
国内:
- 监管要求模型必须备案,云厂商成为合规接入渠道,第三方模型依赖云厂商获取合规资质
- 数据本地化要求高,云厂商提供的模型服务更符合本土合规标准
-
国外:
- 监管相对宽松,模型厂商可独立提供服务,云厂商更多是基础设施提供者
- 数据跨境流动限制少,全球部署更灵活
三、典型案例对比:国内vs国外套餐实例
国内案例:阿里云Coding Plan(2026年2月推出)
- 套餐档位:Lite(18,000次调用/月,首月7.9元)、Pro(90,000次调用/月,首月39.9元)
- 接入模型:8款编程专用模型(Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5等)
- 核心特点:多模型自由切换,一次订阅全场景覆盖,新用户补贴力度大
国外案例:AWS Bedrock Claude 3.5 Sonnet
- 计费模式:按需计费(输入$3/1M Token,输出$15/1M Token),批量处理50%折扣
- 接入模型:单模型独立计费,跨模型组合需单独购买
- 核心特点:企业级服务,注重稳定性与安全性,无个人低价套餐
四、对开发者的实用建议
-
个人/中小企业用户:优先选择国内云厂商的包月套餐,性价比极高(如阿里云Coding Plan、火山引擎豆包开发者套餐),适合快速迭代与原型开发
-
大型企业/合规要求高:考虑国外云厂商的预留容量(PTU)方案,稳定性与安全性更优,适合生产环境部署
-
LangChain开发者:
- 国内云厂商多支持OpenAI兼容API,代码改动最小
- 笔记本无法跑大模型完全不影响使用LangChain,模型推理全在云端进行
- 国内生态更适合快速测试不同模型,国外生态更适合深度优化单一模型
-
成本优化策略:
- 开发阶段:用国内低价包月套餐测试多模型
- 生产阶段:根据场景选择最优模型,切换到按需计费或预留容量模式
五、总结:差异背后是生态成熟度与市场阶段的不同
中美云厂商的套餐差异本质上是市场发展阶段的体现:国内大模型市场处于快速扩张期,
云厂商通过"低价+全量接入"抢占市场;国外市场则进入成熟期,
更注重盈利与服务质量。随着国内市场集中度提升,未来套餐价格与生态策略可能会向国外靠拢,但短期内"卷套餐、卷生态"的格局仍将持续。