国内云厂商与大模型厂商全景纪要（2026）

一、国内主要云厂商及其自研模型

云厂商	自研大模型	模型系列	定价模式	免费额度
火山引擎	豆包 (Doubao)	Doubao-Pro/Lite	按 Token 计费	有免费额度
阿里云	通义千问 (Qwen)	Qwen-Max/Plus/Turbo	按 Token 计费	部分模型免费
腾讯云	混元 (Hunyuan)	Hunyuan-Pro/Standard	按 Token 计费	有免费额度
百度云	文心一言 (ERNIE)	ERNIE-4.0/3.5	按 Token 计费	有免费额度
华为云	盘古 (Pangu)	Pangu-5.0/NLP/CV	按量/包年包月	试用额度

💡 最新定价更新（2026 年）：火山引擎、阿里百炼推出包月套餐；百度、腾讯有限时打折活动。详见下方「1.6 最新定价与优惠活动」。

1.1 火山引擎 - 豆包

模型系列：豆包-Pro、豆包-Lite、豆包-1.5
价格参考：
- 豆包-Lite：输入 ¥0.0003/1K tokens，输出 ¥0.0006/1K tokens
- 豆包-Pro：输入 ¥0.003/1K tokens，输出 ¥0.006/1K tokens
特点：字节系生态整合，短视频/推荐场景优化
免费政策：新用户赠送额度，部分轻量模型免费调用

1.2 阿里云 - 通义千问

模型系列：Qwen-Max、Qwen-Plus、Qwen-Turbo、Qwen-Long
价格参考：
- Qwen-Turbo：输入 ¥0.0005/1K tokens，输出 ¥0.001/1K tokens
- Qwen-Plus：输入 ¥0.002/1K tokens，输出 ¥0.006/1K tokens
- Qwen-Max：输入 ¥0.04/1K tokens，输出 ¥0.12/1K tokens
特点：开源生态完善，Qwen 系列开源模型全球知名
免费政策：Qwen-Turbo 有一定免费额度，开源模型可免费使用

1.3 腾讯云 - 混元

模型系列：Hunyuan-Pro、Hunyuan-Standard、Hunyuan-Lite
价格参考：
- Hunyuan-Lite：输入 ¥0.0008/1K tokens，输出 ¥0.0008/1K tokens
- Hunyuan-Standard：输入 ¥0.005/1K tokens，输出 ¥0.005/1K tokens
- Hunyuan-Pro：输入 ¥0.05/1K tokens，输出 ¥0.05/1K tokens
特点：微信/游戏生态整合，多模态能力强
免费政策：新用户赠送 100 万 tokens 额度

1.4 百度云 - 文心一言

模型系列：ERNIE-4.0、ERNIE-3.5、ERNIE-Speed
价格参考：
- ERNIE-Speed：输入 ¥0.0004/1K tokens，输出 ¥0.0008/1K tokens
- ERNIE-3.5：输入 ¥0.0012/1K tokens，输出 ¥0.0012/1K tokens
- ERNIE-4.0：输入 ¥0.03/1K tokens，输出 ¥0.09/1K tokens
特点：搜索场景优化，知识更新快
免费政策：标准版有一定免费调用次数

1.5 华为云 - 盘古

模型系列：盘古 NLP、盘古 CV、盘古多模态
价格参考：
- 按量计费：约 ¥0.005-0.05/1K tokens（视模型而定）
- 包年包月：企业定制方案
特点：政企市场深耕，行业大模型（矿山、铁路、电力等）
免费政策：试用额度，需申请

1.6 最新定价与优惠活动（2026 年更新）

火山引擎 - 豆包包月套餐

套餐类型	价格	每月调用次数	单次 Token 上限	适合场景
Lite 套餐	¥40/月	18,000 次	8K tokens	轻量应用、个人开发者
Pro 套餐	¥200/月	90,000 次	32K tokens	企业应用、高频调用

说明：包月套餐超出额度后按量计费；套餐内未用完次数不结转至下月。

阿里百炼 - 通义千问包月套餐

套餐类型	价格	每月调用次数	单次 Token 上限	适合场景
Lite 套餐	¥40/月	18,000 次	8K tokens	轻量应用、个人开发者
Pro 套餐	¥200/月	90,000 次	32K tokens	企业应用、高频调用

说明：百炼平台统一计费，支持 Qwen 全系列模型调用。

百度云 - 文心一言打折活动

活动类型	折扣力度	活动时间	适用模型
新用户专享	首充 5 折	长期	全模型
企业套餐	包年 7 折	长期	ERNIE-3.5/4.0
限时促销	充值返 30%	2026 Q1	全模型

说明：打折活动可与免费额度叠加使用；企业套餐需签订合同。

腾讯云 - 混元打折活动

活动类型	折扣力度	活动时间	适用模型
新用户专享	首月 1 元	长期	Hunyuan-Lite
预付费套餐	充 1000 送 200	长期	全模型
限时促销	5 折优惠	2026 Q1-Q2	Hunyuan-Standard

说明：预付费套餐额度永久有效；限时促销需关注官方公告。

各平台套餐对比

平台	入门套餐	专业套餐	性价比推荐
火山引擎	¥40/18K 次	¥200/90K 次	⭐⭐⭐⭐⭐ Pro 套餐
阿里百炼	¥40/18K 次	¥200/90K 次	⭐⭐⭐⭐⭐ Pro 套餐
百度云	折扣后约 ¥50/月	折扣后约 ¥300/月	⭐⭐⭐⭐ 企业套餐
腾讯云	首月¥1 后约 ¥60/月	折扣后约 ¥250/月	⭐⭐⭐⭐ 预付费
华为云	需定制报价	需定制报价	⭐⭐⭐ 政企优选

选购建议：

个人开发者/小项目：火山引擎/阿里百炼 Lite 套餐（¥40/月）性价比最高

中型企业应用：火山引擎/阿里百炼 Pro 套餐（¥200/月）或腾讯预付费

大型企业/政企：百度/华为企业定制套餐，享受专属折扣和技术支持

二、国内第三方大模型厂商

厂商	代表模型	类型	免费政策	商业化程度
DeepSeek	DeepSeek-V2/V3	开源 + 闭源	开源免费，API 收费	高
Kimi (月之暗面)	Kimi Chat	闭源	有限免费，会员制	高
MiniMax	ABAB 系列	闭源	有免费额度	高
GLM (智谱 AI)	GLM-4/ChatGLM	开源 + 闭源	开源免费，API 收费	高
科大讯飞	星火认知	闭源	有免费额度	高
百川智能	Baichuan 系列	开源 + 闭源	开源免费	中
零一万物	Yi 系列	开源 + 闭源	开源免费	中
360	360 智脑	闭源	有限免费	中

2.1 DeepSeek（深度求索）

模型：DeepSeek-V2、DeepSeek-V3、DeepSeek-Coder
定价：
- DeepSeek-V3：输入 ¥0.0002/1K tokens，输出 ¥0.0008/1K tokens
- DeepSeek-Coder：输入 ¥0.001/1K tokens，输出 ¥0.002/1K tokens
特点：代码能力突出，性价比极高
开源情况：部分模型开源（HuggingFace 可下载）

2.2 Kimi（月之暗面）

模型：Kimi Chat（基于 Moonshot 模型）
定价：会员制 + 按量计费
- 免费版：有限调用次数
- 会员：¥20-50/月
特点：超长上下文（200K+），文档处理能力强
开源情况：闭源

2.3 MiniMax

模型：ABAB-6.5、ABAB-7、Speech-01
定价：
- ABAB-6.5：输入 ¥0.005/1K tokens，输出 ¥0.005/1K tokens
特点：语音合成、虚拟人、游戏 NPC 场景
开源情况：闭源

2.4 GLM / 智谱 AI

模型：GLM-4、GLM-3-Turbo、ChatGLM3
定价：
- GLM-3-Turbo：输入 ¥0.001/1K tokens，输出 ¥0.001/1K tokens
- GLM-4：输入 ¥0.05/1K tokens，输出 ¥0.05/1K tokens
特点：清华系背景，学术能力强，开源生态好
开源情况：ChatGLM 系列开源

2.5 科大讯飞 - 星火认知

模型：星火 4.0、星火 Pro
定价：
- 标准版：有免费额度
- Pro 版：按量计费或包月
特点：语音交互、教育场景、硬件整合
开源情况：闭源

2.6 百川智能

模型：Baichuan-7B/13B/53B
定价：开源免费，API 服务收费
特点：开源模型性能优秀，中文优化
开源情况：完全开源

2.7 零一万物 (01.AI)

模型：Yi-6B/34B/65B
定价：开源免费
特点：李开复创办，开源模型全球榜单表现优异
开源情况：完全开源

2.8 360 智脑

模型：360 智脑 4.0
定价：有限免费，企业定制
特点：安全场景优化，与 360 产品整合
开源情况：闭源

三、云厂商与第三方模型的关系

3.1 合作/托管关系

云平台	托管的第三方模型	合作形式
火山引擎	MiniMax、智谱 GLM	API 代理/模型市场
阿里云	百川、智谱 AI、MiniMax	百炼平台模型市场
腾讯云	智谱 AI、MiniMax	模型即服务 (MaaS)
百度云	部分开源模型	千帆平台
华为云	智谱 AI、百川	盘古 + 生态模型

3.2 投资/战略关系

云厂商	投资的模型公司	备注
阿里	月之暗面 (Kimi)、MiniMax、智谱 AI	多轮投资
腾讯	月之暗面、MiniMax、智谱 AI、百川	广泛布局
字节	MiniMax、月之暗面	战略投资
百度	-	主要自研
华为	-	主要自研 + 开源合作

3.3 关系图谱

┌─────────────────────────────────────────────────────────────┐
│                    国内大模型生态关系图                      │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  阿里云 ──投资──→ 月之暗面 (Kimi)                             │
│    │              智谱 AI (GLM)                              │
│    │              MiniMax                                    │
│    │              百川智能                                   │
│    └──自研──→ 通义千问 (Qwen)                                │
│                                                             │
│  腾讯云 ──投资──→ 月之暗面 (Kimi)                             │
│    │              智谱 AI (GLM)                              │
│    │              MiniMax                                    │
│    │              百川智能                                    │
│    └──自研──→ 混元 (Hunyuan)                                 │
│                                                             │
│  火山引擎 ─投资──→ 月之暗面 (Kimi)                            │
│    │              MiniMax                                    │
│    └──自研──→ 豆包 (Doubao)                                  │
│                                                             │
│  百度云 ──自研──→ 文心一言 (ERNIE)                           │
│                                                             │
│  华为云 ──自研──→ 盘古 (Pangu)                               │
│                                                             │
│  独立厂商：DeepSeek、零一万物、360 智脑、科大讯飞              │
│                                                             │
└─────────────────────────────────────────────────────────────┘

四、免费 vs 商业模型汇总

4.1 完全免费（开源）

模型	厂商	许可协议	商用限制
Qwen-7B/14B/72B	阿里云	Apache 2.0 / Qwen License	部分可商用
ChatGLM3-6B	智谱 AI	Apache 2.0	可商用
Baichuan-7B/13B	百川智能	Apache 2.0	可商用
Yi-6B/34B	零一万物	Apache 2.0 / Yi License	部分可商用
DeepSeek-Coder	DeepSeek	Apache 2.0	可商用

4.2 有限免费（免费额度）

平台	免费政策	限制说明
火山引擎豆包	新用户赠送额度	约 100 万 tokens
阿里云百炼	Qwen-Turbo 免费	每日限额
腾讯云混元	新用户 100 万 tokens	一次性
百度文心一言	标准版免费调用	每日次数限制
讯飞星火	标准版免费	每日限额
Kimi	基础功能免费	高级功能会员
智谱 AI	新用户赠送额度	约 100 万 tokens
MiniMax	新用户赠送额度	有限额度

4.3 纯商业（API 收费）

模型	厂商	起步价格
Qwen-Max	阿里云	¥0.04/1K tokens
ERNIE-4.0	百度云	¥0.03/1K tokens
Hunyuan-Pro	腾讯云	¥0.05/1K tokens
豆包-Pro	火山引擎	¥0.003/1K tokens
GLM-4	智谱 AI	¥0.05/1K tokens
星火 4.0	科大讯飞	定制报价
360 智脑	360	企业定制

五、选型建议

5.1 按场景推荐

场景	推荐模型	理由
代码生成	DeepSeek-Coder、Qwen-Coder	代码能力专项优化
长文档处理	Kimi、Qwen-Long	超长上下文支持
多模态	混元、豆包、通义千问	图文理解能力强
语音交互	讯飞星火、MiniMax	语音技术积累深
企业定制	盘古、文心一言	行业方案成熟
性价比	DeepSeek-V3、Qwen-Turbo	价格低效果好
开源部署	Qwen、ChatGLM、Baichuan、Yi	开源生态完善

5.2 价格对比（每 1K tokens）

模型	输入价格	输出价格	性价比
DeepSeek-V3	¥0.0002	¥0.0008	⭐⭐⭐⭐⭐
Qwen-Turbo	¥0.0005	¥0.001	⭐⭐⭐⭐⭐
ERNIE-Speed	¥0.0004	¥0.0008	⭐⭐⭐⭐
豆包-Lite	¥0.0003	¥0.0006	⭐⭐⭐⭐
Hunyuan-Lite	¥0.0008	¥0.0008	⭐⭐⭐⭐
GLM-3-Turbo	¥0.001	¥0.001	⭐⭐⭐
Qwen-Plus	¥0.002	¥0.006	⭐⭐⭐
豆包-Pro	¥0.003	¥0.006	⭐⭐⭐
ERNIE-4.0	¥0.03	¥0.09	⭐⭐
Qwen-Max	¥0.04	¥0.12	⭐⭐
GLM-4	¥0.05	¥0.05	⭐⭐
Hunyuan-Pro	¥0.05	¥0.05	⭐⭐

六、总结

6.1 市场格局

云厂商自研：阿里、腾讯、百度、华为、字节五大云厂商均有自研大模型，形成"云 + 模型"一体化服务
第三方独立厂商：DeepSeek、月之暗面、智谱 AI、MiniMax 等专注模型研发，通过 API 或开源提供服务
投资绑定：阿里、腾讯、字节通过投资广泛布局第三方模型公司，形成生态护城河

6.2 趋势观察

价格战激烈：2024-2025 年各大厂商持续降价，DeepSeek 引领"价格屠夫"策略
开源成主流：Qwen、ChatGLM、Baichuan、Yi 等开源模型推动行业技术普及
模型即服务：云平台纷纷推出 MaaS（Model as Service），聚合多家模型
垂直场景深化：行业大模型（医疗、法律、金融、教育）成为竞争焦点

6.3 选型要点

成本敏感 → DeepSeek、Qwen-Turbo
效果优先 → Qwen-Max、ERNIE-4.0、GLM-4
私有部署 → Qwen、ChatGLM、Baichuan、Yi（开源）
生态整合 → 对应云厂商自研模型
特殊场景 → 语音选讯飞，长文档选 Kimi，代码选 DeepSeek

文档生成时间：2026 年 3 月 注：价格信息可能随时变动，请以各平台官网最新报价为准

国外云厂商与大模型厂商全景纪要（2026）

一、美国三大云厂商及其 AI 服务

云厂商	自研/合作模型	AI 服务平台	定价模式	免费额度
AWS (Amazon)	Nova 系列 + 第三方模型	Bedrock	按 Token/包月	有限免费
Google Cloud	Gemini 系列	Vertex AI	按 Token/包月	有限免费
Microsoft Azure	GPT 系列 + Copilot	Azure OpenAI	按 Token	有限免费

二、国外模型四强

模型	厂商	最新版本	定价模式	免费政策
ChatGPT	OpenAI	GPT-5.4	订阅 + 按量	有限免费
Claude	Anthropic	Claude 4.6	订阅 + 按量	有限免费
Gemini	Google	Gemini 3.1 Pro	订阅 + 按量	有限免费
Grok	xAI	Grok 4.20	订阅制	X Premium 捆绑

2.1 ChatGPT (OpenAI)

模型系列：GPT-5.4、GPT-5.4-mini、GPT-4o、o3/o4（推理模型）

订阅套餐：

套餐	价格	权益
Free	$0	GPT-4o 有限调用
Plus	$20/月	无限 GPT-5.4，优先访问新功能
Pro	$200/月	更高调用限额，o4 模型访问
Team	$25/人/月	团队协作功能
Enterprise	定制	企业级安全与合规

API 定价（按 Token 计费）：

模型	输入价格	输出价格	上下文长度
GPT-5.4	$2.50/1M tokens	$15/1M tokens	105 万 tokens
GPT-5.4-mini	$0.15/1M tokens	$0.60/1M tokens	50 万 tokens
GPT-4o	$2.50/1M tokens	$10/1M tokens	12.8 万 tokens
o3	$15/1M tokens	$60/1M tokens	20 万 tokens
o4	$20/1M tokens	$80/1M tokens	20 万 tokens

特点：行业标杆，生态最完善，插件和应用市场丰富
免费政策：免费版可使用有限次 GPT-4o

2.2 Claude (Anthropic)

模型系列：Claude 4.6 Sonnet、Claude 4.6 Opus、Claude 4.6 Haiku

订阅套餐：

套餐	价格	权益
Free	$0	有限调用，Claude 4.6 Sonnet
Pro	$20/月	5 倍调用限额，优先访问
Team	$25/人/月	团队协作，管理后台
Enterprise	定制	企业级功能

API 定价：

模型	输入价格	输出价格	上下文长度
Claude 4.6 Sonnet	$3/1M tokens	$15/1M tokens	20 万 tokens
Claude 4.6 Opus	$5/1M tokens	$25/1M tokens	100 万 tokens (beta)
Claude 4.6 Haiku	$0.25/1M tokens	$1.25/1M tokens	20 万 tokens

特点：安全性强，长上下文（200K+），代码和写作能力优秀
免费政策：免费版有每日调用限制

2.3 Gemini (Google)

模型系列：Gemini 3.1 Flash、Gemini 3.1 Pro、Gemini 3.1 Ultra

订阅套餐（Google One AI Premium）：

套餐	价格	存储	权益
Plus	$7.99/月	200GB	Gemini Advanced，Google 应用整合
Pro	$19.99/月	2TB	更高优先级，家庭共享
Ultra	$249.99/月	30TB	企业级功能，最高优先级

API 定价（Vertex AI）：

模型	输入价格	输出价格	上下文长度
Gemini 3.1 Flash	$0.075/1M tokens	$0.30/1M tokens	100 万 tokens
Gemini 3.1 Pro	$2/1M tokens	$12/1M tokens	100 万 tokens
Gemini 3.1 Ultra	定制报价	定制报价	200 万 tokens

特点：Google 生态整合（Search、Workspace、Android），多模态能力强
免费政策：Gemini 基础版免费，Advanced 需订阅

2.4 Grok (xAI)

模型系列：Grok 4.20、Grok 4.20V（多模态）
订阅套餐：

套餐价格权益

X Premium $8/月 Grok 基础访问

X Premium+ $16/月无限 Grok，无广告

X Enterprise 定制企业功能
特点：实时 X(Twitter) 数据整合，幽默风格，实时信息获取
免费政策：需订阅 X Premium 才能使用

套餐	价格	权益
X Premium	$8/月	Grok 基础访问
X Premium+	$16/月	无限 Grok，无广告
X Enterprise	定制	企业功能

三、其他小众模型厂商

厂商	代表模型	类型	定价模式	特点
Cohere	Command R+	闭源	按量 + 订阅	企业 NLP，多语言
Mistral AI	Mistral Large、Mixtral	开源 + 闭源	按量 + 订阅	欧洲之星，高效模型
AI21 Labs	Jurassic-2	闭源	按量计费	以色列，长文本生成
Inflection AI	Pi	闭源	免费 + 订阅	个人 AI 助手
Character.ai	Character 模型	闭源	订阅制	角色扮演，虚拟人物
Perplexity	Pro 模型	闭源	订阅制	AI 搜索，引用来源
Stability AI	Stable Diffusion 3	开源 + 闭源	开源免费，API 收费	图像生成
Midjourney	MJ v6	闭源	订阅制	图像生成，艺术风格
Runway	Gen-2	闭源	订阅制	视频生成
D-ID	D-ID 模型	闭源	订阅制	数字人，视频合成

3.1 Cohere

总部：加拿大
模型：Command R、Command R+、Embed
定价：
- Command R：$0.50/1M tokens（输入），$1.50/1M tokens（输出）
- Command R+：$2.50/1M tokens（输入），$10/1M tokens（输出）
特点：企业级 NLP，多语言支持，RAG 优化

3.2 Mistral AI

总部：法国
模型：Mistral 7B、Mixtral 8x7B、Mistral Large、Codestral
定价：
- Mistral Small：€0.20/1M tokens（输入），€0.60/1M tokens（输出）
- Mistral Large：€2/1M tokens（输入），€6/1M tokens（输出）
特点：开源模型性能优异，欧洲 AI 代表，代码模型 Codestral

3.3 AI21 Labs

总部：以色列
模型：Jurassic-2、Jurassic-2 Ultra
定价：按量计费，具体价格需咨询
特点：长文本生成，文档理解

3.4 Inflection AI - Pi

总部：美国
模型：Pi（Personal Intelligence）
定价：基础免费，高级功能订阅中
特点：情感化 AI 助手，对话体验优秀

3.5 Perplexity AI

总部：美国
模型：Perplexity Pro（基于多模型）
订阅套餐：

套餐价格权益

Free $0 基础搜索，有限查询

Pro $20/月无限搜索，文件上传，API 访问

Team $25/人/月团队协作
特点：AI 搜索引擎，实时信息，引用来源

套餐	价格	权益
Free	$0	基础搜索，有限查询
Pro	$20/月	无限搜索，文件上传，API 访问
Team	$25/人/月	团队协作

3.6 Stability AI

总部：英国
模型：Stable Diffusion 3、Stable Video、Stable Audio
定价：
- 开源模型：免费（本地部署）
- API：$0.0035/生成（SD 3）
特点：开源图像生成领导者

3.7 Midjourney

总部：美国
模型：Midjourney v6、Niji（动漫风格）

订阅套餐：

套餐	价格	生成限额
Basic	$10/月	200 张
Standard	$30/月	15 小时/月（约 900 张）
Pro	$60/月	30 小时/月（约 1800 张）
Mega	$120/月	60 小时/月（约 3600 张）

特点：艺术风格图像生成，Discord 社区

3.8 Runway

总部：美国
模型：Gen-2、Gen-3 Alpha
订阅套餐：

套餐价格权益

Free $0 有限生成

Standard $15/人/月 125 积分/月

Pro $35/人/月 625 积分/月

Unlimited $95/人/月无限生成
特点：视频生成，创意工具套件

套餐	价格	权益
Free	$0	有限生成
Standard	$15/人/月	125 积分/月
Pro	$35/人/月	625 积分/月
Unlimited	$95/人/月	无限生成

四、云厂商 AI 服务详解

4.1 AWS (Amazon Web Services)

AI 服务平台：Amazon Bedrock

提供模型：
- 自研：Nova 系列
- 第三方：Claude (Anthropic)、Llama (Meta)、Cohere、AI21、Mistral

定价模式：

套餐类型	价格	权益
按需付费	按 Token 计费	无承诺，灵活使用
普通套餐	$3/月	基础模型访问
专业套餐	$20/月	高级模型，更高限额
企业套餐	定制报价	专属支持，SLA 保障

API 定价示例：

模型	输入价格	输出价格
Claude 3.5 Sonnet	$3/1M tokens	$15/1M tokens
Llama 3 70B	$0.72/1M tokens	$0.72/1M tokens
Mistral Large	$2/1M tokens	$6/1M tokens
Nova Pro	$1/1M tokens	$4/1M tokens

特点：模型选择最多，企业级安全，与 AWS 生态深度整合
免费政策：新用户 AWS Free Tier 包含有限额度

4.2 Google Cloud

AI 服务平台：Vertex AI + Google AI Studio

提供模型：
- 自研：Gemini 系列、PaLM 2、Codey
- 第三方：Claude、Llama、Mistral（通过 API）

定价模式：

套餐类型	价格	权益
按需付费	按 Token 计费	无承诺，灵活使用
Google One AI Plus	$7.99/月	Gemini Advanced，200GB 存储
Google One AI Pro	$19.99/月	更高优先级，2TB 存储
Google One AI Ultra	$249.99/月	企业级，30TB 存储

API 定价示例（Vertex AI）：

模型输入价格输出价格

Gemini 2.0 Flash $0.075/1M tokens $0.30/1M tokens

Gemini 2.0 Pro $1.25/1M tokens $5/1M tokens

Claude 3.5 Sonnet $3/1M tokens $15/1M tokens
特点：Google 生态整合，多模态能力强，价格竞争力强
免费政策：Google AI Studio 有免费额度（约 60 次/分钟）

模型	输入价格	输出价格
Gemini 2.0 Flash	$0.075/1M tokens	$0.30/1M tokens
Gemini 2.0 Pro	$1.25/1M tokens	$5/1M tokens
Claude 3.5 Sonnet	$3/1M tokens	$15/1M tokens

4.3 Microsoft Azure

AI 服务平台：Azure OpenAI Service + Azure AI

提供模型：
- OpenAI：GPT-4o、GPT-5、DALL-E 3、Whisper
- 自研：Phi 系列、MAI-1
- 第三方：Meta Llama、Mistral、Cohere

定价模式：

套餐类型	价格	权益
按需付费	按 Token 计费	无承诺，灵活使用
Copilot Pro	$20/月	Office 整合，优先访问
Copilot Enterprise	$30/用户/月	企业级功能
企业套餐	定制报价	专属部署，SLA 保障

API 定价示例（Azure OpenAI）：

模型	输入价格	输出价格	上下文长度
GPT-5.4	$2.50/1M tokens	$15/1M tokens	105 万 tokens
GPT-5.4-mini	$0.15/1M tokens	$0.60/1M tokens	50 万 tokens
GPT-4o	$2.50/1M tokens	$10/1M tokens	12.8 万 tokens
GPT-5.4 Cached Input	$0.18/1M tokens	-	-
o3	$15/1M tokens	$60/1M tokens	20 万 tokens
o4	$20/1M tokens	$80/1M tokens	20 万 tokens

特点：OpenAI 独家合作，Office 365 整合，企业市场领先
免费政策：新用户 Azure Free Tier 包含 $200 额度

五、云厂商与模型厂商的关系

5.1 投资/独家合作关系

云厂商	合作模型公司	关系类型	投资金额
Microsoft	OpenAI	独家合作 + 投资	$130 亿+
Google	Anthropic	投资 + 合作	$20 亿+
AWS	Anthropic	战略合作	$40 亿+
AWS	Cohere	投资 + 合作	未披露
Google	Mistral AI	合作	未披露

5.2 模型托管关系

云平台	托管的第三方模型
AWS Bedrock	Claude、Llama、Cohere、AI21、Mistral、Nova
Google Vertex AI	Claude、Llama、Mistral、Gemini
Azure AI	GPT、Llama、Mistral、Cohere、Phi

5.3 关系图谱

┌─────────────────────────────────────────────────────────────┐
│                  国外大模型生态关系图                        │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  Microsoft ──投资$130 亿──→ OpenAI (ChatGPT/GPT-5.4)         │
│     │                       Azure OpenAI 独家合作            │
│     └──自研──→ Phi 系列、MAI-1、Copilot                     │
│                                                             │
│  Google ───投资$20 亿───→ Anthropic (Claude 4.6)            │
│     │                       多平台合作                       │
│     └──自研──→ Gemini 3.1 系列、PaLM、Codey                 │
│                                                             │
│  AWS ─────投资$40 亿───→ Anthropic (Claude 4.6)             │
│     │                       Bedrock 主力模型                 │
│     └──自研──→ Nova 系列                                    │
│                                                             │
│  xAI (Elon Musk) ──自研──→ Grok 4.20 系列                    │
│                            与 X(Twitter) 整合                 │
│                                                             │
│  Meta ───自研开源──→ Llama 系列                             │
│                        通过云平台提供 API                     │
│                                                             │
│  独立厂商：Cohere、Mistral、AI21、Stability AI、Midjourney  │
│                                                             │
└─────────────────────────────────────────────────────────────┘

六、免费 vs 商业模型汇总

6.1 完全免费（开源）

模型	厂商	许可协议	商用限制
Llama 3/3.1/3.2	Meta	Llama Community License	可商用（有限制）
Mistral 7B / Mixtral	Mistral AI	Apache 2.0	可商用
Stable Diffusion	Stability AI	CreativeML Open RAIL	可商用
Falcon	TII (阿联酋)	Apache 2.0	可商用
Gemma	Google	Gemma License	可商用

6.2 有限免费（免费额度/试用）

平台	免费政策	限制说明
ChatGPT	GPT-3.5 免费，GPT-4o 有限	每日限额
Claude	免费版可用 Sonnet	每日调用限制
Gemini	基础版免费	Advanced 需订阅
Perplexity	基础搜索免费	Pro 功能需订阅
Pi (Inflection)	基础功能免费	-
AWS Bedrock	新用户 Free Tier	有限额度
Azure OpenAI	新用户$200 额度	一次性
Google Vertex AI	免费额度	约 60 次/分钟

6.3 纯商业（订阅/API 收费）

模型/服务	厂商	起步价格
GPT-5.4/GPT-4o	OpenAI	$20/月 (Plus)
Claude 4.6 Opus	Anthropic	$20/月 (Pro)
Gemini Advanced	Google	$7.99/月
Grok 4.20	xAI	$8/月 (X Premium)
Command R+	Cohere	按量计费
Mistral Large	Mistral	€2/1M tokens
Midjourney	Midjourney	$10/月
Runway Gen-3	Runway	$15/月

七、价格对比与选型建议

7.1 订阅套餐对比

服务	基础套餐	专业套餐	企业套餐
ChatGPT Plus	$20/月	Pro $200/月	Enterprise 定制
Claude Pro	$20/月	Team $25/人/月	Enterprise 定制
Gemini Advanced	$7.99/月	Pro $19.99/月	Ultra $249.99/月
Grok (X Premium)	$8/月	Premium+ $16/月	Enterprise 定制
Copilot Pro	$20/月	Enterprise $30/人/月	-
Perplexity Pro	$20/月	Team $25/人/月	-
Midjourney	Basic $10/月	Pro $60/月	Mega $120/月

7.2 API 价格对比（每 1M tokens）

模型	输入价格	输出价格	上下文长度	性价比
Gemini 3.1 Flash	$0.075	$0.30	100 万	⭐⭐⭐⭐⭐
GPT-5.4-mini	$0.15	$0.60	50 万	⭐⭐⭐⭐⭐
Claude 4.6 Haiku	$0.25	$1.25	20 万	⭐⭐⭐⭐
Llama 3 70B (AWS)	$0.72	$0.72	12.8 万	⭐⭐⭐⭐
Gemini 3.1 Pro	$2.00	$12.00	100 万	⭐⭐⭐⭐
GPT-4o	$2.50	$10.00	12.8 万	⭐⭐⭐
GPT-5.4	$2.50	$15.00	105 万	⭐⭐⭐
Claude 4.6 Sonnet	$3.00	$15.00	20 万	⭐⭐⭐
Claude 4.6 Opus	$5.00	$25.00	100 万	⭐⭐
o3 (推理)	$15	$60	20 万	⭐⭐
o4 (推理)	$20	$80	20 万	⭐

7.3 按场景推荐

场景	推荐模型	理由
通用对话	GPT-5.4、Claude 4.6 Sonnet	综合能力最强
代码生成	GPT-5.4、Claude 4.6、Codestral	代码能力专项优化
长文档处理	Claude 4.6 (200K)、Gemini 3.1 (1M+)	超长上下文支持
实时信息	Grok 4.20、Perplexity	实时数据整合
图像生成	Midjourney、DALL-E 3、SD3	图像质量优秀
视频生成	Runway Gen-3、Pika	视频生成专业
企业应用	Azure OpenAI、AWS Bedrock	企业级安全与合规
性价比	Gemini 3.1 Flash、GPT-5.4-mini	价格低效果好
开源部署	Llama 3、Mistral、Gemma	开源生态完善

八、总结

8.1 市场格局

三云鼎立：AWS、Google、Microsoft 三大云厂商通过投资和合作控制主流模型资源
模型四强：ChatGPT、Claude、Gemini、Grok 代表不同技术路线和生态定位
开源力量：Meta Llama、Mistral 等开源模型推动技术普及
垂直领域：Midjourney（图像）、Runway（视频）、Perplexity（搜索）等深耕细分场景

8.2 投资关系总结

投资方	被投公司	金额	战略意义
Microsoft	OpenAI	$130 亿+	GPT 独家云合作
AWS	Anthropic	$40 亿+	Claude 主力托管
Google	Anthropic	$20 亿+	多平台合作
Salesforce	Cohere	未披露	企业 NLP
NVIDIA	Mistral	未披露	硬件 + 模型合作

8.3 趋势观察

订阅制主流：C 端产品普遍采用 $20/月订阅模式
价格分层：Lite/Pro/Ultra 多层套餐满足不同需求
生态整合：模型与云、办公、搜索产品深度整合
开源闭源并行：大厂同时提供开源和闭源模型
多模态竞争：文本、图像、视频、语音全栈能力

8.4 选型要点

个人用户：ChatGPT Plus、Claude Pro、Gemini Advanced（$20/月三选一）
开发者：根据云平台选择（AWS/Azure/GCP）
企业用户：Azure OpenAI（合规）、AWS Bedrock（模型多样）
成本敏感：Gemini 3.1 Flash、GPT-5.4-mini、开源模型
特殊需求：
- 实时信息 → Grok 4.20、Perplexity
- 图像生成 → Midjourney、DALL-E 3
- 视频生成 → Runway、Pika
- 长文档 → Claude 4.6、Gemini 3.1

文档生成时间：2026 年 3 月 注：价格信息可能随时变动，请以各平台官网最新报价为准

中美云厂商大模型套餐与生态差异：为什么国内更"卷"？

一、核心差异：套餐丰富度与生态开放度

1. 包月套餐差异对比

对比维度	国内云厂商（阿里/火山/百度/腾讯/华为）	国外云厂商（AWS/Azure/Google Cloud）	核心原因
套餐类型	多档位细分（Lite/Pro/企业版），覆盖个人→团队→企业全场景	以按需计费(Token)和预留容量(PTU)为主，个人包月少	国内个人开发者与中小企业需求旺盛，国外以大型企业为主
价格门槛	极低（如阿里云Coding Plan首月7.9元起）	偏高（GPT-5.2约$0.01/1K Token，Claude约$3/1M Token）	国内竞争激烈，主打"普惠AI"；国外走"高价值服务"路线
模型组合	多模型打包订阅（如阿里云Coding Plan接入8款编程模型）	单模型独立计费，跨模型组合少	国内第三方模型多，云厂商主打"一站式选择"；国外模型集中度高
附加权益	赠送API调用次数、算力资源、开发工具	以基础模型服务为主，附加服务少	国内注重用户粘性，国外强调核心价值交付

2. 生态丰富度差异

对比维度	国内云厂商	国外云厂商	关键区别
接入模型数量	多（单平台支持10+第三方模型，如火山引擎接入GLM/DeepSeek/MiniMax等）	少（AWS Bedrock约10款，Azure Foundry约8款）	国内第三方模型百花齐放，云厂商"来者不拒"；国外模型集中度高，头部效应明显
开源模型支持	全面（通义千问/GLM/MiniMax/Kimi等主流开源模型全覆盖）	有限（以闭源商业模型为主，开源仅Llama/Cohere等少数）	国内开源生态活跃，国外商业模型主导
场景化解决方案	垂直场景定制（如编程/Chat/多模态/企业智能体专项套餐）	通用解决方案为主，场景化订阅少	国内场景碎片化，国外企业需求标准化
本土化适配	中文优化、合规适配、本土工具集成（如飞书/钉钉/微信）	英文为主，全球通用，与本土工具集成弱	国内市场本地化需求强，国外追求全球一致性

二、五大核心原因解析

1. 市场竞争格局不同

国内：大模型领域呈现"百模大战"，第三方模型厂商（智谱GLM、MiniMax、月之暗面Kimi等）数量众多，云厂商为抢占市场份额，采取"全量接入+低价促销“策略，形成"模型超市"模式
国外：大模型市场集中度高，形成”寡头垄断"（OpenAI、Anthropic、Google Gemini、xAI Grok四强），云厂商更多是"战略投资+独家合作"（如AWS投资OpenAI，Anthropic首选AWS），而非"广撒网"

2. 用户结构与需求差异

国内：
- 个人开发者与中小企业占比高，对低成本、低门槛的包月套餐需求强烈
- 追求"模型自由"，希望在一个平台上切换使用不同模型
- 价格敏感度高，促销活动（首月低价、续费折扣）对用户决策影响大
国外：
- 大型企业客户占主导，更注重稳定性、安全性、可扩展性
- 预算充足，倾向按使用量计费（Token-based）或预留容量（PTU），而非固定包月
- 对价格敏感度低，更看重模型性能与服务质量

3. 商业模式与盈利逻辑差异

国内：云厂商将大模型视为流量入口，通过低价包月吸引用户，再通过增值服务（如算力升级、定制开发、企业版服务）盈利
国外：大模型本身就是核心盈利产品，云厂商与模型厂商分成，定价策略更注重成本回收与利润最大化

4. 技术路线与开放程度不同

国内：
- 模型厂商与云厂商分工明确：模型厂商专注研发，云厂商提供基础设施与分发渠道
- 开源模型生态发达（如通义千问开源300+模型），降低了云厂商接入门槛
国外：
- 云厂商自研+投资双管齐下（如Google Gemini、Microsoft Copilot），与第三方模型存在竞争关系
- 商业模型更倾向闭源，保护核心技术与市场份额

5. 监管环境与合规要求差异

国内：
- 监管要求模型必须备案，云厂商成为合规接入渠道，第三方模型依赖云厂商获取合规资质
- 数据本地化要求高，云厂商提供的模型服务更符合本土合规标准
国外：
- 监管相对宽松，模型厂商可独立提供服务，云厂商更多是基础设施提供者
- 数据跨境流动限制少，全球部署更灵活

三、典型案例对比：国内vs国外套餐实例

国内案例：阿里云Coding Plan（2026年2月推出）

套餐档位：Lite（18,000次调用/月，首月7.9元）、Pro（90,000次调用/月，首月39.9元）
接入模型：8款编程专用模型（Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5等）
核心特点：多模型自由切换，一次订阅全场景覆盖，新用户补贴力度大

国外案例：AWS Bedrock Claude 3.5 Sonnet

计费模式：按需计费（输入$3/1M Token，输出$15/1M Token），批量处理50%折扣
接入模型：单模型独立计费，跨模型组合需单独购买
核心特点：企业级服务，注重稳定性与安全性，无个人低价套餐

四、对开发者的实用建议

个人/中小企业用户：优先选择国内云厂商的包月套餐，性价比极高（如阿里云Coding Plan、火山引擎豆包开发者套餐），适合快速迭代与原型开发
大型企业/合规要求高：考虑国外云厂商的预留容量(PTU)方案，稳定性与安全性更优，适合生产环境部署
LangChain开发者：
- 国内云厂商多支持OpenAI兼容API，代码改动最小
- 笔记本无法跑大模型完全不影响使用LangChain，模型推理全在云端进行
- 国内生态更适合快速测试不同模型，国外生态更适合深度优化单一模型
成本优化策略：
- 开发阶段：用国内低价包月套餐测试多模型
- 生产阶段：根据场景选择最优模型，切换到按需计费或预留容量模式

五、总结：差异背后是生态成熟度与市场阶段的不同

中美云厂商的套餐差异本质上是市场发展阶段的体现：国内大模型市场处于快速扩张期，
云厂商通过"低价+全量接入"抢占市场；国外市场则进入成熟期，
更注重盈利与服务质量。随着国内市场集中度提升，未来套餐价格与生态策略可能会向国外靠拢，但短期内"卷套餐、卷生态"的格局仍将持续。

国内云厂商与大模型厂商全景纪要（2026）

一、国内主要云厂商及其自研模型

1.1 火山引擎 - 豆包

1.2 阿里云 - 通义千问

1.3 腾讯云 - 混元

1.4 百度云 - 文心一言

1.5 华为云 - 盘古

1.6 最新定价与优惠活动（2026 年更新）

火山引擎 - 豆包 包月套餐

阿里百炼 - 通义千问 包月套餐

百度云 - 文心一言 打折活动

腾讯云 - 混元 打折活动

各平台套餐对比

二、国内第三方大模型厂商

2.1 DeepSeek（深度求索）

2.2 Kimi（月之暗面）

2.3 MiniMax

2.4 GLM / 智谱 AI

2.5 科大讯飞 - 星火认知

2.6 百川智能

2.7 零一万物 (01.AI)

2.8 360 智脑

三、云厂商与第三方模型的关系

3.1 合作/托管关系

3.2 投资/战略关系

3.3 关系图谱

四、免费 vs 商业模型汇总

4.1 完全免费（开源）

4.2 有限免费（免费额度）

4.3 纯商业（API 收费）

五、选型建议

5.1 按场景推荐

5.2 价格对比（每 1K tokens）

六、总结

6.1 市场格局

6.2 趋势观察

6.3 选型要点

国外云厂商与大模型厂商全景纪要（2026）

一、美国三大云厂商及其 AI 服务

二、国外模型四强

2.1 ChatGPT (OpenAI)

2.2 Claude (Anthropic)

2.3 Gemini (Google)

2.4 Grok (xAI)

三、其他小众模型厂商

3.1 Cohere

3.2 Mistral AI

3.3 AI21 Labs

3.4 Inflection AI - Pi

3.5 Perplexity AI

3.6 Stability AI

3.7 Midjourney

3.8 Runway

四、云厂商 AI 服务详解

4.1 AWS (Amazon Web Services)

AI 服务平台：Amazon Bedrock

4.2 Google Cloud

AI 服务平台：Vertex AI + Google AI Studio

4.3 Microsoft Azure

AI 服务平台：Azure OpenAI Service + Azure AI

五、云厂商与模型厂商的关系

5.1 投资/独家合作关系

5.2 模型托管关系

5.3 关系图谱

六、免费 vs 商业模型汇总

6.1 完全免费（开源）

6.2 有限免费（免费额度/试用）

6.3 纯商业（订阅/API 收费）

七、价格对比与选型建议

7.1 订阅套餐对比

7.2 API 价格对比（每 1M tokens）

7.3 按场景推荐

八、总结

8.1 市场格局

8.2 投资关系总结

8.3 趋势观察

8.4 选型要点

中美云厂商大模型套餐与生态差异：为什么国内更"卷"？

一、核心差异：套餐丰富度与生态开放度

1. 包月套餐差异对比

火山引擎 - 豆包包月套餐

阿里百炼 - 通义千问包月套餐

百度云 - 文心一言打折活动

腾讯云 - 混元打折活动