国内云厂商与大模型厂商全景纪要(2026)

一、国内主要云厂商及其自研模型

云厂商 自研大模型 模型系列 定价模式 免费额度
火山引擎 豆包 (Doubao) Doubao-Pro/Lite 按 Token 计费 有免费额度
阿里云 通义千问 (Qwen) Qwen-Max/Plus/Turbo 按 Token 计费 部分模型免费
腾讯云 混元 (Hunyuan) Hunyuan-Pro/Standard 按 Token 计费 有免费额度
百度云 文心一言 (ERNIE) ERNIE-4.0/3.5 按 Token 计费 有免费额度
华为云 盘古 (Pangu) Pangu-5.0/NLP/CV 按量/包年包月 试用额度

💡 最新定价更新(2026 年):火山引擎、阿里百炼推出包月套餐;百度、腾讯有限时打折活动。详见下方「1.6 最新定价与优惠活动」。

1.1 火山引擎 - 豆包

  • 模型系列:豆包-Pro、豆包-Lite、豆包-1.5
  • 价格参考
    • 豆包-Lite:输入 ¥0.0003/1K tokens,输出 ¥0.0006/1K tokens
    • 豆包-Pro:输入 ¥0.003/1K tokens,输出 ¥0.006/1K tokens
  • 特点:字节系生态整合,短视频/推荐场景优化
  • 免费政策:新用户赠送额度,部分轻量模型免费调用

1.2 阿里云 - 通义千问

  • 模型系列:Qwen-Max、Qwen-Plus、Qwen-Turbo、Qwen-Long
  • 价格参考
    • Qwen-Turbo:输入 ¥0.0005/1K tokens,输出 ¥0.001/1K tokens
    • Qwen-Plus:输入 ¥0.002/1K tokens,输出 ¥0.006/1K tokens
    • Qwen-Max:输入 ¥0.04/1K tokens,输出 ¥0.12/1K tokens
  • 特点:开源生态完善,Qwen 系列开源模型全球知名
  • 免费政策:Qwen-Turbo 有一定免费额度,开源模型可免费使用

1.3 腾讯云 - 混元

  • 模型系列:Hunyuan-Pro、Hunyuan-Standard、Hunyuan-Lite
  • 价格参考
    • Hunyuan-Lite:输入 ¥0.0008/1K tokens,输出 ¥0.0008/1K tokens
    • Hunyuan-Standard:输入 ¥0.005/1K tokens,输出 ¥0.005/1K tokens
    • Hunyuan-Pro:输入 ¥0.05/1K tokens,输出 ¥0.05/1K tokens
  • 特点:微信/游戏生态整合,多模态能力强
  • 免费政策:新用户赠送 100 万 tokens 额度

1.4 百度云 - 文心一言

  • 模型系列:ERNIE-4.0、ERNIE-3.5、ERNIE-Speed
  • 价格参考
    • ERNIE-Speed:输入 ¥0.0004/1K tokens,输出 ¥0.0008/1K tokens
    • ERNIE-3.5:输入 ¥0.0012/1K tokens,输出 ¥0.0012/1K tokens
    • ERNIE-4.0:输入 ¥0.03/1K tokens,输出 ¥0.09/1K tokens
  • 特点:搜索场景优化,知识更新快
  • 免费政策:标准版有一定免费调用次数

1.5 华为云 - 盘古

  • 模型系列:盘古 NLP、盘古 CV、盘古多模态
  • 价格参考
    • 按量计费:约 ¥0.005-0.05/1K tokens(视模型而定)
    • 包年包月:企业定制方案
  • 特点:政企市场深耕,行业大模型(矿山、铁路、电力等)
  • 免费政策:试用额度,需申请

1.6 最新定价与优惠活动(2026 年更新)

火山引擎 - 豆包 包月套餐

套餐类型 价格 每月调用次数 单次 Token 上限 适合场景
Lite 套餐 ¥40/月 18,000 次 8K tokens 轻量应用、个人开发者
Pro 套餐 ¥200/月 90,000 次 32K tokens 企业应用、高频调用

说明:包月套餐超出额度后按量计费;套餐内未用完次数不结转至下月。

阿里百炼 - 通义千问 包月套餐

套餐类型 价格 每月调用次数 单次 Token 上限 适合场景
Lite 套餐 ¥40/月 18,000 次 8K tokens 轻量应用、个人开发者
Pro 套餐 ¥200/月 90,000 次 32K tokens 企业应用、高频调用

说明:百炼平台统一计费,支持 Qwen 全系列模型调用。

百度云 - 文心一言 打折活动

活动类型 折扣力度 活动时间 适用模型
新用户专享 首充 5 折 长期 全模型
企业套餐 包年 7 折 长期 ERNIE-3.5/4.0
限时促销 充值返 30% 2026 Q1 全模型

说明:打折活动可与免费额度叠加使用;企业套餐需签订合同。

腾讯云 - 混元 打折活动

活动类型 折扣力度 活动时间 适用模型
新用户专享 首月 1 元 长期 Hunyuan-Lite
预付费套餐 充 1000 送 200 长期 全模型
限时促销 5 折优惠 2026 Q1-Q2 Hunyuan-Standard

说明:预付费套餐额度永久有效;限时促销需关注官方公告。

各平台套餐对比

平台 入门套餐 专业套餐 性价比推荐
火山引擎 ¥40/18K 次 ¥200/90K 次 ⭐⭐⭐⭐⭐ Pro 套餐
阿里百炼 ¥40/18K 次 ¥200/90K 次 ⭐⭐⭐⭐⭐ Pro 套餐
百度云 折扣后约 ¥50/月 折扣后约 ¥300/月 ⭐⭐⭐⭐ 企业套餐
腾讯云 首月¥1 后约 ¥60/月 折扣后约 ¥250/月 ⭐⭐⭐⭐ 预付费
华为云 需定制报价 需定制报价 ⭐⭐⭐ 政企优选

选购建议

  • 个人开发者/小项目:火山引擎/阿里百炼 Lite 套餐(¥40/月)性价比最高
  • 中型企业应用:火山引擎/阿里百炼 Pro 套餐(¥200/月)或腾讯预付费
  • 大型企业/政企:百度/华为企业定制套餐,享受专属折扣和技术支持

二、国内第三方大模型厂商

厂商 代表模型 类型 免费政策 商业化程度
DeepSeek DeepSeek-V2/V3 开源 + 闭源 开源免费,API 收费
Kimi (月之暗面) Kimi Chat 闭源 有限免费,会员制
MiniMax ABAB 系列 闭源 有免费额度
GLM (智谱 AI) GLM-4/ChatGLM 开源 + 闭源 开源免费,API 收费
科大讯飞 星火认知 闭源 有免费额度
百川智能 Baichuan 系列 开源 + 闭源 开源免费
零一万物 Yi 系列 开源 + 闭源 开源免费
360 360 智脑 闭源 有限免费

2.1 DeepSeek(深度求索)

  • 模型:DeepSeek-V2、DeepSeek-V3、DeepSeek-Coder
  • 定价
    • DeepSeek-V3:输入 ¥0.0002/1K tokens,输出 ¥0.0008/1K tokens
    • DeepSeek-Coder:输入 ¥0.001/1K tokens,输出 ¥0.002/1K tokens
  • 特点:代码能力突出,性价比极高
  • 开源情况:部分模型开源(HuggingFace 可下载)

2.2 Kimi(月之暗面)

  • 模型:Kimi Chat(基于 Moonshot 模型)
  • 定价:会员制 + 按量计费
    • 免费版:有限调用次数
    • 会员:¥20-50/月
  • 特点:超长上下文(200K+),文档处理能力强
  • 开源情况:闭源

2.3 MiniMax

  • 模型:ABAB-6.5、ABAB-7、Speech-01
  • 定价
    • ABAB-6.5:输入 ¥0.005/1K tokens,输出 ¥0.005/1K tokens
  • 特点:语音合成、虚拟人、游戏 NPC 场景
  • 开源情况:闭源

2.4 GLM / 智谱 AI

  • 模型:GLM-4、GLM-3-Turbo、ChatGLM3
  • 定价
    • GLM-3-Turbo:输入 ¥0.001/1K tokens,输出 ¥0.001/1K tokens
    • GLM-4:输入 ¥0.05/1K tokens,输出 ¥0.05/1K tokens
  • 特点:清华系背景,学术能力强,开源生态好
  • 开源情况:ChatGLM 系列开源

2.5 科大讯飞 - 星火认知

  • 模型:星火 4.0、星火 Pro
  • 定价
    • 标准版:有免费额度
    • Pro 版:按量计费或包月
  • 特点:语音交互、教育场景、硬件整合
  • 开源情况:闭源

2.6 百川智能

  • 模型:Baichuan-7B/13B/53B
  • 定价:开源免费,API 服务收费
  • 特点:开源模型性能优秀,中文优化
  • 开源情况:完全开源

2.7 零一万物 (01.AI)

  • 模型:Yi-6B/34B/65B
  • 定价:开源免费
  • 特点:李开复创办,开源模型全球榜单表现优异
  • 开源情况:完全开源

2.8 360 智脑

  • 模型:360 智脑 4.0
  • 定价:有限免费,企业定制
  • 特点:安全场景优化,与 360 产品整合
  • 开源情况:闭源

三、云厂商与第三方模型的关系

3.1 合作/托管关系

云平台 托管的第三方模型 合作形式
火山引擎 MiniMax、智谱 GLM API 代理/模型市场
阿里云 百川、智谱 AI、MiniMax 百炼平台模型市场
腾讯云 智谱 AI、MiniMax 模型即服务 (MaaS)
百度云 部分开源模型 千帆平台
华为云 智谱 AI、百川 盘古 + 生态模型

3.2 投资/战略关系

云厂商 投资的模型公司 备注
阿里 月之暗面 (Kimi)、MiniMax、智谱 AI 多轮投资
腾讯 月之暗面、MiniMax、智谱 AI、百川 广泛布局
字节 MiniMax、月之暗面 战略投资
百度 - 主要自研
华为 - 主要自研 + 开源合作

3.3 关系图谱

┌─────────────────────────────────────────────────────────────┐
│                    国内大模型生态关系图                      │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  阿里云 ──投资──→ 月之暗面 (Kimi)                             │
│    │              智谱 AI (GLM)                              │
│    │              MiniMax                                    │
│    │              百川智能                                   │
│    └──自研──→ 通义千问 (Qwen)                                │
│                                                             │
│  腾讯云 ──投资──→ 月之暗面 (Kimi)                             │
│    │              智谱 AI (GLM)                              │
│    │              MiniMax                                    │
│    │              百川智能                                    │
│    └──自研──→ 混元 (Hunyuan)                                 │
│                                                             │
│  火山引擎 ─投资──→ 月之暗面 (Kimi)                            │
│    │              MiniMax                                    │
│    └──自研──→ 豆包 (Doubao)                                  │
│                                                             │
│  百度云 ──自研──→ 文心一言 (ERNIE)                           │
│                                                             │
│  华为云 ──自研──→ 盘古 (Pangu)                               │
│                                                             │
│  独立厂商:DeepSeek、零一万物、360 智脑、科大讯飞              │
│                                                             │
└─────────────────────────────────────────────────────────────┘

四、免费 vs 商业模型汇总

4.1 完全免费(开源)

模型 厂商 许可协议 商用限制
Qwen-7B/14B/72B 阿里云 Apache 2.0 / Qwen License 部分可商用
ChatGLM3-6B 智谱 AI Apache 2.0 可商用
Baichuan-7B/13B 百川智能 Apache 2.0 可商用
Yi-6B/34B 零一万物 Apache 2.0 / Yi License 部分可商用
DeepSeek-Coder DeepSeek Apache 2.0 可商用

4.2 有限免费(免费额度)

平台 免费政策 限制说明
火山引擎豆包 新用户赠送额度 约 100 万 tokens
阿里云百炼 Qwen-Turbo 免费 每日限额
腾讯云混元 新用户 100 万 tokens 一次性
百度文心一言 标准版免费调用 每日次数限制
讯飞星火 标准版免费 每日限额
Kimi 基础功能免费 高级功能会员
智谱 AI 新用户赠送额度 约 100 万 tokens
MiniMax 新用户赠送额度 有限额度

4.3 纯商业(API 收费)

模型 厂商 起步价格
Qwen-Max 阿里云 ¥0.04/1K tokens
ERNIE-4.0 百度云 ¥0.03/1K tokens
Hunyuan-Pro 腾讯云 ¥0.05/1K tokens
豆包-Pro 火山引擎 ¥0.003/1K tokens
GLM-4 智谱 AI ¥0.05/1K tokens
星火 4.0 科大讯飞 定制报价
360 智脑 360 企业定制

五、选型建议

5.1 按场景推荐

场景 推荐模型 理由
代码生成 DeepSeek-Coder、Qwen-Coder 代码能力专项优化
长文档处理 Kimi、Qwen-Long 超长上下文支持
多模态 混元、豆包、通义千问 图文理解能力强
语音交互 讯飞星火、MiniMax 语音技术积累深
企业定制 盘古、文心一言 行业方案成熟
性价比 DeepSeek-V3、Qwen-Turbo 价格低效果好
开源部署 Qwen、ChatGLM、Baichuan、Yi 开源生态完善

5.2 价格对比(每 1K tokens)

模型 输入价格 输出价格 性价比
DeepSeek-V3 ¥0.0002 ¥0.0008 ⭐⭐⭐⭐⭐
Qwen-Turbo ¥0.0005 ¥0.001 ⭐⭐⭐⭐⭐
ERNIE-Speed ¥0.0004 ¥0.0008 ⭐⭐⭐⭐
豆包-Lite ¥0.0003 ¥0.0006 ⭐⭐⭐⭐
Hunyuan-Lite ¥0.0008 ¥0.0008 ⭐⭐⭐⭐
GLM-3-Turbo ¥0.001 ¥0.001 ⭐⭐⭐
Qwen-Plus ¥0.002 ¥0.006 ⭐⭐⭐
豆包-Pro ¥0.003 ¥0.006 ⭐⭐⭐
ERNIE-4.0 ¥0.03 ¥0.09 ⭐⭐
Qwen-Max ¥0.04 ¥0.12 ⭐⭐
GLM-4 ¥0.05 ¥0.05 ⭐⭐
Hunyuan-Pro ¥0.05 ¥0.05 ⭐⭐

六、总结

6.1 市场格局

  1. 云厂商自研:阿里、腾讯、百度、华为、字节五大云厂商均有自研大模型,形成"云 + 模型"一体化服务
  2. 第三方独立厂商:DeepSeek、月之暗面、智谱 AI、MiniMax 等专注模型研发,通过 API 或开源提供服务
  3. 投资绑定:阿里、腾讯、字节通过投资广泛布局第三方模型公司,形成生态护城河

6.2 趋势观察

  1. 价格战激烈:2024-2025 年各大厂商持续降价,DeepSeek 引领"价格屠夫"策略
  2. 开源成主流:Qwen、ChatGLM、Baichuan、Yi 等开源模型推动行业技术普及
  3. 模型即服务:云平台纷纷推出 MaaS(Model as Service),聚合多家模型
  4. 垂直场景深化:行业大模型(医疗、法律、金融、教育)成为竞争焦点

6.3 选型要点

  • 成本敏感 → DeepSeek、Qwen-Turbo
  • 效果优先 → Qwen-Max、ERNIE-4.0、GLM-4
  • 私有部署 → Qwen、ChatGLM、Baichuan、Yi(开源)
  • 生态整合 → 对应云厂商自研模型
  • 特殊场景 → 语音选讯飞,长文档选 Kimi,代码选 DeepSeek

文档生成时间:2026 年 3 月 注:价格信息可能随时变动,请以各平台官网最新报价为准

国外云厂商与大模型厂商全景纪要(2026)

一、美国三大云厂商及其 AI 服务

云厂商 自研/合作模型 AI 服务平台 定价模式 免费额度
AWS (Amazon) Nova 系列 + 第三方模型 Bedrock 按 Token/包月 有限免费
Google Cloud Gemini 系列 Vertex AI 按 Token/包月 有限免费
Microsoft Azure GPT 系列 + Copilot Azure OpenAI 按 Token 有限免费

二、国外模型四强

模型 厂商 最新版本 定价模式 免费政策
ChatGPT OpenAI GPT-5.4 订阅 + 按量 有限免费
Claude Anthropic Claude 4.6 订阅 + 按量 有限免费
Gemini Google Gemini 3.1 Pro 订阅 + 按量 有限免费
Grok xAI Grok 4.20 订阅制 X Premium 捆绑

2.1 ChatGPT (OpenAI)

  • 模型系列:GPT-5.4、GPT-5.4-mini、GPT-4o、o3/o4(推理模型)

  • 订阅套餐

    套餐 价格 权益
    Free $0 GPT-4o 有限调用
    Plus $20/月 无限 GPT-5.4,优先访问新功能
    Pro $200/月 更高调用限额,o4 模型访问
    Team $25/人/月 团队协作功能
    Enterprise 定制 企业级安全与合规
  • API 定价(按 Token 计费)

    模型 输入价格 输出价格 上下文长度
    GPT-5.4 $2.50/1M tokens $15/1M tokens 105 万 tokens
    GPT-5.4-mini $0.15/1M tokens $0.60/1M tokens 50 万 tokens
    GPT-4o $2.50/1M tokens $10/1M tokens 12.8 万 tokens
    o3 $15/1M tokens $60/1M tokens 20 万 tokens
    o4 $20/1M tokens $80/1M tokens 20 万 tokens
  • 特点:行业标杆,生态最完善,插件和应用市场丰富

  • 免费政策:免费版可使用有限次 GPT-4o

2.2 Claude (Anthropic)

  • 模型系列:Claude 4.6 Sonnet、Claude 4.6 Opus、Claude 4.6 Haiku

  • 订阅套餐

    套餐 价格 权益
    Free $0 有限调用,Claude 4.6 Sonnet
    Pro $20/月 5 倍调用限额,优先访问
    Team $25/人/月 团队协作,管理后台
    Enterprise 定制 企业级功能
  • API 定价

    模型 输入价格 输出价格 上下文长度
    Claude 4.6 Sonnet $3/1M tokens $15/1M tokens 20 万 tokens
    Claude 4.6 Opus $5/1M tokens $25/1M tokens 100 万 tokens (beta)
    Claude 4.6 Haiku $0.25/1M tokens $1.25/1M tokens 20 万 tokens
  • 特点:安全性强,长上下文(200K+),代码和写作能力优秀

  • 免费政策:免费版有每日调用限制

2.3 Gemini (Google)

  • 模型系列:Gemini 3.1 Flash、Gemini 3.1 Pro、Gemini 3.1 Ultra

  • 订阅套餐(Google One AI Premium)

    套餐 价格 存储 权益
    Plus $7.99/月 200GB Gemini Advanced,Google 应用整合
    Pro $19.99/月 2TB 更高优先级,家庭共享
    Ultra $249.99/月 30TB 企业级功能,最高优先级
  • API 定价(Vertex AI)

    模型 输入价格 输出价格 上下文长度
    Gemini 3.1 Flash $0.075/1M tokens $0.30/1M tokens 100 万 tokens
    Gemini 3.1 Pro $2/1M tokens $12/1M tokens 100 万 tokens
    Gemini 3.1 Ultra 定制报价 定制报价 200 万 tokens
  • 特点:Google 生态整合(Search、Workspace、Android),多模态能力强

  • 免费政策:Gemini 基础版免费,Advanced 需订阅

2.4 Grok (xAI)

  • 模型系列:Grok 4.20、Grok 4.20V(多模态)

  • 订阅套餐

    套餐 价格 权益
    X Premium $8/月 Grok 基础访问
    X Premium+ $16/月 无限 Grok,无广告
    X Enterprise 定制 企业功能
  • 特点:实时 X(Twitter) 数据整合,幽默风格,实时信息获取

  • 免费政策:需订阅 X Premium 才能使用


三、其他小众模型厂商

厂商 代表模型 类型 定价模式 特点
Cohere Command R+ 闭源 按量 + 订阅 企业 NLP,多语言
Mistral AI Mistral Large、Mixtral 开源 + 闭源 按量 + 订阅 欧洲之星,高效模型
AI21 Labs Jurassic-2 闭源 按量计费 以色列,长文本生成
Inflection AI Pi 闭源 免费 + 订阅 个人 AI 助手
Character.ai Character 模型 闭源 订阅制 角色扮演,虚拟人物
Perplexity Pro 模型 闭源 订阅制 AI 搜索,引用来源
Stability AI Stable Diffusion 3 开源 + 闭源 开源免费,API 收费 图像生成
Midjourney MJ v6 闭源 订阅制 图像生成,艺术风格
Runway Gen-2 闭源 订阅制 视频生成
D-ID D-ID 模型 闭源 订阅制 数字人,视频合成

3.1 Cohere

  • 总部:加拿大
  • 模型:Command R、Command R+、Embed
  • 定价
    • Command R:$0.50/1M tokens(输入),$1.50/1M tokens(输出)
    • Command R+:$2.50/1M tokens(输入),$10/1M tokens(输出)
  • 特点:企业级 NLP,多语言支持,RAG 优化

3.2 Mistral AI

  • 总部:法国
  • 模型:Mistral 7B、Mixtral 8x7B、Mistral Large、Codestral
  • 定价
    • Mistral Small:€0.20/1M tokens(输入),€0.60/1M tokens(输出)
    • Mistral Large:€2/1M tokens(输入),€6/1M tokens(输出)
  • 特点:开源模型性能优异,欧洲 AI 代表,代码模型 Codestral

3.3 AI21 Labs

  • 总部:以色列
  • 模型:Jurassic-2、Jurassic-2 Ultra
  • 定价:按量计费,具体价格需咨询
  • 特点:长文本生成,文档理解

3.4 Inflection AI - Pi

  • 总部:美国
  • 模型:Pi(Personal Intelligence)
  • 定价:基础免费,高级功能订阅中
  • 特点:情感化 AI 助手,对话体验优秀

3.5 Perplexity AI

  • 总部:美国

  • 模型:Perplexity Pro(基于多模型)

  • 订阅套餐

    套餐 价格 权益
    Free $0 基础搜索,有限查询
    Pro $20/月 无限搜索,文件上传,API 访问
    Team $25/人/月 团队协作
  • 特点:AI 搜索引擎,实时信息,引用来源

3.6 Stability AI

  • 总部:英国
  • 模型:Stable Diffusion 3、Stable Video、Stable Audio
  • 定价
    • 开源模型:免费(本地部署)
    • API:$0.0035/生成(SD 3)
  • 特点:开源图像生成领导者

3.7 Midjourney

  • 总部:美国

  • 模型:Midjourney v6、Niji(动漫风格)

  • 订阅套餐

    套餐 价格 生成限额
    Basic $10/月 200 张
    Standard $30/月 15 小时/月(约 900 张)
    Pro $60/月 30 小时/月(约 1800 张)
    Mega $120/月 60 小时/月(约 3600 张)
  • 特点:艺术风格图像生成,Discord 社区

3.8 Runway

  • 总部:美国

  • 模型:Gen-2、Gen-3 Alpha

  • 订阅套餐

    套餐 价格 权益
    Free $0 有限生成
    Standard $15/人/月 125 积分/月
    Pro $35/人/月 625 积分/月
    Unlimited $95/人/月 无限生成
  • 特点:视频生成,创意工具套件


四、云厂商 AI 服务详解

4.1 AWS (Amazon Web Services)

AI 服务平台:Amazon Bedrock

  • 提供模型

    • 自研:Nova 系列
    • 第三方:Claude (Anthropic)、Llama (Meta)、Cohere、AI21、Mistral
  • 定价模式

    套餐类型 价格 权益
    按需付费 按 Token 计费 无承诺,灵活使用
    普通套餐 $3/月 基础模型访问
    专业套餐 $20/月 高级模型,更高限额
    企业套餐 定制报价 专属支持,SLA 保障
  • API 定价示例

    模型 输入价格 输出价格
    Claude 3.5 Sonnet $3/1M tokens $15/1M tokens
    Llama 3 70B $0.72/1M tokens $0.72/1M tokens
    Mistral Large $2/1M tokens $6/1M tokens
    Nova Pro $1/1M tokens $4/1M tokens
  • 特点:模型选择最多,企业级安全,与 AWS 生态深度整合

  • 免费政策:新用户 AWS Free Tier 包含有限额度

4.2 Google Cloud

AI 服务平台:Vertex AI + Google AI Studio

  • 提供模型

    • 自研:Gemini 系列、PaLM 2、Codey
    • 第三方:Claude、Llama、Mistral(通过 API)
  • 定价模式

    套餐类型 价格 权益
    按需付费 按 Token 计费 无承诺,灵活使用
    Google One AI Plus $7.99/月 Gemini Advanced,200GB 存储
    Google One AI Pro $19.99/月 更高优先级,2TB 存储
    Google One AI Ultra $249.99/月 企业级,30TB 存储
  • API 定价示例(Vertex AI)

    模型 输入价格 输出价格
    Gemini 2.0 Flash $0.075/1M tokens $0.30/1M tokens
    Gemini 2.0 Pro $1.25/1M tokens $5/1M tokens
    Claude 3.5 Sonnet $3/1M tokens $15/1M tokens
  • 特点:Google 生态整合,多模态能力强,价格竞争力强

  • 免费政策:Google AI Studio 有免费额度(约 60 次/分钟)

4.3 Microsoft Azure

AI 服务平台:Azure OpenAI Service + Azure AI

  • 提供模型

    • OpenAI:GPT-4o、GPT-5、DALL-E 3、Whisper
    • 自研:Phi 系列、MAI-1
    • 第三方:Meta Llama、Mistral、Cohere
  • 定价模式

    套餐类型 价格 权益
    按需付费 按 Token 计费 无承诺,灵活使用
    Copilot Pro $20/月 Office 整合,优先访问
    Copilot Enterprise $30/用户/月 企业级功能
    企业套餐 定制报价 专属部署,SLA 保障
  • API 定价示例(Azure OpenAI)

    模型 输入价格 输出价格 上下文长度
    GPT-5.4 $2.50/1M tokens $15/1M tokens 105 万 tokens
    GPT-5.4-mini $0.15/1M tokens $0.60/1M tokens 50 万 tokens
    GPT-4o $2.50/1M tokens $10/1M tokens 12.8 万 tokens
    GPT-5.4 Cached Input $0.18/1M tokens - -
    o3 $15/1M tokens $60/1M tokens 20 万 tokens
    o4 $20/1M tokens $80/1M tokens 20 万 tokens
  • 特点:OpenAI 独家合作,Office 365 整合,企业市场领先

  • 免费政策:新用户 Azure Free Tier 包含 $200 额度


五、云厂商与模型厂商的关系

5.1 投资/独家合作关系

云厂商 合作模型公司 关系类型 投资金额
Microsoft OpenAI 独家合作 + 投资 $130 亿+
Google Anthropic 投资 + 合作 $20 亿+
AWS Anthropic 战略合作 $40 亿+
AWS Cohere 投资 + 合作 未披露
Google Mistral AI 合作 未披露

5.2 模型托管关系

云平台 托管的第三方模型
AWS Bedrock Claude、Llama、Cohere、AI21、Mistral、Nova
Google Vertex AI Claude、Llama、Mistral、Gemini
Azure AI GPT、Llama、Mistral、Cohere、Phi

5.3 关系图谱

┌─────────────────────────────────────────────────────────────┐
│                  国外大模型生态关系图                        │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  Microsoft ──投资$130 亿──→ OpenAI (ChatGPT/GPT-5.4)         │
│     │                       Azure OpenAI 独家合作            │
│     └──自研──→ Phi 系列、MAI-1、Copilot                     │
│                                                             │
│  Google ───投资$20 亿───→ Anthropic (Claude 4.6)            │
│     │                       多平台合作                       │
│     └──自研──→ Gemini 3.1 系列、PaLM、Codey                 │
│                                                             │
│  AWS ─────投资$40 亿───→ Anthropic (Claude 4.6)             │
│     │                       Bedrock 主力模型                 │
│     └──自研──→ Nova 系列                                    │
│                                                             │
│  xAI (Elon Musk) ──自研──→ Grok 4.20 系列                    │
│                            与 X(Twitter) 整合                 │
│                                                             │
│  Meta ───自研开源──→ Llama 系列                             │
│                        通过云平台提供 API                     │
│                                                             │
│  独立厂商:Cohere、Mistral、AI21、Stability AI、Midjourney  │
│                                                             │
└─────────────────────────────────────────────────────────────┘

六、免费 vs 商业模型汇总

6.1 完全免费(开源)

模型 厂商 许可协议 商用限制
Llama 3/3.1/3.2 Meta Llama Community License 可商用(有限制)
Mistral 7B / Mixtral Mistral AI Apache 2.0 可商用
Stable Diffusion Stability AI CreativeML Open RAIL 可商用
Falcon TII (阿联酋) Apache 2.0 可商用
Gemma Google Gemma License 可商用

6.2 有限免费(免费额度/试用)

平台 免费政策 限制说明
ChatGPT GPT-3.5 免费,GPT-4o 有限 每日限额
Claude 免费版可用 Sonnet 每日调用限制
Gemini 基础版免费 Advanced 需订阅
Perplexity 基础搜索免费 Pro 功能需订阅
Pi (Inflection) 基础功能免费 -
AWS Bedrock 新用户 Free Tier 有限额度
Azure OpenAI 新用户$200 额度 一次性
Google Vertex AI 免费额度 约 60 次/分钟

6.3 纯商业(订阅/API 收费)

模型/服务 厂商 起步价格
GPT-5.4/GPT-4o OpenAI $20/月 (Plus)
Claude 4.6 Opus Anthropic $20/月 (Pro)
Gemini Advanced Google $7.99/月
Grok 4.20 xAI $8/月 (X Premium)
Command R+ Cohere 按量计费
Mistral Large Mistral €2/1M tokens
Midjourney Midjourney $10/月
Runway Gen-3 Runway $15/月

七、价格对比与选型建议

7.1 订阅套餐对比

服务 基础套餐 专业套餐 企业套餐
ChatGPT Plus $20/月 Pro $200/月 Enterprise 定制
Claude Pro $20/月 Team $25/人/月 Enterprise 定制
Gemini Advanced $7.99/月 Pro $19.99/月 Ultra $249.99/月
Grok (X Premium) $8/月 Premium+ $16/月 Enterprise 定制
Copilot Pro $20/月 Enterprise $30/人/月 -
Perplexity Pro $20/月 Team $25/人/月 -
Midjourney Basic $10/月 Pro $60/月 Mega $120/月

7.2 API 价格对比(每 1M tokens)

模型 输入价格 输出价格 上下文长度 性价比
Gemini 3.1 Flash $0.075 $0.30 100 万 ⭐⭐⭐⭐⭐
GPT-5.4-mini $0.15 $0.60 50 万 ⭐⭐⭐⭐⭐
Claude 4.6 Haiku $0.25 $1.25 20 万 ⭐⭐⭐⭐
Llama 3 70B (AWS) $0.72 $0.72 12.8 万 ⭐⭐⭐⭐
Gemini 3.1 Pro $2.00 $12.00 100 万 ⭐⭐⭐⭐
GPT-4o $2.50 $10.00 12.8 万 ⭐⭐⭐
GPT-5.4 $2.50 $15.00 105 万 ⭐⭐⭐
Claude 4.6 Sonnet $3.00 $15.00 20 万 ⭐⭐⭐
Claude 4.6 Opus $5.00 $25.00 100 万 ⭐⭐
o3 (推理) $15 $60 20 万 ⭐⭐
o4 (推理) $20 $80 20 万

7.3 按场景推荐

场景 推荐模型 理由
通用对话 GPT-5.4、Claude 4.6 Sonnet 综合能力最强
代码生成 GPT-5.4、Claude 4.6、Codestral 代码能力专项优化
长文档处理 Claude 4.6 (200K)、Gemini 3.1 (1M+) 超长上下文支持
实时信息 Grok 4.20、Perplexity 实时数据整合
图像生成 Midjourney、DALL-E 3、SD3 图像质量优秀
视频生成 Runway Gen-3、Pika 视频生成专业
企业应用 Azure OpenAI、AWS Bedrock 企业级安全与合规
性价比 Gemini 3.1 Flash、GPT-5.4-mini 价格低效果好
开源部署 Llama 3、Mistral、Gemma 开源生态完善

八、总结

8.1 市场格局

  1. 三云鼎立:AWS、Google、Microsoft 三大云厂商通过投资和合作控制主流模型资源
  2. 模型四强:ChatGPT、Claude、Gemini、Grok 代表不同技术路线和生态定位
  3. 开源力量:Meta Llama、Mistral 等开源模型推动技术普及
  4. 垂直领域:Midjourney(图像)、Runway(视频)、Perplexity(搜索)等深耕细分场景

8.2 投资关系总结

投资方 被投公司 金额 战略意义
Microsoft OpenAI $130 亿+ GPT 独家云合作
AWS Anthropic $40 亿+ Claude 主力托管
Google Anthropic $20 亿+ 多平台合作
Salesforce Cohere 未披露 企业 NLP
NVIDIA Mistral 未披露 硬件 + 模型合作

8.3 趋势观察

  1. 订阅制主流:C 端产品普遍采用 $20/月订阅模式
  2. 价格分层:Lite/Pro/Ultra 多层套餐满足不同需求
  3. 生态整合:模型与云、办公、搜索产品深度整合
  4. 开源闭源并行:大厂同时提供开源和闭源模型
  5. 多模态竞争:文本、图像、视频、语音全栈能力

8.4 选型要点

  • 个人用户:ChatGPT Plus、Claude Pro、Gemini Advanced($20/月三选一)
  • 开发者:根据云平台选择(AWS/Azure/GCP)
  • 企业用户:Azure OpenAI(合规)、AWS Bedrock(模型多样)
  • 成本敏感:Gemini 3.1 Flash、GPT-5.4-mini、开源模型
  • 特殊需求
    • 实时信息 → Grok 4.20、Perplexity
    • 图像生成 → Midjourney、DALL-E 3
    • 视频生成 → Runway、Pika
    • 长文档 → Claude 4.6、Gemini 3.1

文档生成时间:2026 年 3 月 注:价格信息可能随时变动,请以各平台官网最新报价为准

中美云厂商大模型套餐与生态差异:为什么国内更"卷"?

一、核心差异:套餐丰富度与生态开放度

1. 包月套餐差异对比

对比维度 国内云厂商(阿里/火山/百度/腾讯/华为) 国外云厂商(AWS/Azure/Google Cloud) 核心原因
套餐类型 多档位细分(Lite/Pro/企业版),覆盖个人→团队→企业全场景 以按需计费(Token)和预留容量(PTU)为主,个人包月少 国内个人开发者与中小企业需求旺盛,国外以大型企业为主
价格门槛 极低(如阿里云Coding Plan首月7.9元起) 偏高(GPT-5.2约$0.01/1K Token,Claude约$3/1M Token) 国内竞争激烈,主打"普惠AI";国外走"高价值服务"路线
模型组合 多模型打包订阅(如阿里云Coding Plan接入8款编程模型) 单模型独立计费,跨模型组合少 国内第三方模型多,云厂商主打"一站式选择";国外模型集中度高
附加权益 赠送API调用次数、算力资源、开发工具 以基础模型服务为主,附加服务少 国内注重用户粘性,国外强调核心价值交付

2. 生态丰富度差异

对比维度 国内云厂商 国外云厂商 关键区别
接入模型数量 多(单平台支持10+第三方模型,如火山引擎接入GLM/DeepSeek/MiniMax等) 少(AWS Bedrock约10款,Azure Foundry约8款) 国内第三方模型百花齐放,云厂商"来者不拒";国外模型集中度高,头部效应明显
开源模型支持 全面(通义千问/GLM/MiniMax/Kimi等主流开源模型全覆盖) 有限(以闭源商业模型为主,开源仅Llama/Cohere等少数) 国内开源生态活跃,国外商业模型主导
场景化解决方案 垂直场景定制(如编程/Chat/多模态/企业智能体专项套餐) 通用解决方案为主,场景化订阅少 国内场景碎片化,国外企业需求标准化
本土化适配 中文优化、合规适配、本土工具集成(如飞书/钉钉/微信) 英文为主,全球通用,与本土工具集成弱 国内市场本地化需求强,国外追求全球一致性

二、五大核心原因解析

1. 市场竞争格局不同

  • 国内:大模型领域呈现"百模大战",第三方模型厂商(智谱GLM、MiniMax、月之暗面Kimi等)数量众多,云厂商为抢占市场份额,采取"全量接入+低价促销“策略,形成"模型超市"模式

  • 国外:大模型市场集中度高,形成”寡头垄断"(OpenAI、Anthropic、Google Gemini、xAI Grok四强),云厂商更多是"战略投资+独家合作"(如AWS投资OpenAI,Anthropic首选AWS),而非"广撒网"

2. 用户结构与需求差异

  • 国内

    • 个人开发者与中小企业占比高,对低成本、低门槛的包月套餐需求强烈
    • 追求"模型自由",希望在一个平台上切换使用不同模型
    • 价格敏感度高,促销活动(首月低价、续费折扣)对用户决策影响大
  • 国外

    • 大型企业客户占主导,更注重稳定性、安全性、可扩展性
    • 预算充足,倾向按使用量计费(Token-based)或预留容量(PTU),而非固定包月
    • 对价格敏感度低,更看重模型性能与服务质量

3. 商业模式与盈利逻辑差异

  • 国内:云厂商将大模型视为流量入口,通过低价包月吸引用户,再通过增值服务(如算力升级、定制开发、企业版服务)盈利

  • 国外:大模型本身就是核心盈利产品,云厂商与模型厂商分成,定价策略更注重成本回收与利润最大化

4. 技术路线与开放程度不同

  • 国内

    • 模型厂商与云厂商分工明确:模型厂商专注研发,云厂商提供基础设施与分发渠道
    • 开源模型生态发达(如通义千问开源300+模型),降低了云厂商接入门槛
  • 国外

    • 云厂商自研+投资双管齐下(如Google Gemini、Microsoft Copilot),与第三方模型存在竞争关系
    • 商业模型更倾向闭源,保护核心技术与市场份额

5. 监管环境与合规要求差异

  • 国内

    • 监管要求模型必须备案,云厂商成为合规接入渠道,第三方模型依赖云厂商获取合规资质
    • 数据本地化要求高,云厂商提供的模型服务更符合本土合规标准
  • 国外

    • 监管相对宽松,模型厂商可独立提供服务,云厂商更多是基础设施提供者
    • 数据跨境流动限制少,全球部署更灵活

三、典型案例对比:国内vs国外套餐实例

国内案例:阿里云Coding Plan(2026年2月推出)

  • 套餐档位:Lite(18,000次调用/月,首月7.9元)、Pro(90,000次调用/月,首月39.9元)
  • 接入模型:8款编程专用模型(Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5等)
  • 核心特点:多模型自由切换,一次订阅全场景覆盖,新用户补贴力度大

国外案例:AWS Bedrock Claude 3.5 Sonnet

  • 计费模式:按需计费(输入$3/1M Token,输出$15/1M Token),批量处理50%折扣
  • 接入模型:单模型独立计费,跨模型组合需单独购买
  • 核心特点:企业级服务,注重稳定性与安全性,无个人低价套餐

四、对开发者的实用建议

  1. 个人/中小企业用户:优先选择国内云厂商的包月套餐,性价比极高(如阿里云Coding Plan、火山引擎豆包开发者套餐),适合快速迭代与原型开发

  2. 大型企业/合规要求高:考虑国外云厂商的预留容量(PTU)方案,稳定性与安全性更优,适合生产环境部署

  3. LangChain开发者

    • 国内云厂商多支持OpenAI兼容API,代码改动最小
    • 笔记本无法跑大模型完全不影响使用LangChain,模型推理全在云端进行
    • 国内生态更适合快速测试不同模型,国外生态更适合深度优化单一模型
  4. 成本优化策略

    • 开发阶段:用国内低价包月套餐测试多模型
    • 生产阶段:根据场景选择最优模型,切换到按需计费或预留容量模式

五、总结:差异背后是生态成熟度与市场阶段的不同

中美云厂商的套餐差异本质上是市场发展阶段的体现:国内大模型市场处于快速扩张期
云厂商通过"低价+全量接入"抢占市场;国外市场则进入成熟期
更注重盈利与服务质量。随着国内市场集中度提升,未来套餐价格与生态策略可能会向国外靠拢,但短期内"卷套餐、卷生态"的格局仍将持续。