Chapter 05 · AI工作场景落地实战

大模型厂商
分别在做什么

OpenAI、Anthropic、Google、Meta，以及国内的字节、阿里、DeepSeek——他们不只是在比模型能力，更是在押注完全不同的战略赌注。

一句话结论：各家厂商的差异不是"谁更聪明"，而是"谁控制了什么入口、押注了哪种生态"——理解这些战略，你才能判断哪个工具适合你的场景，以及这场竞争最终会走向哪里。

导览

为什么厂商格局值得普通人了解

很多人选AI工具的方式是"哪个回答更好就用哪个"。这个逻辑没错，但不够用。因为各家厂商的产品能力，是由它们背后完全不同的战略逻辑决定的——OpenAI在押注"AI操作系统"，Anthropic在押注"安全是护城河"，Google在押注"平台数据深度整合"，Meta在押注"开源绑定生态"。这些赌注决定了它们擅长什么、在哪里有不可替代的优势、以及未来会往哪个方向使劲。

这不是要你学会炒股票，而是帮你建立一个更清晰的工具选择框架。比如：你的工作主要在Google Workspace生态里，Google Gemini对你的价值可能高于ChatGPT；你的公司对数据安全要求很高，Anthropic的架构可能是更合适的选择；你是开发者，想在本地跑一个可以商用的模型，Meta的Llama就是专门为你设计的。了解各家在做什么，就是在了解你手里工具的边界和方向。

六家厂商的战略定位——横轴：开放程度，纵轴：研究/产品侧重（示意性，非精确评分）

小节一

OpenAI

OpenAI：先发优势与"AI操作系统"野心

消费端入口 · 垂直整合 · GPT-5

OpenAI目前拥有AI行业最大的消费端入口。ChatGPT每周活跃用户超过4亿，到2025年，全球80%的财富500强企业已在使用GPT系列模型。OpenAI 企业AI报告 2025 这个用户规模是任何竞争对手都难以短期复制的护城河——不是技术护城河，而是习惯护城河。

但OpenAI真正在押注的，不只是"最好的模型"，而是把ChatGPT做成一个AI时代的操作系统。OpenAI产品负责人曾公开把ChatGPT比作智能手机里的操作系统——一个中央界面，统一调度所有AI能力，未来甚至可能拓展到智能眼镜等新硬件入口。沿着这个逻辑，OpenAI开始做垂直整合：GPT-5发布后迅速覆盖企业端，与Spotify、Zillow、Mattel等行业巨头签署深度集成合作，把AI嵌进金融、房地产、零售等具体行业的工作流程。a16z State of Consumer AI 2025

2025年4月发布的o3和o4-mini，首次把推理、网络搜索、代码执行、文件分析整合进同一个推理流程，实现了"工具调用无缝化"——你不需要切换不同的模式，模型会自己决定什么时候搜网、什么时候写代码、什么时候直接回答。这是ChatGPT从"问答工具"向"执行助手"转型的关键一步。

核心优势

最大消费端用户基础（4亿+/周）
开发者生态最成熟（API生态）
o系列推理模型领先
企业合作最广泛

相对弱势

无原生数据平台（Workspace等）
定价偏高，成本压力来自开源
公司治理结构复杂（非营利转营利）
完全依赖微软Azure基础设施

适合你的情况

你需要一个"能力最全面、工具生态最丰富"的通用AI助手，且不担心数据上云——ChatGPT/GPT-5 仍然是最成熟的选择。企业API集成、代码开发、复杂推理任务，OpenAI的生态支持是目前最完整的。

小节二

Anthropic

Anthropic：安全是护城河，开发者基础设施是战略

Constitutional AI · MCP · 企业安全

Anthropic由OpenAI前核心成员达里奥·阿莫迪（Dario Amodei）和丹妮拉·阿莫迪（Daniela Amodei）于2021年创立，核心出发点就是"安全优先"——他们离开OpenAI，部分原因正是对公司安全方向产生了分歧。这个DNA直接体现在产品上：Claude从一开始就以"更可控、更遵守指令、在敏感场景下更稳定"著称。

Anthropic独创了一套训练方法叫"宪法AI"（Constitutional AI）：给模型一份"行为宪法"，明确列出它应该遵守的原则，然后用这些原则来指导模型的训练和自我评估。这让Claude在处理敏感话题、复杂合规要求、多轮复杂指令时，表现出更高的一致性和可预测性。Anthropic 官网，Constitutional AI

但Anthropic真正可能改变整个AI行业格局的一步，是2024年11月推出的MCP（模型上下文协议，Model Context Protocol）——一个开放标准，让AI模型可以统一、安全地连接各种外部数据源和工具（数据库、文档库、企业软件）。2025年3月，OpenAI宣布接受MCP标准；同年谷歌DeepMind也宣布Gemini支持MCP；2025年12月，Anthropic把MCP捐赠给Linux基金会管理，成为真正的行业基础设施。Anthropic 官网；Wikipedia MCP 这类似于Anthropic设计了USB接口标准，而所有设备都必须支持它——控制了标准，就控制了生态。

MCP的战略意义：谁制定标准，谁就赢了生态

MCP之于AI Agent，相当于HTTP之于互联网——定义了AI如何连接外部世界的通用协议。当所有AI都基于MCP来访问工具和数据源，Anthropic就成了这套基础设施的制定者。即使未来有更强的模型，只要它们使用MCP标准，都在某种程度上在Anthropic建立的规则框架里运转。这是一个教科书级别的平台战略。

在资本上，Anthropic获得了亚马逊超过40亿美元的战略投资，Claude被深度整合进AWS的云服务体系——这意味着所有在AWS上运行的企业应用，都有了一条把Claude嵌入工作流的直接通道。Microsoft Azure Blog；Anthropic官网

核心优势

长文档处理和复杂指令遵循最强
MCP开放标准制定者
AWS深度整合（企业客户）
安全合规可信度最高

相对弱势

消费端用户规模远小于ChatGPT
无搜索/Workspace等平台入口
品牌知名度在普通用户中偏低
主要依赖API和企业客户

适合你的情况

你需要处理大量长文档（合同审查、报告分析、技术文档梳理），或者你所在行业对AI的安全合规要求较高（金融、法律、医疗）——Claude的稳定性和可控性在这些场景的优势最为明显。开发者如果在搭建Agent系统，MCP生态的成熟度也让Anthropic成为首选的基础设施方向。

小节三

Google

Google：平台深度整合，数据是真正的护城河

Workspace · 搜索实时性 · Gemini

Google在AI这场战争里的处境，比外界想象的更微妙。它坐拥全球最大的搜索引擎、最多的用户数据、最成熟的企业办公套件（Gmail、Docs、Sheets、Drive、Calendar），以及写出 Transformer 论文的那批顶尖研究者。按理说，这应该是最占优势的位置。

但"Code Red"那一刻（2022年底ChatGPT引发的内部警报）揭示了一个现实：掌握资源，不等于能快速行动。Google被自己的搜索广告业务绑住了手脚——它不敢轻易把对话式AI做得"太好"，因为那会让用户绕过广告点击直接得到答案。这个创新者困境，在第3章我们已经详细讲过。

不过，Google真正的护城河是另外两件事。第一是Workspace深度整合：Gemini可以原生访问你的Gmail、Google Docs、Sheets、Calendar，这是OpenAI和Anthropic无法复制的——它们要做同样的事，需要用户额外授权和配置，而Gemini直接就在你的文件里。对一个整个工作都在Google生态里的团队来说，这种无缝程度没有替代品。MindStudio，Anthropic vs OpenAI vs Google agent strategy, 2025

第二是实时搜索接地（Search Grounding）：任何需要最新信息的AI任务——市场动态、股价、新闻事件——Gemini可以直接接入Google搜索实时查询，这是其他所有模型需要额外插件或API才能实现的。2025年，Google还发布了开源的Agent Development Kit（ADK）和 Agent2Agent（A2A）通信协议，为构建多Agent系统提供了一套与平台无关的标准框架。Google Cloud Blog 2025

Gemini的三个不可复制优势：都来自Google几十年的平台积累

核心优势

Workspace原生整合（无可替代）
实时搜索接地（最新信息）
最长上下文（1M token）
DeepMind顶级研究深度

相对弱势

消费端产品行动速度慢
创新者困境（搜索广告依赖）
Gemini品牌认知弱于ChatGPT
对话体验仍落后于Claude/GPT

Gemini 在 Workspace 里能做什么——真实场景

跨应用自动化：你在Gmail收到一封客户的需求邮件，对Gemini说"把这封邮件的需求整理成一份Google Docs方案大纲，然后在日历里给相关同事排一个下周三的对齐会"——三步操作，Gemini原生完成，数据不离开Google生态。

实时信息查询：你在做竞品分析，对Gemini说"帮我查一下这家公司过去一周的公开动态，结合他们的融资记录，给我判断他们接下来可能的产品方向"——Gemini实时接入Google Search，结合你提供的文件，几秒内给出综合分析。

出行与日程："帮我找下周二飞北京最便宜的早班机，比较一下价格后加到我的日历，同时给老板发一封出差申请邮件，抄送HR"——Google Flights + Gmail + Calendar的三向联动，Gemini原生支持。

适合你的情况

你和你的团队主要在Google Workspace里工作（Gmail、Docs、Sheets），或者你的工作强依赖实时信息（市场分析、新闻跟踪、竞品动态）——Gemini在这两个场景里有其他厂商无法复制的原生优势。如果你不在Google生态里，这两个优势基本消失。

小节四

Meta：开源是战略，不是慈善

Llama 4 · 开源赌注 · 开发者生态

Meta的AI战略有一个让很多人困惑的特征：它把最先进的模型全部开源，任何人免费下载、修改、商用。Llama 2（2023年）、Llama 3（2024年）、Llama 4（2025年）一路开源。这和OpenAI、Anthropic的做法截然相反。扎克伯格说过一句话，把这件事说得很透彻："卖AI模型不是我们的商业模式。"Meta AI官方博客，Llama 4, 2025

Meta真正的商业模式还是广告：更好的AI → WhatsApp/Instagram/Messenger用户粘性更高 → 更多使用时长 → 更多广告收入。把模型开源，Meta得到的是：数千家公司和开发者帮它测试、改进、完善模型；整个开源生态在Llama的基础上发展，反过来推动Llama持续迭代；以及25个以上的云合作伙伴（NVIDIA、Databricks、Snowflake等）付费托管Llama实例，实际上给Meta带来了相当可观的间接收益。Motley Fool, Meta开源AI策略分析, 2025

2025年发布的Llama 4有两个版本：Scout（170亿激活参数，单张H100可运行）和Maverick（170亿激活参数、128个专家，单台H100服务器可运行）。Llama 4 Maverick的推理成本约为GPT-4o的10%，同时支持原生多模态（文字+图片+视频）和200种语言。对中小企业和开发者来说，这意味着以极低的成本就能部署一个前沿级别的多模态模型。Meta AI Blog, Llama 4 Herd, 2025

开源的真实影响：为什么这个赌注可能赢得长期

当一个行业的基础设施变成开源的，通常意味着商业竞争从"谁有最好的模型"转向"谁在模型之上提供最好的服务"。MySQL开源了，Oracle并没有消亡，但整个数据库行业的入场门槛大幅降低了。如果Llama系列最终成为AI基础模型的"Linux"，Meta就相当于掌握了整个AI应用生态的源头——这比卖模型API赚的钱要深远得多。

核心优势

完全开源可本地私有化部署
成本极低（GPT-4o的10%）
原生多模态+200语言
无供应商锁定，可随意定制

相对弱势

无直接面向B端的AI助手产品
开源意味着能力被竞争者复制
消费端AI产品（Meta AI）弱
商业支持和SLA弱于闭源厂商

适合你的情况

你是开发者或技术团队，需要在自己的服务器上部署一个可商用、可定制的AI模型；或者你的公司对数据不出网有严格要求；或者你的业务需要针对特定领域做微调训练——Llama系列是目前最成熟的私有化部署选择，DeepSeek R1在推理能力上是另一个重要选项。

小节五

xAI与国内厂商：各有独特的数据与场景优势

xAI · DeepSeek · 字节 · 阿里 · 百度

除了上面四家之外，还有两类玩家不能忽略——xAI（马斯克的AI公司）和中国厂商。它们的战略逻辑和上面四家都不一样。

xAI / Grok：实时数据是核心差异化

马斯克创立xAI的核心赌注是：X（前Twitter）是全球最好的实时数据源。他说过，X平台拥有"目前世界上最好的实时数据流"，而Grok接入这个数据流的方式，是其他任何模型都无法复制的——因为他同时拥有X和xAI。2025年3月，xAI正式收购了X Corp，两者合并为X.AI Holdings，估值约1130亿美元。Fortune; Wikipedia Grok; decrypt.co 2025

Grok目前已获得了美国国防部约2-3亿美元的政府合同，xAI整体估值约2300亿美元。马斯克表示，Grok 5将是一个六万亿参数的超大模型，同时支持文字、图片、视频、音频。但对普通商业用户来说，xAI目前最大的使用场景还是在X平台内嵌的对话入口，和独立的Grok应用。

中国厂商：从"对标"走向"应用落地"

国内大模型的竞争格局，在2025年经历了一次明显的分层。技术层面，DeepSeek R1的出现重新定义了国内模型的能力上限——它以极低成本实现了对标国际顶级推理模型的表现，开源冲击了全球市场。但在用户规模层面，格局却是另一个样子。

来源：QuestMobile 2025年2月AIGC APP月活数据；各公司公开信息

国内的竞争焦点正在从"谁的模型能力更强"转向"谁能在具体应用场景里落地"。字节跳动凭借抖音的流量入口和内容创作场景，把豆包做到了超过1亿月活；阿里通义依托阿里云的企业客户基础，在API调用量上占据市场第一；百度文心的技术优势逐渐被追平，月活下滑明显；月之暗面（Kimi）在长文本处理上形成差异化，成为估值最高的非上市大模型独角兽之一。QuestMobile 2025；幂简集成中国AI大模型报告 2025

对中国用户来说，国内厂商的核心优势是：对中文语境理解更深、与国内企业系统（钉钉、企业微信、飞书）整合更紧密、以及不需要担心数据跨境合规问题。DeepSeek尤其值得特别关注——它既是技术层面最接近国际前沿的国内模型，又是完全开源的，这让它在国内企业私有化部署市场上有很强的竞争力。

阿里的生态野心：从点奶茶到飞书，千问要成为中国版"AI操作系统"

如果说OpenAI在押注"ChatGPT成为AI时代的操作系统"，阿里在押注的是同一件事的中国版——用千问App作为C端入口，把阿里旗下的高德地图、淘宝、钉钉全部打通。你在千问里说一句"帮我找附近评分4.8以上的川菜馆，顺便查一下今晚有没有堵车"，高德返回结果，直接导航；说"帮我在淘宝比一下这款耳机最近30天的价格走势，如果低于350就下单"，AI Agent帮你全程执行。这种场景，用的不只是大模型的语言理解能力，而是把它变成了调度整个阿里生态的"语音助手升级版"。新浪财经，阿里全力转向C端 2025.11；OFweek AI 2025.11

企业侧，阿里在2026年2月发布了 CoPaw——国内版的 OpenClaw，直接对标这个爆火的开源Agent框架。CoPaw可以接入钉钉、飞书、QQ、Discord、iMessage，用户在哪个聊天App里发消息，CoPaw就在哪里回复并执行任务。支持本地部署（Linux/Mac/Windows均可）和云端一键部署，内置技能覆盖文档编辑、邮件管理、新闻摘要、股价监控、日历整理等日常工作场景，并于2026年2月28日完全开源。IT之家 2026；阿里云开发者社区钉钉一侧，阿里的目标更激进：拍一张手绘的功能草图，不写一行代码，AI直接生成一个可用的轻应用。

一个白领的真实场景：千问 + 钉钉 + 飞书的组合用法

早上9点，你在钉钉收到通知：CoPaw已经把你昨晚要求的"本周所有未回邮件"整理成了一份摘要，重要程度已排序。你在飞书文档里说一句"帮我把这份竞品分析的要点提炼成5条，写成可以直接发给老板的格式"，通义千问在3秒内完成。下午你要出差，打开千问App，说"帮我订明天上午10点前到上海的最便宜机票，靠窗座位"——高德和淘宝旅行的接口被调用，比价结果直接返回。

这套组合2025年底已初步可用，2026年随着Agent能力成熟正在快速补全。

字节跳动的豆包走的是另一条路：不是"打通生活服务"，而是深入内容创作和职场表达场景。依托抖音的创作者生态，豆包在视频脚本生成、短视频文案、直播话术优化等场景做到了极细的打磨，月活超过1亿，并持续向企业办公（飞书集成）延伸。两家的分化方向很明显：阿里押注"生活服务调度"，字节押注"内容与表达增强"。

小节六

AI编程工具：长在大模型之上的第一批杀手级应用

Cursor · Claude Code · AI编程新范式

讲完六大厂商的模型战略，有一类应用层产品必须单独讲——AI编程工具。它不是某家厂商的直接产品，而是建在大模型之上的一个独立应用层，却已经产生了足以改变整个软件行业节奏的商业规模。更重要的是，它是目前最能说明"大模型能力变成生产力"这个命题的具体案例。

Cursor的故事值得单独讲一段。它是一家只有几十人的小公司，产品是一个内嵌了AI能力的代码编辑器（基于VS Code改造）。它不自研模型，而是接入Claude和GPT作为后端，把核心精力放在"如何让AI能力真正嵌入开发工作流"这件事上。结果是：2025年11月，它完成融资后估值达到293亿美元，年化收入超过10亿美元，日活用户超过100万，财富500强中超过一半的公司已经在使用。这个数字放在任何行业都是爆炸性的。

Claude Code的逻辑则完全不同。Anthropic没有做一个"聪明的代码补全"，而是做了一个终端优先的自主编程 Agent——你给它一个任务，它能自己打开文件、运行测试、修 bug、甚至修改自己的代码。SWE-bench是软件工程任务的标准测试，Claude Code的得分是77.2%，这意味着在软件工程任务里，它在四分之三以上的情况下能做对——这在两年前是无法想象的数字。它的上下文窗口是100万token，相当于可以同时看完整个中型代码库。

普通人的感知：不写代码的人为什么也该关注这件事

AI编程工具的出现，正在让"从想法到产品"的门槛急速下降。以前，一个有想法但不会编程的人，需要找开发者或者外包团队来实现，至少需要几个月和几万元。现在，借助Cursor或Claude Code，一个愿意学习基本提示词的非技术人员，能够在几天内把一个有明确功能需求的工具原型做出来。这不代表不需要工程师，但它确实改变了"谁能启动一个想法"这件事的门槛。软件开发正在经历的变化，和100年前流水线改变制造业的逻辑是一样的。

从更大的视角看，Cursor和Claude Code代表的是这场AI竞争里的一个新层次：应用层公司用大模型的能力做出了真正的生产力工具，而不仅仅是聊天界面的包装。这个层次的竞争才刚刚开始——AI编程只是第一批，接下来会出现AI设计、AI法律、AI财务分析等各个专业领域的同类产品。未来2-3年，你在日常工作里接触到的大量AI工具，都会走这条"建在大模型之上的专业应用"路线。

最快成熟的AI Agent品类：代码

代码之所以最先被AI攻克，是因为代码有明确的对错标准（能不能运行、测试通不通），这让AI可以自我验证和迭代。这是推理模型、Agent能力和代码场景三者的完美咬合。AI编程工具是大模型时代第一个真正意义上的杀手级应用层——它告诉我们，下一个被攻克的场景，一定也是那个有明确验证标准的专业领域。

来源：Cursor官方披露 2025.11 · Anthropic Claude Code发布博客 2025.05 · SWE-bench leaderboard 2025

小节七 · 实用总结

怎么选：不同场景匹配不同厂商

把上面讲的逻辑压缩成一张选择地图——不是说哪家"最好"，而是说在什么情况下哪家的优势最突出。

你的场景	首选	理由
通用工作助手，写作/分析/编程	ChatGPT / GPT-5	生态最全，工具链最完整，入门门槛最低
长文档分析、合规敏感场景	Claude（Anthropic）	长上下文处理最强，指令遵循一致性最高，安全合规可信度最高
全天在Google Workspace工作	Google Gemini	原生访问Gmail/Docs/Drive，实时搜索接地，替换成本为零
需要私有化部署/本地化运行	Meta Llama 4 / DeepSeek R1	完全开源，可商用，成本极低，数据不出网
实时信息追踪（新闻/市场动态）	Google Gemini / Grok	Gemini有Search接地，Grok有X实时数据流
中文场景/国内企业系统整合	豆包 / 通义 / Kimi	中文理解更深，国内系统整合更紧密，合规更简单
构建AI Agent系统（开发者）	Anthropic Claude（MCP生态）	MCP已成行业标准，OpenAI/Google均已接入，基础设施最稳
AI辅助编程/代码开发	Cursor · Claude Code	Cursor模型无关、工作流最成熟；Claude Code自主Agent能力最强，适合复杂任务

最后一点值得强调：这张表不是固定的。AI行业的变化速度极快，今天的优势可能6个月后就被追平，今天的弱项可能被某次发布直接补足。更重要的是，这场竞争的终局可能不是"某家赢了所有市场"，而是分场景的生态共存——就像今天的云市场里，AWS、Azure、GCP并存，各自占据不同的行业和客户群体。AI工具市场大概率也会走向这个格局。

他们比的不只是模型，而是入口、生态和标准

历史上每一次平台级技术革命，最终赢家都不只是技术最强的那个，而是掌握了用户入口（OpenAI的ChatGPT）、平台生态（Google的Workspace）、基础设施标准（Anthropic的MCP）或开发者基础（Meta的Llama/DeepSeek的开源生态）的那些。这五个维度，正是今天这场AI竞争真正在较量的地方。

来源：MindStudio 2025 · a16z State of Consumer AI 2025 · QuestMobile 2025 · 各厂商官方发布

五家主要厂商，五种不同的战略赌注：OpenAI押注AI操作系统入口；Anthropic押注安全标准和MCP基础设施；Google押注平台深度整合和实时搜索；Meta押注开源生态绑定；xAI押注实时数据优势。国内市场则正在从能力竞争转向场景落地的下半场。建在大模型之上的应用层已经开始爆发——Cursor和Claude Code是第一批，AI编程工具证明了"专业场景+大模型+真实工作流"的组合能产生杀手级产品。理解这些战略差异和应用层动向，就是理解未来2-3年AI格局演变的地图。

→ 进入 Part 2：Prompt、Skill、Workflow、Agent到底有什么区别

大模型厂商分别在做什么

为什么厂商格局值得普通人了解

OpenAI：先发优势与"AI操作系统"野心

Anthropic：安全是护城河，开发者基础设施是战略

Google：平台深度整合，数据是真正的护城河

Meta：开源是战略，不是慈善

xAI与国内厂商：各有独特的数据与场景优势

xAI / Grok：实时数据是核心差异化

中国厂商：从"对标"走向"应用落地"

阿里的生态野心：从点奶茶到飞书，千问要成为中国版"AI操作系统"

AI编程工具：长在大模型之上的第一批杀手级应用

怎么选：不同场景匹配不同厂商

大模型厂商
分别在做什么