TOPIC RESEARCH · AI AGENT 生态

🧭 OpenAI / ChatGPT Agent 生态全景

Codex · ChatGPT Agent · Agents SDK / AgentKit · GPTs 与 ChatGPT Apps · Atlas 浏览器——每条产品线按「定位 / 目标用户 / 场景 / 成熟度 / 定价」梳理，并与 Anthropic 的路线做一次系统对比。

调研时间：2026-07-05 · 基于 OpenAI / Anthropic 官方文档与主流媒体报道 · 快速迭代领域，请以官方最新文档为准

01⚡ 开篇速览：30 秒版本

如果只读这一段：OpenAI 的 agent 战略不是「一个产品」，而是一套从消费者到开发者的立体入口矩阵。

OpenAI 把「让 AI 替你干活」这件事拆成了五个面向不同人群的产品：Codex 面向开发者（现在也扩展到分析师、销售等知识工作者），在终端、IDE、云端替你写代码干活；ChatGPT Agent 是 ChatGPT 里的「agent 模式」，用自己的虚拟电脑上网、点按钮、做表格，面向普通付费用户；Agents SDK / AgentKit 是给开发者构建自有 agent 的工具箱；ChatGPT Apps（Apps SDK）把第三方应用装进 ChatGPT 对话里，接替了当年的 GPTs；Atlas 则是一个内置 ChatGPT 的浏览器，把「入口」本身做成产品。

一句话概括两家路线的差异：OpenAI 押注「消费级超级入口 + 平台生态」——8 亿周活的 ChatGPT 是流量心脏，浏览器、应用商店、支付协议围绕它生长；Anthropic 押注「开发者与专业工作流 + 垂直 harness」——Claude Code / Cowork 这类「干活容器」扎进具体工作场景，收入以企业 API 为主，生态以 MCP、插件这类开放协议为骨架。

OpenAI agent 产品栈：底层是 GPT-5.x 模型，中间是开发者平台层，上层五个产品各自面向一类人群，最终都汇入 ChatGPT 这个超级入口。

8 亿+

ChatGPT 周活用户（官方，2025-10 DevDay）

500 万+

Codex 周活用户（官方，2026-06）

~20%

Codex 用户已是非开发者，且增速为开发者 3 倍（官方）

5 条

产品线并行：Codex / Agent / SDK / Apps / Atlas

02🕰️ 背景与演进脉络：从「会聊天」到「会干活」

先搞清楚一个问题：为什么 2025 年之后所有 AI 公司都在做 agent？

2023–2024 年的 ChatGPT 本质上是一个「问答机」：你问，它答，动手的永远是你。但大量真实工作不是「告诉我怎么做」，而是「替我做完」——订酒店要真的去点网页，改代码要真的跑测试，做周报要真的去翻 Slack。Agent（智能体）就是为此而生的形态：给模型配上浏览器、终端、文件系统这些「手脚」，让它自己规划步骤、调用工具、检查结果，直到把任务做完。

💬 没看懂 agent 和聊天机器人的区别？点这里换种说法

聊天机器人像一位「顾问」：你描述问题，它给建议，动手还得靠你。Agent 像一位「助理」：你说「把这事办了」，它自己打开电脑、查资料、填表格、写文档，最后把结果交给你。两者用的可能是同一个大脑（模型），差别在于有没有「手脚」（工具）和「自主循环」（自己规划、执行、检查、修正）。

OpenAI 的 agent 版图不是一天画出来的，而是两年里一系列试验、合并与淘汰的结果。看懂这条时间线，就看懂了每个产品「为什么存在」：

2025–2026 年 OpenAI agent 版图演进：试验（Operator / Deep Research）→ 合并（ChatGPT Agent）→ 铺生态（DevDay 三连发）→ 收敛与淘汰（Workspace Agents 接棒 GPTs、Agent Builder 被砍）。

🔑 读这条时间线的三个要点

① OpenAI 习惯「先发多个试验品，再合并成一个正品」——Operator 和 Deep Research 合并成 ChatGPT Agent 是典型案例；② 产品淘汰速度极快，Agent Builder 从发布到宣布弃用只有 8 个月，评估工具 Evals 同批被砍；③ 2026 年的主线是「Codex 化」：Workspace Agents 由 Codex 驱动，Codex 本身也从编码工具扩张成全职能工作平台。

03👨‍💻 Codex：从编码 agent 到「全职能同事」

Codex 是 OpenAI 所有 agent 产品里成熟度最高、演进最快的一条线——也是理解其整体战略的最佳切口。

是什么一个「派活式」的软件工程 agent：你用自然语言描述任务（修 bug、做重构、写测试、审 PR），它在终端（CLI）、IDE 插件、云端容器、GitHub、手机 App 五个入口里的任意一个替你完成，且工作上下文可以在这些入口之间无缝流转。同一个 ChatGPT 账号打通全部入口。

为什么写代码是「验证闭环最完整」的工作：改完能编译、能跑测试，agent 可以自己检查自己。这让编码成为 agent 最先跑通的场景。OpenAI 又发现这套「读文件 → 干活 → 自查 → 交付」的循环对做表格、写报告同样成立，于是 2026 年把 Codex 推向分析师、销售、投行等非开发者。

例子OpenAI 官方称内部「绝大多数 PR」已由 Codex 自动审查，每天拦下数百个问题；Cisco Meraki 的工程师把跨团队代码库的重构和测试生成整体外包给 Codex，自己只做验收。

🧩 形态与用法

Codex 的五个入口共享同一个 agent 内核：CLI（开源，npm i -g @openai/codex 安装，支持图片输入、待办清单、web 搜索、MCP 连接外部系统）；IDE 扩展（VS Code / Cursor / Windsurf，能读你当前打开的文件做上下文）；Codex Cloud（云端容器跑长任务，可自动配环境、开浏览器自查界面、截图附在 PR 里）；GitHub 集成（PR 自动审查，@codex review 召唤）；ChatGPT App（手机上派活）。本地安全模型是三档审批：只读、工作区内自动、完全放开。项目根目录的 AGENTS.md 文件充当「给 agent 的说明书」。

派任务
在任一入口用自然语言描述任务，可附截图、设计稿；复杂任务 Codex 会自己列 to-do 清单。
Agent 自主工作
读代码库 → 改代码 → 跑测试 → 自查修正；云端任务可长时间独立运行（官方称 GPT-5-Codex 测试中曾连续工作 7 小时以上）。
审查与迭代
Codex 交付 diff、终端日志、测试结果和引用；你用「annotations」圈中某一处继续让它改，或直接合并。

📈 2026 年的关键转向：非开发者市场

2026 年 6 月官方数据：Codex 周活超过 500 万，其中约 20% 是非开发者（分析师、市场、设计、投资人等），且这部分人群增速是开发者的 3 倍以上。为承接他们，OpenAI 发布了六个角色插件（数据分析、创意制作、销售、产品设计、公开市场投资、投行——打包了 62 个应用连接和 110 个技能）、Sites（用一个 URL 分享 Codex 生成的交互式网页/应用，预览版）和 annotations 精修能力。官方明确表态要建「合作伙伴可发布自有插件」的开放生态。

💰 定价与成熟度

Codex 不单独收费，捆绑在 ChatGPT 订阅里，用量随档位放大；超出后可买 credits 或挂 API key 按量付费。2026 年 4 月起 credits 计费改为按 token 计价。当前可用模型包括 GPT-5.5、GPT-5.4（官方 changelog 称其为首个原生支持计算机操作的通用模型，实验性支持 1M 上下文）、GPT-5.4-mini 及 GPT-5.3-Codex 等特化版。

档位	价格	Codex 用量定位（官方口径）
Free	$0	体验级尝鲜
Go	$8/月	轻量编码任务
Plus	$20/月	每周几次专注编码会话；GPT-5.5 本地消息约 15–80 条/5 小时
Pro（5x / 20x）	$100 / $200 每月	支撑全周多项目工作；20x 档 GPT-5.5 约 300–1600 条/5 小时
Business	按席位	与 Plus 相近的席位额度，可购 credits 扩展
Enterprise / Edu	联系销售	共享 credits 池，用多少付多少

额度为区间估计且随模型与任务复杂度浮动，本地消息与云任务共享 5 小时窗口；来源：developers.openai.com/codex/pricing（2026-07 读取）。

成熟度评价：五条产品线中最高。产品形态稳定（五入口格局一年未变）、有清晰的企业管控（管理员权限、AWS 上可用）、商业模式跑通（订阅捆绑 + credits）。风险点主要是非开发者场景仍在快速加建，角色插件、Sites 均为最近数月的新特性。

04🕹️ ChatGPT Agent：对话里的「虚拟电脑」

如果说 Codex 是给专业用户的重器，ChatGPT Agent 就是把同一理念装进普通人每天用的聊天框。

是什么ChatGPT 内置的「agent 模式」：在任意对话中从工具下拉菜单选择 agent mode，ChatGPT 就会启动一台自己的虚拟电脑，用视觉浏览器点网页、文本浏览器读资料、终端跑代码、API 拿数据，把「查资料 + 动手操作」一条龙做完，产出可编辑的幻灯片、表格等交付物。

为什么它是 2025 年 1 月的 Operator（只会操作网页、不会深度分析）和 2 月的 Deep Research（只会研究、不能登录网站和交互）的合并体。OpenAI 发现用户拿 Operator 干的很多活其实更适合 Deep Research，索性把两者能力装进一个统一系统——这也是「先试验、后合并」策略的代表作。

例子官方演示：「看我的日历，结合近期新闻给我做客户会议简报」「规划一顿四人日式早餐并把食材加进购物车」「分析三家竞品并产出幻灯片」。

ChatGPT Agent 的机制：一台虚拟电脑装着四类工具，模型按需切换，全程共享一份任务上下文；人类保留打断、接管、确认的控制权。

🎯 目标用户与场景

面向付费个人与团队用户（发布时覆盖 Plus / Pro / Team，随后扩展到 Enterprise / Edu），典型场景是「一次性委托型任务」：竞品调研 + 做成 PPT、把仪表盘截图转成演示文稿、订餐厅规划活动、更新财务表格。它与 Deep Research 并存——后者依然是下拉菜单里更「重研究、慢而深」的选项。

💰 定价与成熟度

不单独收费，按订阅档位给消息额度：发布时 Pro 每月 400 条 agent 消息、其他付费档 40 条，可用 credits 弹性加购（官方 2025-07 口径；第三方 2026 年整理的档位额度与此基本一致，具体以官方帮助中心为准）。

成熟度：中等偏上，但有明确短板。核心能力（浏览、研究、表格）已稳定；幻灯片生成官方自认「格式粗糙」长期处于 beta。安全上它是 OpenAI 首个按「生物化学高风险能力」等级对待的消费产品，prompt injection（网页里藏恶意指令劫持 agent）被官方列为核心风险，靠训练对抗 + 确认机制 + 监控缓解——这也是所有「上网干活」类 agent 的共同软肋。

05🧰 Agents SDK / AgentKit：给开发者的 agent 工具箱

这一条线回答的问题是：第三方开发者怎么用 OpenAI 的能力构建自己的 agent？答案在 2026 年发生了一次重要收缩。

是什么两层东西。Agents SDK（2025 年 3 月发布）是开源的 Python / TypeScript 代码框架，把 agent、工具、交接（handoff）、护栏（guardrail）建模成代码对象，跑在 Responses API 上。AgentKit（2025 年 10 月 DevDay 发布）是其上的「全家桶」：可视化编排画布 Agent Builder、可嵌入的聊天 UI 组件 ChatKit、企业数据连接管理 Connector Registry，外加评估平台 Evals 的增强。

为什么在此之前，开发者做 agent 要自己拼编排逻辑、连接器、评估管道和前端聊天界面。AgentKit 想把这四件事打包；Agents SDK 则面向愿意写代码的团队。客户案例：Klarna 用这套栈搭的客服 agent 处理了三分之二的工单，Ramp 几小时内搭出采购 agent。

例子用 Agents SDK 写一个「规划 agent 把研究派给搜索子 agent、把改代码派给编辑子 agent、把测试派给验证子 agent」的流水线，几十行代码即可表达。

⚠️ 2026 年 6 月的急转弯：Agent Builder 被砍

发布仅约 8 个月后，OpenAI 于 2026 年 6 月 3 日宣布弃用 Agent Builder（可视化画布）和 Evals 平台：Evals 于 10 月 31 日转只读，两者 11 月 30 日彻底下线。ChatKit 保留，Connector Registry 未列入弃用。官方给出的迁移路径：想用代码继续 → Agents SDK；想用自然语言配置 → ChatGPT 里的 Workspace Agents；评估 → 官方指引提及迁移到开源的 Promptfoo。

⚠️ 这件事的信号意义大于事件本身

一个 DevDay 主推的产品 8 个月就被砍，说明两点：其一，OpenAI 内部在「可视化低代码」和「代码优先 + 自然语言配置」两条路线之间选择了后者；其二，托管型专有平台的沉没成本风险是真实的——社区总结的教训是「编排层随时可能换，工具接入层要压在 MCP 这类开放协议上」，这样平台变动时只需要换框架，不用重写所有连接器。

🚀 与此同时，Agents SDK 本体在加码

2026 年 4 月 15 日 SDK 迎来官方称为「下一次进化」的大改版，方向是把 Codex 验证过的执行架构下放给所有开发者：原生沙箱执行（模型生成的代码在隔离容器里跑，内置支持 E2B、Modal、Cloudflare、Daytona、Vercel 等沙箱服务商）、模型原生 harness（自带可配置记忆、类 Codex 文件系统工具的长任务执行环境）、子 agent 原语（beta）、快照与断点恢复，另有 code mode 在路线图上。先发 Python，TypeScript 跟进。

💬 「harness」这个词到底指什么？点这里换种说法

harness 直译是「马具」，在 agent 语境里指「让模型能持续干活的那套外围装备」：文件系统、终端、记忆、任务循环、失败重试。模型是马，harness 是鞍和缰绳——没有它，再强的模型也只能站着说话，套上它才能拉车。Claude Code、Codex CLI 本质上都是各家打磨的 harness；OpenAI 这次是把 harness 做成 SDK 里人人可用的标准件。

💰 定价与成熟度

SDK 与 ChatKit 免费，按底层 API 模型调用量计费。成熟度分裂：Agents SDK 本体活跃且方向明确（官方钦定的代码路线）；但整个「低代码托管平台」子线刚经历一次公开失败，选型时应把 Agent Builder 类比案例当作前车之鉴。

06🧩 GPTs → ChatGPT Apps 与 Workspace Agents：应用生态的两次接棒

「让别人在 ChatGPT 里开店」这个想法 OpenAI 做了三代：GPTs → Apps（消费侧）+ Workspace Agents（企业侧）。看懂这次分叉，就看懂了它的平台野心。

先交代前史：2023 年底的 GPTs 让任何人用提示词 + 知识文件攒一个定制 ChatGPT，2024 年初配了 GPT Store。但 GPTs 本质是「提示词包装」，没有真正的应用逻辑和界面，也一直没跑通开发者分成，生态热度逐年走低。2025 年 10 月，OpenAI 用两个更认真的东西接棒：

GPTs 的遗产一分为二：消费侧由基于 MCP 的 Apps SDK 承接「第三方应用进对话」，企业侧由 Codex 驱动的 Workspace Agents 承接「组织内定制助手」。

📱 消费侧：Apps SDK 与 App Directory

Apps SDK 的关键设计是构建在 MCP（Model Context Protocol，模型上下文协议——由 Anthropic 发起的开放标准，作用类似「AI 应用的 USB 接口」）之上并开源：开发者同时定义应用逻辑和界面，应用 UI 跑在对话内嵌的 iframe 里，理论上「一次构建，任何采纳该标准的宿主都能跑」。对开发者的诱惑是直达 8 亿+ 周活用户；对 OpenAI 的意义是把 ChatGPT 从聊天工具变成「操作系统」。首批应用 2025 年 10 月上线（Booking.com、Canva、Coursera、Figma、Spotify、Zillow 等），12 月开放提交并上线应用目录。

变现是当前最大的未完成项：官方支持通过 Agentic Commerce Protocol（与 Stripe 合作）在美国做实体商品的对话内即时结账，应用可外链到自家网站完成交易，但数字服务/数字商品的应用内售卖尚未开放，分成模式也未公布——这直接决定这个「应用商店」能不能长成 App Store 那样的生意。

ChatGPT 对话中内嵌 Booking.com 应用卡片：用户询问巴黎酒店，对话内直接显示带图片、价格与设施的酒店搜索结果

Apps in ChatGPT 实际形态：第三方应用以交互卡片嵌入对话流。图源：OpenAI 官方博客《Introducing apps in ChatGPT》。

🏢 企业侧：Workspace Agents

2026 年 4 月 22 日以研究预览发布（Business / Enterprise / Edu 计划），被官方定位为「GPTs 的进化」：由 Codex 驱动、跑在云端所以「你下线它还在干活」、在组织内共享共建，能在 ChatGPT 或 Slack 里被调用，连接企业内部系统完成多步工作流。个人用户的 GPTs 暂时保留，但企业版 GPTs 已确认将在未来某个时点被要求迁移。据报道其计费为按 credits 的用量计价（2026 年 5 月 6 日起收费），意味着每次定时触发都是计费事件。

成熟度：消费侧 Apps 属「已上线、商业模式未闭环」；Workspace Agents 属「研究预览、方向清晰」。两者都强依赖后续 12 个月的变现与迁移政策落地。

07🌐 Atlas：把浏览器本身做成 AI 入口

前面四条线都长在 ChatGPT 里面，Atlas 反过来——把 ChatGPT 长成用户上网的「壳」。

是什么基于 Chromium 的 AI 原生浏览器，2025 年 10 月 21 日先发 macOS，免费下载。ChatGPT 以侧边栏常驻：总结当前页面、对比商品、行内改写选中文字（cursor chat）；付费用户可开 agent mode，让 ChatGPT 获得一个光标直接在网页上执行任务（订酒店、批量处理邮件、填表下单）。Browser memories 功能记住你的浏览上下文（「上周你在调研报税软件」），支持随时关闭、逐条删除，官方称服务器端保留 30 天。

为什么搜索和浏览是 Chrome/Google 的腹地，也是用户时长最大的入口。做浏览器 = 不再寄居于别人的入口，把「提问 → 浏览 → 操作」的完整链路都装进自家产品；媒体普遍将其解读为对 Google 搜索分发权的正面进攻（发布同期恰逢 Google 反垄断案余波）。

例子官方场景：让 agent mode 研究一份周菜谱、列出食材清单并把食材加入生鲜购物车；或让它翻几百封邮件提取行动项。

🎯 目标用户、定价与进度

面向大众消费者，免费增值模式：浏览器免费，agent mode 等高级能力绑 Plus / Pro / Business 订阅。发布后迭代不慢：2025 年 11 月加垂直标签页、passkey 支持、可设 Google 为默认搜索；2026 年 1 月加标签组和「Auto」搜索模式（按查询自动在 AI 答案和传统 Google 结果间切换，并让外链更显眼——被解读为对「吃掉开放网络流量」批评的回应）。截至本次调研（2026-07-05），未检索到 Windows / iOS / Android 正式版的官方发布公告，官方口径仍是「即将推出」。

⚠️ 争议与成熟度

成熟度：五条线中最低的一档——产品可用，但平台覆盖不全、争议最多。批评集中在两点：其一，「反开放网络」质疑——知名博主 Anil Dash 批评它「用 AI 生成内容替换了网页却让你以为在看网页」；欧洲广播联盟的研究也被媒体引用来质疑 AI 摘要的可靠性。其二，安全——安全公司 LayerX 报告了被称为「Tainted Memories」的 CSRF 攻击方式（诱导点击恶意链接后向 ChatGPT 记忆注入持久指令，可跨会话跨设备生效）；OpenAI 回应称无法复现该攻击、认为 Atlas 不受影响。浏览器 + 记忆 + agent 的组合天然扩大了 prompt injection 的攻击面，这一点两家（OpenAI 与 Anthropic 的浏览器方案）都无法回避。

08📊 五产品对比总表

把五条产品线放进同一张表——选型时从「你是谁、要干什么」出发对号入座。

产品线	定位	目标用户	典型场景	成熟度	定价
Codex	多入口工作 agent（终端/IDE/云/GitHub/手机）	开发者为主，快速扩向分析、销售、投行等知识工作者	写码修 bug、大型重构、PR 自动审查；非开发者做报告、仪表盘、内部小工具	★★★★★ 最成熟，规模与企业管控俱全	捆绑 ChatGPT 订阅（Free–Enterprise 全档），credits/API 扩展
ChatGPT Agent	对话内通用操作 agent（虚拟电脑）	付费个人 / 团队用户	调研+做 PPT、网购下单、表格更新、会议准备	★★★☆☆ 核心稳定，幻灯片等长期 beta，injection 风险常在	捆绑订阅：Pro 400 条/月、其他付费档 40 条（官方发布时口径）
Agents SDK / AgentKit	开发者构建自有 agent 的框架与组件	工程团队、企业开发者	客服 agent、内部工作流、嵌入自家产品的 agent	★★★☆☆ SDK 活跃进化；Agent Builder/Evals 8 个月即弃用	SDK/ChatKit 免费，按 API 用量计费
GPTs → Apps / Workspace Agents	ChatGPT 内的应用生态与企业定制 agent	消费者与品牌方；企业团队	对话里订酒店/做设计/听歌；企业内共享的常驻工作 agent	★★☆☆☆ Apps 已上线但变现未闭环；Workspace Agents 研究预览	Apps 对用户免费；Workspace Agents 据报道按 credits 计费
Atlas	AI 原生浏览器，入口级产品	大众消费者（暂 macOS）	边浏览边问、agent 代操作网页、跨会话浏览记忆	★★☆☆☆ 可用但平台未铺全，安全与「反开放网络」争议大	浏览器免费；agent mode 绑付费订阅

🧭 一个实用的选型口诀

写代码或做「文件进、交付物出」的重活 → Codex；一次性委托「上网查+动手办」→ ChatGPT Agent；要把 agent 装进自己产品 → Agents SDK（工具接入走 MCP 留后路）；想触达 ChatGPT 的流量 → Apps SDK；企业内部共享的常驻助手 → Workspace Agents；想换个「会干活的浏览器」→ Atlas（macOS 用户）。

09⚔️ 路线对比：OpenAI vs Anthropic

两家的 agent 产品几乎一一对位，但底层打法是两套哲学：「消费级入口 + 平台生态」 vs 「开发者/专业工作流 + 垂直 harness」。

同一个终局，两条路径：OpenAI 用消费流量向下渗透工作场景；Anthropic 用专业工作流向上扩张人群。

🤝 产品一一对位

能力域	OpenAI	Anthropic	关键差异
编码 agent	Codex（CLI/IDE/云/GitHub）	Claude Code（CLI/IDE，Anthropic 研究称重度用户周均使用约 20 小时）	理念高度趋同（AGENTS.md ↔ CLAUDE.md，均有云端与审查能力）；Codex 正主动破圈非开发者，Claude 侧由 Cowork 分担该角色
知识工作 agent	ChatGPT Agent（对话内虚拟电脑）+ Workspace Agents（企业常驻）	Claude Cowork（桌面端，直接操作本地文件与应用，已 GA 并配企业管控）	OpenAI 的执行环境在云端虚拟机；Cowork 强调「就在你电脑上干活」，本地文件与桌面应用是一等公民
浏览器	Atlas（独立浏览器，重造入口）	Claude in Chrome / Claude for Chrome（寄生现有浏览器的扩展/连接器）	做壳 vs 做插件：Atlas 赌用户愿意换浏览器；Anthropic 赌用户不愿换、只要能力
开发者框架	Agents SDK（+ChatKit）；Agent Builder 已弃用	Claude Agent SDK（把 Claude Code 的 harness 开放给开发者）+ Managed Agents（据报道 2026-04 公测）	2026 年双方架构惊人趋同：沙箱、子 agent、长任务 harness 成为共同标配
应用/扩展生态	Apps SDK + App Directory（基于 MCP）+ Agentic Commerce	MCP 连接器目录 + Skills（技能）+ Plugins/私有市场	OpenAI 生态面向 8 亿消费者，含支付闭环野心；Anthropic 生态面向团队与企业的工作流定制
分发渠道	ChatGPT 应用矩阵 + Atlas + AWS 上架（2026-06 起 OpenAI 模型与 Codex 也登陆 AWS）	Claude 应用 + AWS Bedrock / Google Vertex / Microsoft Foundry 全云覆盖 + 微软 365 集成	OpenAI 自有入口极强、云分发在补课；Anthropic 反之，借道巨头云触达企业

🧬 模型策略差异

OpenAI：一条主干 + 场景特化。GPT-5.x 系列（当前 5.5 / 5.4 / 5.3 各型号）是唯一主干，编码场景派生 Codex 特化版（GPT-5.3-Codex 等），并把 computer use 等 agent 能力逐步内化进主干模型（GPT-5.4 号称首个原生计算机操作的通用模型）。逻辑是「模型即产品」：能力尽量长在模型里，产品只是外壳。

Anthropic：能力分级 + 安全双轨。Opus / Sonnet / Haiku 按「能力-成本」分级供开发者按需选择；2026 年 6 月在 Opus 之上引入 Mythos 级双轨——同一模型以 Fable（附加双用途能力安全措施、公开可用）与 Mythos（仅限获批组织）两种形态发布。逻辑是「harness 即产品」：模型迭代稳健，差异化更多来自 Claude Code / Cowork 这些执行容器的打磨。

📦 分发策略差异

OpenAI 的分发是消费互联网打法：入口（ChatGPT、Atlas）抓用户时长，商店（App Directory）抓供给，支付（Agentic Commerce Protocol + Stripe）抓交易闭环——三件套齐了就是平台税模式的雏形。Anthropic 的分发是企业软件打法：产品嵌进工作现场（终端、桌面、Chrome、Excel、Slack），采购走企业云市场（Bedrock / Vertex / Foundry），管控做给 IT 部门（权限、审计、OpenTelemetry 可观测）。据分析机构估计其收入约七到八成来自企业 API 与开发者合同；OpenAI 则据报道企业收入占比已升至四成左右并计划继续拉升——两家在向对方的腹地渗透。

🔓 生态开放度差异

这里有个反直觉的事实：两家生态如今共享同一块地基——MCP。这个由 Anthropic 发起的开放协议已被 OpenAI 的 Apps SDK 官方采纳（「构建于 MCP 之上并开源」），Codex CLI 也支持连 MCP 服务器。差异在协议之上的层：OpenAI 开源了 SDK 和应用标准，但托管平台层归属权在自己手里且变动剧烈（Agent Builder 八个月被砍、GPTs 强制迁移在途）；Anthropic 的技能（SKILL.md 本质是开放文本格式）、插件、子 agent 定义偏「文件即配置」，可移植性更强，但其订阅条款对第三方 harness 的态度也有过反复（据 VentureBeat 报道，曾限制后又有条件恢复 OpenClaw 等第三方 agent 使用 Claude 订阅）。总体判断：协议层两家都开放，平台层两家都攥着——开放度的真实差异在「你迁移时能带走多少东西」，这一点上押注 MCP + 文件化配置的一侧目前更友好。

10🕳️ 常见坑与风险清单

来自官方已知限制与社区反馈的高频教训，选型和落地前过一遍。

⚠️ 平台风险：你依赖的层可能被砍

Agent Builder 从 DevDay 主推到宣布弃用仅 8 个月，Evals 同批下线，GPTs 的企业迁移也已在途。社区共识的对冲方法：编排逻辑写成代码（可版本控制），工具接入压在 MCP 上，评估数据自己留底——平台变动时损失的只是框架迁移成本。

⚠️ 安全风险：prompt injection 是 agent 时代的「SQL 注入」

官方在 ChatGPT Agent 与 Atlas 文档中反复强调：网页里可以藏恶意指令劫持 agent 去泄露连接器数据或执行有害操作。LayerX 报告的 Atlas「Tainted Memories」攻击（OpenAI 称无法复现）说明「记忆 + 浏览器 + agent」组合的攻击面真实存在。实践建议：不用的连接器随手断开、涉钱涉隐私的任务开监督模式、别让 agent 长期持有登录态。

⚠️ 用量与成本坑

Agent 类功能消耗额度远快于普通聊天：Codex 的本地消息与云任务共享 5 小时滑动窗口，图片生成耗额度快 3–5 倍；Workspace Agents 据报道按 credits 计费后「每个定时触发都是计费事件」。上规模前先在小范围核算单位任务成本。

⚠️ 能力边界坑

ChatGPT Agent 的幻灯片输出官方自认格式粗糙、长期 beta；Atlas 截至调研时仍无 Windows 版；App 变现里数字商品尚未开放。凡是「发布会演示很惊艳」的能力，落地前都值得用自己的真实任务先试一轮。

11📚 学习资源清单

Codex 文档与定价：developers.openai.com/codex（quickstart、changelog、pricing 都在这里，迭代快，最值得盯）
Codex CLI 源码：github.com/openai/codex（开源，读 README 了解 harness 设计）
Agents SDK 指南：developers.openai.com/api/docs/guides/agents（Agent Builder 弃用后的官方钦定路线）
Apps SDK：developers.openai.com/apps-sdk（含设计规范、示例仓库与 MCP Apps 兼容说明）
MCP 协议：modelcontextprotocol.io（两家生态的公共地基，值得单独学）
Anthropic 侧对照：claude.com/product/claude-code 与 claude.com/product/cowork（对照阅读最能看清路线差异）

🎁 收尾判断（供参考的综合观点）

把五条线放在一起看，OpenAI 在 2026 年做的其实是一次「收敛」：模型收敛到 GPT-5.x 主干，开发者路线收敛到代码优先的 Agents SDK，企业定制收敛到 Codex 驱动的 Workspace Agents，消费入口收敛到 ChatGPT + Atlas。与 Anthropic 的竞争已经不是「谁的模型强」，而是「消费流量向下渗透」与「专业工作流向上扩张」谁先吃到对方的地盘。对使用者和开发者而言，最稳的姿势是：能力选型跟着自己的工作流走，接入层坚定押注 MCP 等开放协议——无论哪家的平台层再怎么变，你的积累都能带走。