TOPIC RESEARCH · AI AGENT 生态

🧭 OpenAI / ChatGPT Agent 生态全景

Codex · ChatGPT Agent · Agents SDK / AgentKit · GPTs 与 ChatGPT Apps · Atlas 浏览器——每条产品线按「定位 / 目标用户 / 场景 / 成熟度 / 定价」梳理,并与 Anthropic 的路线做一次系统对比。

调研时间:2026-07-05 · 基于 OpenAI / Anthropic 官方文档与主流媒体报道 · 快速迭代领域,请以官方最新文档为准

01⚡ 开篇速览:30 秒版本

如果只读这一段:OpenAI 的 agent 战略不是「一个产品」,而是一套从消费者到开发者的立体入口矩阵

OpenAI 把「让 AI 替你干活」这件事拆成了五个面向不同人群的产品:Codex 面向开发者(现在也扩展到分析师、销售等知识工作者),在终端、IDE、云端替你写代码干活;ChatGPT Agent 是 ChatGPT 里的「agent 模式」,用自己的虚拟电脑上网、点按钮、做表格,面向普通付费用户;Agents SDK / AgentKit 是给开发者构建自有 agent 的工具箱;ChatGPT Apps(Apps SDK)把第三方应用装进 ChatGPT 对话里,接替了当年的 GPTs;Atlas 则是一个内置 ChatGPT 的浏览器,把「入口」本身做成产品。

一句话概括两家路线的差异:OpenAI 押注「消费级超级入口 + 平台生态」——8 亿周活的 ChatGPT 是流量心脏,浏览器、应用商店、支付协议围绕它生长;Anthropic 押注「开发者与专业工作流 + 垂直 harness」——Claude Code / Cowork 这类「干活容器」扎进具体工作场景,收入以企业 API 为主,生态以 MCP、插件这类开放协议为骨架。

OpenAI Agent 产品栈:一颗模型心脏,五个面向不同人群的出口 GPT-5.x 模型家族 通用模型 + Codex 编码特化版本 平台层:Responses API · Agents SDK · Apps SDK(基于 MCP)· ChatKit 开发者用这层把 agent 能力搬进自己的产品 Codex CLI / IDE / 云端 开发者→知识工作者 ChatGPT Agent 对话里的 agent 模式 付费个人用户 Apps in ChatGPT 第三方应用进对话 全体用户 + 品牌方 Workspace Agents GPTs 的企业版继任者 企业团队 Atlas AI 原生浏览器 消费级入口 ChatGPT:8 亿+ 周活的消费级超级入口 所有产品线共享同一个账号、订阅与流量池
OpenAI agent 产品栈:底层是 GPT-5.x 模型,中间是开发者平台层,上层五个产品各自面向一类人群,最终都汇入 ChatGPT 这个超级入口。
8 亿+
ChatGPT 周活用户(官方,2025-10 DevDay)
500 万+
Codex 周活用户(官方,2026-06)
~20%
Codex 用户已是非开发者,且增速为开发者 3 倍(官方)
5 条
产品线并行:Codex / Agent / SDK / Apps / Atlas

02🕰️ 背景与演进脉络:从「会聊天」到「会干活」

先搞清楚一个问题:为什么 2025 年之后所有 AI 公司都在做 agent?

2023–2024 年的 ChatGPT 本质上是一个「问答机」:你问,它答,动手的永远是你。但大量真实工作不是「告诉我怎么做」,而是「替我做完」——订酒店要真的去点网页,改代码要真的跑测试,做周报要真的去翻 Slack。Agent(智能体)就是为此而生的形态:给模型配上浏览器、终端、文件系统这些「手脚」,让它自己规划步骤、调用工具、检查结果,直到把任务做完。

💬 没看懂 agent 和聊天机器人的区别?点这里换种说法
聊天机器人像一位「顾问」:你描述问题,它给建议,动手还得靠你。Agent 像一位「助理」:你说「把这事办了」,它自己打开电脑、查资料、填表格、写文档,最后把结果交给你。两者用的可能是同一个大脑(模型),差别在于有没有「手脚」(工具)和「自主循环」(自己规划、执行、检查、修正)。

OpenAI 的 agent 版图不是一天画出来的,而是两年里一系列试验、合并与淘汰的结果。看懂这条时间线,就看懂了每个产品「为什么存在」:

2025.01–02Operator 与 Deep Research 相继发布一个会点网页、一个会做深度研究——两个「偏科生」各管一摊 2025.03Responses API + Agents SDK 开源发布给开发者的 agent 地基:把「模型调工具」标准化成 API 和代码框架 2025.04–05Codex CLI(开源)与 Codex 云端版上线编码 agent 从终端和云端两头起步,随后统一进一个产品 2025.07ChatGPT Agent 发布:Operator + Deep Research 合并「偏科生」合体成通用操作 agent,Operator 独立站随后关停 2025.09GPT-5-Codex:编码特化模型测试中可独立连续工作 7 小时以上;「通用模型 + 场景特化版」策略成形 2025.10DevDay 三连发:AgentKit + Apps SDK + Atlas 浏览器开发者工具箱、应用生态、浏览器入口同月推出,版图基本成形 2025.12ChatGPT App Directory 上线,开放第三方提交应用目录取代当年的 GPT Store,成为「对话内应用商店」 2026.04Workspace Agents 发布(GPTs 继任者)+ Agents SDK 大改版企业侧用 Codex 驱动的常驻 agent 接棒 GPTs;SDK 引入沙箱、harness、子 agent 2026.06Codex 面向所有职能扩展;Agent Builder / Evals 宣布弃用角色插件把 Codex 推向非开发者;上线仅 8 个月的可视化编排画布被砍
2025–2026 年 OpenAI agent 版图演进:试验(Operator / Deep Research)→ 合并(ChatGPT Agent)→ 铺生态(DevDay 三连发)→ 收敛与淘汰(Workspace Agents 接棒 GPTs、Agent Builder 被砍)。
🔑 读这条时间线的三个要点

① OpenAI 习惯「先发多个试验品,再合并成一个正品」——Operator 和 Deep Research 合并成 ChatGPT Agent 是典型案例;② 产品淘汰速度极快,Agent Builder 从发布到宣布弃用只有 8 个月,评估工具 Evals 同批被砍;③ 2026 年的主线是「Codex 化」:Workspace Agents 由 Codex 驱动,Codex 本身也从编码工具扩张成全职能工作平台。

03👨‍💻 Codex:从编码 agent 到「全职能同事」

Codex 是 OpenAI 所有 agent 产品里成熟度最高、演进最快的一条线——也是理解其整体战略的最佳切口。

是什么一个「派活式」的软件工程 agent:你用自然语言描述任务(修 bug、做重构、写测试、审 PR),它在终端(CLI)、IDE 插件、云端容器、GitHub、手机 App 五个入口里的任意一个替你完成,且工作上下文可以在这些入口之间无缝流转。同一个 ChatGPT 账号打通全部入口。

为什么写代码是「验证闭环最完整」的工作:改完能编译、能跑测试,agent 可以自己检查自己。这让编码成为 agent 最先跑通的场景。OpenAI 又发现这套「读文件 → 干活 → 自查 → 交付」的循环对做表格、写报告同样成立,于是 2026 年把 Codex 推向分析师、销售、投行等非开发者。

例子OpenAI 官方称内部「绝大多数 PR」已由 Codex 自动审查,每天拦下数百个问题;Cisco Meraki 的工程师把跨团队代码库的重构和测试生成整体外包给 Codex,自己只做验收。

🧩 形态与用法

Codex 的五个入口共享同一个 agent 内核:CLI(开源,npm i -g @openai/codex 安装,支持图片输入、待办清单、web 搜索、MCP 连接外部系统);IDE 扩展(VS Code / Cursor / Windsurf,能读你当前打开的文件做上下文);Codex Cloud(云端容器跑长任务,可自动配环境、开浏览器自查界面、截图附在 PR 里);GitHub 集成(PR 自动审查,@codex review 召唤);ChatGPT App(手机上派活)。本地安全模型是三档审批:只读、工作区内自动、完全放开。项目根目录的 AGENTS.md 文件充当「给 agent 的说明书」。

  1. 派任务
    在任一入口用自然语言描述任务,可附截图、设计稿;复杂任务 Codex 会自己列 to-do 清单。
  2. Agent 自主工作
    读代码库 → 改代码 → 跑测试 → 自查修正;云端任务可长时间独立运行(官方称 GPT-5-Codex 测试中曾连续工作 7 小时以上)。
  3. 审查与迭代
    Codex 交付 diff、终端日志、测试结果和引用;你用「annotations」圈中某一处继续让它改,或直接合并。

📈 2026 年的关键转向:非开发者市场

2026 年 6 月官方数据:Codex 周活超过 500 万,其中约 20% 是非开发者(分析师、市场、设计、投资人等),且这部分人群增速是开发者的 3 倍以上。为承接他们,OpenAI 发布了六个角色插件(数据分析、创意制作、销售、产品设计、公开市场投资、投行——打包了 62 个应用连接和 110 个技能)、Sites(用一个 URL 分享 Codex 生成的交互式网页/应用,预览版)和 annotations 精修能力。官方明确表态要建「合作伙伴可发布自有插件」的开放生态。

💰 定价与成熟度

Codex 不单独收费,捆绑在 ChatGPT 订阅里,用量随档位放大;超出后可买 credits 或挂 API key 按量付费。2026 年 4 月起 credits 计费改为按 token 计价。当前可用模型包括 GPT-5.5、GPT-5.4(官方 changelog 称其为首个原生支持计算机操作的通用模型,实验性支持 1M 上下文)、GPT-5.4-mini 及 GPT-5.3-Codex 等特化版。

档位价格Codex 用量定位(官方口径)
Free$0体验级尝鲜
Go$8/月轻量编码任务
Plus$20/月每周几次专注编码会话;GPT-5.5 本地消息约 15–80 条/5 小时
Pro(5x / 20x)$100 / $200 每月支撑全周多项目工作;20x 档 GPT-5.5 约 300–1600 条/5 小时
Business按席位与 Plus 相近的席位额度,可购 credits 扩展
Enterprise / Edu联系销售共享 credits 池,用多少付多少

额度为区间估计且随模型与任务复杂度浮动,本地消息与云任务共享 5 小时窗口;来源:developers.openai.com/codex/pricing(2026-07 读取)。

成熟度评价:五条产品线中最高。产品形态稳定(五入口格局一年未变)、有清晰的企业管控(管理员权限、AWS 上可用)、商业模式跑通(订阅捆绑 + credits)。风险点主要是非开发者场景仍在快速加建,角色插件、Sites 均为最近数月的新特性。

04🕹️ ChatGPT Agent:对话里的「虚拟电脑」

如果说 Codex 是给专业用户的重器,ChatGPT Agent 就是把同一理念装进普通人每天用的聊天框。

是什么ChatGPT 内置的「agent 模式」:在任意对话中从工具下拉菜单选择 agent mode,ChatGPT 就会启动一台自己的虚拟电脑,用视觉浏览器点网页、文本浏览器读资料、终端跑代码、API 拿数据,把「查资料 + 动手操作」一条龙做完,产出可编辑的幻灯片、表格等交付物。

为什么它是 2025 年 1 月的 Operator(只会操作网页、不会深度分析)和 2 月的 Deep Research(只会研究、不能登录网站和交互)的合并体。OpenAI 发现用户拿 Operator 干的很多活其实更适合 Deep Research,索性把两者能力装进一个统一系统——这也是「先试验、后合并」策略的代表作。

例子官方演示:「看我的日历,结合近期新闻给我做客户会议简报」「规划一顿四人日式早餐并把食材加进购物车」「分析三家竞品并产出幻灯片」。

一台虚拟电脑 + 四类工具,在同一个上下文里自由切换 你的指令 可随时打断 / 接管 Agent 的虚拟电脑(上下文全程保留) 🖱️ 视觉浏览器点按钮、填表单、登录 📄 文本浏览器高效读长网页 ⌨️ 终端跑代码、处理文件 🔌 API + 连接器Gmail、日历、GitHub… 下载文件 → 终端加工 → 浏览器查看结果,工具间自由接力 交付物 可编辑幻灯片 / 表格 报告 / 完成的网页操作 ⚠️ 重大操作前必须请求确认;发邮件等关键任务需「Watch Mode」全程盯着
ChatGPT Agent 的机制:一台虚拟电脑装着四类工具,模型按需切换,全程共享一份任务上下文;人类保留打断、接管、确认的控制权。

🎯 目标用户与场景

面向付费个人与团队用户(发布时覆盖 Plus / Pro / Team,随后扩展到 Enterprise / Edu),典型场景是「一次性委托型任务」:竞品调研 + 做成 PPT、把仪表盘截图转成演示文稿、订餐厅规划活动、更新财务表格。它与 Deep Research 并存——后者依然是下拉菜单里更「重研究、慢而深」的选项。

💰 定价与成熟度

不单独收费,按订阅档位给消息额度:发布时 Pro 每月 400 条 agent 消息、其他付费档 40 条,可用 credits 弹性加购(官方 2025-07 口径;第三方 2026 年整理的档位额度与此基本一致,具体以官方帮助中心为准)。

成熟度:中等偏上,但有明确短板。核心能力(浏览、研究、表格)已稳定;幻灯片生成官方自认「格式粗糙」长期处于 beta。安全上它是 OpenAI 首个按「生物化学高风险能力」等级对待的消费产品,prompt injection(网页里藏恶意指令劫持 agent)被官方列为核心风险,靠训练对抗 + 确认机制 + 监控缓解——这也是所有「上网干活」类 agent 的共同软肋。

05🧰 Agents SDK / AgentKit:给开发者的 agent 工具箱

这一条线回答的问题是:第三方开发者怎么用 OpenAI 的能力构建自己的 agent?答案在 2026 年发生了一次重要收缩。

是什么两层东西。Agents SDK(2025 年 3 月发布)是开源的 Python / TypeScript 代码框架,把 agent、工具、交接(handoff)、护栏(guardrail)建模成代码对象,跑在 Responses API 上。AgentKit(2025 年 10 月 DevDay 发布)是其上的「全家桶」:可视化编排画布 Agent Builder、可嵌入的聊天 UI 组件 ChatKit、企业数据连接管理 Connector Registry,外加评估平台 Evals 的增强。

为什么在此之前,开发者做 agent 要自己拼编排逻辑、连接器、评估管道和前端聊天界面。AgentKit 想把这四件事打包;Agents SDK 则面向愿意写代码的团队。客户案例:Klarna 用这套栈搭的客服 agent 处理了三分之二的工单,Ramp 几小时内搭出采购 agent。

例子用 Agents SDK 写一个「规划 agent 把研究派给搜索子 agent、把改代码派给编辑子 agent、把测试派给验证子 agent」的流水线,几十行代码即可表达。

⚠️ 2026 年 6 月的急转弯:Agent Builder 被砍

发布仅约 8 个月后,OpenAI 于 2026 年 6 月 3 日宣布弃用 Agent Builder(可视化画布)和 Evals 平台:Evals 于 10 月 31 日转只读,两者 11 月 30 日彻底下线。ChatKit 保留,Connector Registry 未列入弃用。官方给出的迁移路径:想用代码继续 → Agents SDK;想用自然语言配置 → ChatGPT 里的 Workspace Agents;评估 → 官方指引提及迁移到开源的 Promptfoo。

⚠️ 这件事的信号意义大于事件本身

一个 DevDay 主推的产品 8 个月就被砍,说明两点:其一,OpenAI 内部在「可视化低代码」和「代码优先 + 自然语言配置」两条路线之间选择了后者;其二,托管型专有平台的沉没成本风险是真实的——社区总结的教训是「编排层随时可能换,工具接入层要压在 MCP 这类开放协议上」,这样平台变动时只需要换框架,不用重写所有连接器。

🚀 与此同时,Agents SDK 本体在加码

2026 年 4 月 15 日 SDK 迎来官方称为「下一次进化」的大改版,方向是把 Codex 验证过的执行架构下放给所有开发者:原生沙箱执行(模型生成的代码在隔离容器里跑,内置支持 E2B、Modal、Cloudflare、Daytona、Vercel 等沙箱服务商)、模型原生 harness(自带可配置记忆、类 Codex 文件系统工具的长任务执行环境)、子 agent 原语(beta)、快照与断点恢复,另有 code mode 在路线图上。先发 Python,TypeScript 跟进。

💬 「harness」这个词到底指什么?点这里换种说法
harness 直译是「马具」,在 agent 语境里指「让模型能持续干活的那套外围装备」:文件系统、终端、记忆、任务循环、失败重试。模型是马,harness 是鞍和缰绳——没有它,再强的模型也只能站着说话,套上它才能拉车。Claude Code、Codex CLI 本质上都是各家打磨的 harness;OpenAI 这次是把 harness 做成 SDK 里人人可用的标准件。

💰 定价与成熟度

SDK 与 ChatKit 免费,按底层 API 模型调用量计费。成熟度分裂:Agents SDK 本体活跃且方向明确(官方钦定的代码路线);但整个「低代码托管平台」子线刚经历一次公开失败,选型时应把 Agent Builder 类比案例当作前车之鉴。

06🧩 GPTs → ChatGPT Apps 与 Workspace Agents:应用生态的两次接棒

「让别人在 ChatGPT 里开店」这个想法 OpenAI 做了三代:GPTs → Apps(消费侧)+ Workspace Agents(企业侧)。看懂这次分叉,就看懂了它的平台野心。

先交代前史:2023 年底的 GPTs 让任何人用提示词 + 知识文件攒一个定制 ChatGPT,2024 年初配了 GPT Store。但 GPTs 本质是「提示词包装」,没有真正的应用逻辑和界面,也一直没跑通开发者分成,生态热度逐年走低。2025 年 10 月,OpenAI 用两个更认真的东西接棒:

GPTs + GPT Store 2023–24:提示词级定制,变现未跑通 消费侧:Apps in ChatGPT(Apps SDK) 2025.10 发布 · 基于 MCP 开放标准、开源 真实应用逻辑 + 对话内交互界面(iframe) Spotify、Canva、Zillow、Booking 等入驻 2025.12 App Directory 开放第三方提交 企业侧:Workspace Agents 2026.04 研究预览 · GPTs 官方继任者 Codex 驱动、云端常驻、组织内共享 接 Slack / Salesforce 等企业工具干活 按 credits 计费(据报道 5.6 起收费)
GPTs 的遗产一分为二:消费侧由基于 MCP 的 Apps SDK 承接「第三方应用进对话」,企业侧由 Codex 驱动的 Workspace Agents 承接「组织内定制助手」。

📱 消费侧:Apps SDK 与 App Directory

Apps SDK 的关键设计是构建在 MCP(Model Context Protocol,模型上下文协议——由 Anthropic 发起的开放标准,作用类似「AI 应用的 USB 接口」)之上并开源:开发者同时定义应用逻辑和界面,应用 UI 跑在对话内嵌的 iframe 里,理论上「一次构建,任何采纳该标准的宿主都能跑」。对开发者的诱惑是直达 8 亿+ 周活用户;对 OpenAI 的意义是把 ChatGPT 从聊天工具变成「操作系统」。首批应用 2025 年 10 月上线(Booking.com、Canva、Coursera、Figma、Spotify、Zillow 等),12 月开放提交并上线应用目录。

变现是当前最大的未完成项:官方支持通过 Agentic Commerce Protocol(与 Stripe 合作)在美国做实体商品的对话内即时结账,应用可外链到自家网站完成交易,但数字服务/数字商品的应用内售卖尚未开放,分成模式也未公布——这直接决定这个「应用商店」能不能长成 App Store 那样的生意。

ChatGPT 对话中内嵌 Booking.com 应用卡片:用户询问巴黎酒店,对话内直接显示带图片、价格与设施的酒店搜索结果
🖼️ 原图已失效(来自 OpenAI 官方博客)。该图展示的是 ChatGPT 对话中内嵌的 Booking.com 应用界面:用户用自然语言查巴黎酒店,结果以带图片和价格的交互卡片直接出现在聊天里。
Apps in ChatGPT 实际形态:第三方应用以交互卡片嵌入对话流。图源:OpenAI 官方博客《Introducing apps in ChatGPT》。

🏢 企业侧:Workspace Agents

2026 年 4 月 22 日以研究预览发布(Business / Enterprise / Edu 计划),被官方定位为「GPTs 的进化」:由 Codex 驱动、跑在云端所以「你下线它还在干活」、在组织内共享共建,能在 ChatGPT 或 Slack 里被调用,连接企业内部系统完成多步工作流。个人用户的 GPTs 暂时保留,但企业版 GPTs 已确认将在未来某个时点被要求迁移。据报道其计费为按 credits 的用量计价(2026 年 5 月 6 日起收费),意味着每次定时触发都是计费事件。

成熟度:消费侧 Apps 属「已上线、商业模式未闭环」;Workspace Agents 属「研究预览、方向清晰」。两者都强依赖后续 12 个月的变现与迁移政策落地。

07🌐 Atlas:把浏览器本身做成 AI 入口

前面四条线都长在 ChatGPT 里面,Atlas 反过来——把 ChatGPT 长成用户上网的「壳」。

是什么基于 Chromium 的 AI 原生浏览器,2025 年 10 月 21 日先发 macOS,免费下载。ChatGPT 以侧边栏常驻:总结当前页面、对比商品、行内改写选中文字(cursor chat);付费用户可开 agent mode,让 ChatGPT 获得一个光标直接在网页上执行任务(订酒店、批量处理邮件、填表下单)。Browser memories 功能记住你的浏览上下文(「上周你在调研报税软件」),支持随时关闭、逐条删除,官方称服务器端保留 30 天。

为什么搜索和浏览是 Chrome/Google 的腹地,也是用户时长最大的入口。做浏览器 = 不再寄居于别人的入口,把「提问 → 浏览 → 操作」的完整链路都装进自家产品;媒体普遍将其解读为对 Google 搜索分发权的正面进攻(发布同期恰逢 Google 反垄断案余波)。

例子官方场景:让 agent mode 研究一份周菜谱、列出食材清单并把食材加入生鲜购物车;或让它翻几百封邮件提取行动项。

🎯 目标用户、定价与进度

面向大众消费者,免费增值模式:浏览器免费,agent mode 等高级能力绑 Plus / Pro / Business 订阅。发布后迭代不慢:2025 年 11 月加垂直标签页、passkey 支持、可设 Google 为默认搜索;2026 年 1 月加标签组和「Auto」搜索模式(按查询自动在 AI 答案和传统 Google 结果间切换,并让外链更显眼——被解读为对「吃掉开放网络流量」批评的回应)。截至本次调研(2026-07-05),未检索到 Windows / iOS / Android 正式版的官方发布公告,官方口径仍是「即将推出」。

⚠️ 争议与成熟度

成熟度:五条线中最低的一档——产品可用,但平台覆盖不全、争议最多。批评集中在两点:其一,「反开放网络」质疑——知名博主 Anil Dash 批评它「用 AI 生成内容替换了网页却让你以为在看网页」;欧洲广播联盟的研究也被媒体引用来质疑 AI 摘要的可靠性。其二,安全——安全公司 LayerX 报告了被称为「Tainted Memories」的 CSRF 攻击方式(诱导点击恶意链接后向 ChatGPT 记忆注入持久指令,可跨会话跨设备生效);OpenAI 回应称无法复现该攻击、认为 Atlas 不受影响。浏览器 + 记忆 + agent 的组合天然扩大了 prompt injection 的攻击面,这一点两家(OpenAI 与 Anthropic 的浏览器方案)都无法回避。

08📊 五产品对比总表

把五条产品线放进同一张表——选型时从「你是谁、要干什么」出发对号入座。

产品线定位目标用户典型场景成熟度定价
Codex多入口工作 agent(终端/IDE/云/GitHub/手机)开发者为主,快速扩向分析、销售、投行等知识工作者写码修 bug、大型重构、PR 自动审查;非开发者做报告、仪表盘、内部小工具★★★★★ 最成熟,规模与企业管控俱全捆绑 ChatGPT 订阅(Free–Enterprise 全档),credits/API 扩展
ChatGPT Agent对话内通用操作 agent(虚拟电脑)付费个人 / 团队用户调研+做 PPT、网购下单、表格更新、会议准备★★★☆☆ 核心稳定,幻灯片等长期 beta,injection 风险常在捆绑订阅:Pro 400 条/月、其他付费档 40 条(官方发布时口径)
Agents SDK / AgentKit开发者构建自有 agent 的框架与组件工程团队、企业开发者客服 agent、内部工作流、嵌入自家产品的 agent★★★☆☆ SDK 活跃进化;Agent Builder/Evals 8 个月即弃用SDK/ChatKit 免费,按 API 用量计费
GPTs → Apps / Workspace AgentsChatGPT 内的应用生态与企业定制 agent消费者与品牌方;企业团队对话里订酒店/做设计/听歌;企业内共享的常驻工作 agent★★☆☆☆ Apps 已上线但变现未闭环;Workspace Agents 研究预览Apps 对用户免费;Workspace Agents 据报道按 credits 计费
AtlasAI 原生浏览器,入口级产品大众消费者(暂 macOS)边浏览边问、agent 代操作网页、跨会话浏览记忆★★☆☆☆ 可用但平台未铺全,安全与「反开放网络」争议大浏览器免费;agent mode 绑付费订阅
🧭 一个实用的选型口诀

写代码或做「文件进、交付物出」的重活 → Codex;一次性委托「上网查+动手办」→ ChatGPT Agent;要把 agent 装进自己产品 → Agents SDK(工具接入走 MCP 留后路);想触达 ChatGPT 的流量 → Apps SDK;企业内部共享的常驻助手 → Workspace Agents;想换个「会干活的浏览器」→ Atlas(macOS 用户)。

09⚔️ 路线对比:OpenAI vs Anthropic

两家的 agent 产品几乎一一对位,但底层打法是两套哲学:「消费级入口 + 平台生态」 vs 「开发者/专业工作流 + 垂直 harness」

同一个终局:AI 替人完成真实工作 但两家选择了不同的切入路径 OpenAI:自上而下,从流量到工作 🏟️ 起点:8 亿+ 周活的 ChatGPT 消费入口 🧲 打法:把应用(Apps)、商务(结账)、浏览器 (Atlas)全吸进对话,做「AI 操作系统」 🧬 模型:GPT-5.x 一条主线 + Codex 特化版 💰 收入:消费订阅为基本盘,企业侧快速追赶 ⚡ 风格:快发快砍,试验-合并-淘汰循环极快 Anthropic:自下而上,从工作流到规模 🔧 起点:Claude Code 在开发者工作流里扎根 🪜 打法:同一套 harness 复制到知识工作 (Cowork)、浏览器(Chrome 插件)、Excel 🧬 模型:Opus/Sonnet/Haiku 分级+Fable/Mythos 双轨 💰 收入:企业 API 为主(据分析机构约 7–8 成) 🧩 风格:协议先行(MCP/技能/插件),生态可移植
同一个终局,两条路径:OpenAI 用消费流量向下渗透工作场景;Anthropic 用专业工作流向上扩张人群。

🤝 产品一一对位

能力域OpenAIAnthropic关键差异
编码 agentCodex(CLI/IDE/云/GitHub)Claude Code(CLI/IDE,Anthropic 研究称重度用户周均使用约 20 小时)理念高度趋同(AGENTS.md ↔ CLAUDE.md,均有云端与审查能力);Codex 正主动破圈非开发者,Claude 侧由 Cowork 分担该角色
知识工作 agentChatGPT Agent(对话内虚拟电脑)+ Workspace Agents(企业常驻)Claude Cowork(桌面端,直接操作本地文件与应用,已 GA 并配企业管控)OpenAI 的执行环境在云端虚拟机;Cowork 强调「就在你电脑上干活」,本地文件与桌面应用是一等公民
浏览器Atlas(独立浏览器,重造入口)Claude in Chrome / Claude for Chrome(寄生现有浏览器的扩展/连接器)做壳 vs 做插件:Atlas 赌用户愿意换浏览器;Anthropic 赌用户不愿换、只要能力
开发者框架Agents SDK(+ChatKit);Agent Builder 已弃用Claude Agent SDK(把 Claude Code 的 harness 开放给开发者)+ Managed Agents(据报道 2026-04 公测)2026 年双方架构惊人趋同:沙箱、子 agent、长任务 harness 成为共同标配
应用/扩展生态Apps SDK + App Directory(基于 MCP)+ Agentic CommerceMCP 连接器目录 + Skills(技能)+ Plugins/私有市场OpenAI 生态面向 8 亿消费者,含支付闭环野心;Anthropic 生态面向团队与企业的工作流定制
分发渠道ChatGPT 应用矩阵 + Atlas + AWS 上架(2026-06 起 OpenAI 模型与 Codex 也登陆 AWS)Claude 应用 + AWS Bedrock / Google Vertex / Microsoft Foundry 全云覆盖 + 微软 365 集成OpenAI 自有入口极强、云分发在补课;Anthropic 反之,借道巨头云触达企业

🧬 模型策略差异

OpenAI:一条主干 + 场景特化。GPT-5.x 系列(当前 5.5 / 5.4 / 5.3 各型号)是唯一主干,编码场景派生 Codex 特化版(GPT-5.3-Codex 等),并把 computer use 等 agent 能力逐步内化进主干模型(GPT-5.4 号称首个原生计算机操作的通用模型)。逻辑是「模型即产品」:能力尽量长在模型里,产品只是外壳。

Anthropic:能力分级 + 安全双轨。Opus / Sonnet / Haiku 按「能力-成本」分级供开发者按需选择;2026 年 6 月在 Opus 之上引入 Mythos 级双轨——同一模型以 Fable(附加双用途能力安全措施、公开可用)与 Mythos(仅限获批组织)两种形态发布。逻辑是「harness 即产品」:模型迭代稳健,差异化更多来自 Claude Code / Cowork 这些执行容器的打磨。

📦 分发策略差异

OpenAI 的分发是消费互联网打法:入口(ChatGPT、Atlas)抓用户时长,商店(App Directory)抓供给,支付(Agentic Commerce Protocol + Stripe)抓交易闭环——三件套齐了就是平台税模式的雏形。Anthropic 的分发是企业软件打法:产品嵌进工作现场(终端、桌面、Chrome、Excel、Slack),采购走企业云市场(Bedrock / Vertex / Foundry),管控做给 IT 部门(权限、审计、OpenTelemetry 可观测)。据分析机构估计其收入约七到八成来自企业 API 与开发者合同;OpenAI 则据报道企业收入占比已升至四成左右并计划继续拉升——两家在向对方的腹地渗透。

🔓 生态开放度差异

这里有个反直觉的事实:两家生态如今共享同一块地基——MCP。这个由 Anthropic 发起的开放协议已被 OpenAI 的 Apps SDK 官方采纳(「构建于 MCP 之上并开源」),Codex CLI 也支持连 MCP 服务器。差异在协议之上的层:OpenAI 开源了 SDK 和应用标准,但托管平台层归属权在自己手里且变动剧烈(Agent Builder 八个月被砍、GPTs 强制迁移在途);Anthropic 的技能(SKILL.md 本质是开放文本格式)、插件、子 agent 定义偏「文件即配置」,可移植性更强,但其订阅条款对第三方 harness 的态度也有过反复(据 VentureBeat 报道,曾限制后又有条件恢复 OpenClaw 等第三方 agent 使用 Claude 订阅)。总体判断:协议层两家都开放,平台层两家都攥着——开放度的真实差异在「你迁移时能带走多少东西」,这一点上押注 MCP + 文件化配置的一侧目前更友好。

10🕳️ 常见坑与风险清单

来自官方已知限制与社区反馈的高频教训,选型和落地前过一遍。

⚠️ 平台风险:你依赖的层可能被砍

Agent Builder 从 DevDay 主推到宣布弃用仅 8 个月,Evals 同批下线,GPTs 的企业迁移也已在途。社区共识的对冲方法:编排逻辑写成代码(可版本控制),工具接入压在 MCP 上,评估数据自己留底——平台变动时损失的只是框架迁移成本。

⚠️ 安全风险:prompt injection 是 agent 时代的「SQL 注入」

官方在 ChatGPT Agent 与 Atlas 文档中反复强调:网页里可以藏恶意指令劫持 agent 去泄露连接器数据或执行有害操作。LayerX 报告的 Atlas「Tainted Memories」攻击(OpenAI 称无法复现)说明「记忆 + 浏览器 + agent」组合的攻击面真实存在。实践建议:不用的连接器随手断开、涉钱涉隐私的任务开监督模式、别让 agent 长期持有登录态。

⚠️ 用量与成本坑

Agent 类功能消耗额度远快于普通聊天:Codex 的本地消息与云任务共享 5 小时滑动窗口,图片生成耗额度快 3–5 倍;Workspace Agents 据报道按 credits 计费后「每个定时触发都是计费事件」。上规模前先在小范围核算单位任务成本。

⚠️ 能力边界坑

ChatGPT Agent 的幻灯片输出官方自认格式粗糙、长期 beta;Atlas 截至调研时仍无 Windows 版;App 变现里数字商品尚未开放。凡是「发布会演示很惊艳」的能力,落地前都值得用自己的真实任务先试一轮。

11📚 学习资源清单

🎁 收尾判断(供参考的综合观点)

把五条线放在一起看,OpenAI 在 2026 年做的其实是一次「收敛」:模型收敛到 GPT-5.x 主干,开发者路线收敛到代码优先的 Agents SDK,企业定制收敛到 Codex 驱动的 Workspace Agents,消费入口收敛到 ChatGPT + Atlas。与 Anthropic 的竞争已经不是「谁的模型强」,而是「消费流量向下渗透」与「专业工作流向上扩张」谁先吃到对方的地盘。对使用者和开发者而言,最稳的姿势是:能力选型跟着自己的工作流走,接入层坚定押注 MCP 等开放协议——无论哪家的平台层再怎么变,你的积累都能带走。