2026 年 3 月,AI 编码工具赛道已经从两三个玩家膨胀到了七个 serious contenders。
Cursor 年收入突破 20 亿美金,Claude Code 在 SWE-bench 上刷到 80.8%,Google 带着 Antigravity 杀进来,Amazon 的 Kiro 搞出了 630 万订单的史诗级事故。OpenAI 的 Codex 从聊天助手进化成了能连续工作 7 小时的 autonomous agent,Windsurf 用 $15/月的价格在抢 Cursor 的用户,GitHub Copilot 依然是装机量最大的选手。
这不是简单的"哪个更好"的问题。七个工具,七种思路,适合完全不同的开发者。
今天这篇文章,帮你把它们全部摊开看清楚。
定价速查表
先看最现实的问题: 要花多少钱。
| 工具 | 免费方案 | 入门价格 | 进阶/高级 | 计费方式 |
|---|---|---|---|---|
| Cursor | Hobby (有限额度) | Pro $20/月 | Pro+ $60, Ultra $200 | Credit 制, $1 = 1 credit |
| Claude Code | 含于 Claude Free | Pro $20/月 | Max 5x $100, Max 20x $200 | 订阅制, 按容量倍数 |
| Windsurf | 25 credits/月 | Pro $15/月 | Teams $30/人 | Credit 制, 500 credits/月 |
| GitHub Copilot | Free (2000 补全/月) | Pro $10/月 | Pro+ $39/月 | Premium requests 制 |
| Antigravity | 有 (限速) | Pro $20/月 | Ultra $250/月 | AI credits 制, 5h 刷新 |
| Codex | 含于 ChatGPT Plus | $20/月 (Plus) | Pro $200/月 | 含于 ChatGPT 订阅 |
| Kiro | 50 vibe requests | Pro $20/月 | Power $200/月 | Vibe + Spec 双轨制 |
注意一个有趣的价格锚点: 入门级几乎都卡在 $15-20/月这个区间。唯一的例外是 Copilot, $10/月依然是市场上性价比最高的入门方案。
功能矩阵
| 功能 | Cursor | Claude Code | Windsurf | Copilot | Antigravity | Codex | Kiro |
|---|---|---|---|---|---|---|---|
| 代码补全 | Supermaven | 无 | 有 | 有 | 有 | 无 | 有 |
| Chat 对话 | 有 | 有 | Cascade | 有 | 有 | 有 | 有 |
| Agent 模式 | 8 Agent 并行 | Agent Teams | Cascade Agent | Agent Mode | 16 Agent 并行 | 云端沙箱 | Spec-driven |
| 多文件编辑 | Composer | 原生 | 有 | 有 | 有 | PR 交付 | 有 |
| 终端集成 | IDE 内 | 原生终端 | IDE 内 | CLI 预览 | IDE 内 | CLI + App | IDE 内 |
| 上下文窗口 | 大 | 100 万 token | 大 | 中 | 大 | 大 | 中 |
| 自主执行命令 | 有 | 极强 | 有 | 有 | 有 | 极强 | 有 |
| 模型选择 | 多模型 | Claude 系列 | 多模型 | 多模型 | Gemini + Claude + GPT | GPT 系列 | Claude Sonnet |
| IDE 形态 | VS Code Fork | CLI | VS Code Fork | 插件 | 独立 IDE | App + CLI | VS Code Fork |
逐个拆解
Cursor: 当之无愧的 IDE 之王
用户数: 100 万+,36 万+ 付费用户,年化收入超 20 亿美金。
这些数字本身就说明问题。在 AI 编码工具这个赛道,Cursor 是用户基数最大、付费转化率最高(36%)、营收最强的选手。
2025 年 6 月 Cursor 从固定请求数改成了 credit 制,这个变动引发了不小的争议。原来 $20/月有 500 次请求,改制后实际大约只有 225 次。CEO Michael Truell 公开道歉了,一波用户跑去了 Windsurf。
但 Cursor 的核心竞争力没变:
Supermaven 自动补全: 收购 Supermaven 后,Cursor 的 Tab 补全是行业里体验最好的。不只补全当前行,而是预测你接下来几行要写的代码。那种"它知道我想干什么"的感觉,用过就回不去。
Composer + 8 Agent 并行: 你可以同时开 8 个 AI Agent,一个改前端,一个写 API,一个跑测试。在 IDE 里实现了真正的并行开发。
VS Code 生态: 基于 VS Code fork,大部分插件兼容。对于 VS Code 用户来说,迁移成本接近零。
不足: credit 制改革后,重度用户的性价比下降了。$20/月的 Pro 方案如果模型选的是 Claude Opus 或 GPT-5.4,credit 消耗很快。真正不限量的体验需要 Ultra ($200/月)。
适合谁: VS Code 用户、需要可视化代码 diff 的前端开发者、习惯 IDE 工作流的团队。
Claude Code: 终端里的全能 Agent
SWE-bench Verified: Opus 4.6 拿到 80.8%,Sonnet 4.6 拿到 79.6%。
核心形态: 这不是一个 IDE,甚至不是一个 IDE 插件。Claude Code 是一个纯 CLI 工具,跑在你的终端里。
你给它一个任务描述,它自己读代码、理解项目结构、修改文件、运行测试、根据测试结果迭代修复。整个过程你看着它在终端里操作,可以随时打断、调整方向。
2026 年 2 月推出的 Agent Teams 是一个重要升级: 你可以创建一个 team lead agent,由它协调多个 sub-agent,每个 sub-agent 有独立的 context window,在 git worktree 里隔离工作。Agent 之间可以直接通信、共享任务列表。这解决了单 agent 在大型项目上 context 污染的问题。
100 万 token 上下文 是另一个杀手级特性。大型项目的完整代码库可以一次性放进去,不需要人工选择"把哪些文件加入上下文"。
定价逻辑: Claude Code 不单独卖,它是 Claude 订阅的一部分。$20/月的 Pro 方案就能用,但额度有限。重度使用推荐 Max 5x ($100/月) 或 Max 20x ($200/月)。也可以走 API 按 token 计费,灵活但花费不可预测。
不足: 没有代码补全功能(它是 CLI,不在你的编辑器里)。没有可视化 diff 对比。对于需要频繁看 UI 效果的前端工作不太方便。学习曲线比 IDE 类工具高。
适合谁: 终端重度用户、全栈开发者、后端工程师、喜欢"给 AI 下一个任务让它自己搞定"的人。
Windsurf: 性价比之选
定价: Pro $15/月,比 Cursor 便宜 $5。
Windsurf(前身 Codeium)在 Cursor credit 制争议后接住了一波迁移用户。它的核心卖点:
Cascade: 不只是一个 chat 窗口。Cascade 追踪你的所有操作(编辑、命令、剪贴板、终端输出),实时推断你的意图并主动适配。它还会自主生成 memories,在不同对话之间记住重要的项目上下文。
多模型支持: 可以切换不同的 AI 模型,包括 Gemini、Claude、GPT 系列。
Web 搜索 + 部署: Cascade 可以直接搜索网页、部署应用、检查 live preview,然后把结果反馈到代码中。
不足: 500 credits/月的 Pro 额度对重度用户来说可能不够。生态和社区规模不如 Cursor。部分高级功能的稳定性还在打磨。
适合谁: 预算敏感的开发者、想要 Cursor 级体验但不想花 $20/月的人、对模型选择有强需求的人。
GitHub Copilot: 最便宜的入场券
定价: Free 方案每月 2000 次补全,Pro 只要 $10/月。
Copilot 最大的优势不是某个单一功能,而是无处不在。VS Code、JetBrains、Neovim、Vim,你用什么编辑器它就在什么编辑器里。不需要换 IDE,不需要改工作流。
2026 年的 Copilot 已经不只是代码补全了:
- Agent Mode: 多步骤自主编码,理解意图、构建方案、迭代修复
- Code Review: 在 PR 里自动审查代码,标记潜在问题
- Pro+ ($39/月): 解锁所有模型,包括 Claude Opus 4 和 o3
Premium requests 制在 2025 年 6 月引入后,超出配额的请求按 $0.04/次计费。对大部分开发者来说,$10/月的 Pro 方案的 300 次 premium requests 够用了。
不足: 代码理解深度不如 Cursor 和 Claude Code。Agent 能力起步较晚,成熟度不如专门的 Agent 工具。Pro 方案的模型选择有限。
适合谁: JetBrains 用户(Cursor 不支持)、需要最低成本入门 AI 编码的人、GitHub 重度用户、大型团队统一采购。
Google Antigravity: 来势凶猛的新人
Google 带着 Gemini 模型生态杀入 AI 编码赛道,产品叫 Antigravity。
核心思路是 “Agent-First”: 不是给你一个 chat 窗口,而是让你调度多个专业 Agent 并行工作。AgentKit 2.0 包含 16 个专业化 Agent、40+ 领域技能、11 个预配置命令,覆盖前端、后端、测试等场景。
模型方面,Antigravity 不只用 Gemini。它支持 Gemini 3.1 Pro、Claude Sonnet 4.6 (with Thinking)、Claude Opus 4.6、GPT-OSS 120B。多模型共存。
但现实有点骨感: 2026 年 3 月,大量 Pro 用户($20/月)反映配额问题。官方宣传 5 小时刷新一次配额,实际很多人碰到了 7 天锁定。免费用户在高强度编码 2-3 小时后就会撞墙。
适合谁: 已经深度使用 Google 生态的开发者、想尝试 Agent-First 范式的人、对 Gemini 模型有偏好的人。但目前建议观望,等配额问题稳定后再入坑。
OpenAI Codex: 异步委托的新形态
Codex 的定位和其他工具都不一样。它不是实时编辑你的代码,而是像一个远程开发者: 你下任务,它在云端沙箱里独立执行,完成后提交 PR。
GPT-5-Codex 是专门为 agentic coding 优化的模型,可以连续独立工作超过 7 小时。你在 Slack 里 @Codex 下个任务,它自己在沙箱里写代码、跑测试、修 bug,最后在 thread 里更新进度。
macOS App 和 Windows App 都已发布,支持同时管理多个 Agent 并行处理不同任务。
定价: 含在 ChatGPT 订阅里。$20/月的 Plus 方案就能用基础功能,$200/月的 Pro 有更高额度。API 方面,codex-mini-latest 是 $1.50/$6.00 per million tokens。
不足: 异步模式意味着你看不到实时的代码变化。不适合需要频繁交互和微调的场景。代码质量把控依赖 PR review 流程。
适合谁: 习惯 PR review 工作流的团队、能清晰描述需求的项目经理、想把 AI 当"初级开发者"来用的人。
Amazon Kiro: Spec-Driven 的双刃剑
Kiro 的理念是好的: 先写规范,再写代码。
当你描述一个功能,Kiro 会生成 EARS 格式的需求文档、系统设计方案、依赖有序的实现任务。你审核通过后,它才开始写代码。这种 “spec-driven development” 在理论上应该减少 AI 编码的失控风险。
现实打脸了。
2025 年 12 月,Kiro 被授权修复一个客户系统,它自主决定"最好的办法是删掉整个环境重建"。AWS 中国区 Cost Explorer 宕机 13 小时。
2026 年 3 月更惨: Amazon 主站宕机 6 小时,北美市场订单量暴跌 99%,丢失 630 万个订单。
Amazon 的回应是启动了 90 天的 “code safety reset”。
定价有个特殊设计: Kiro 把请求分成 “vibe requests”(快速编码)和 “spec requests”(规范驱动编码)。Spec requests 单价是 vibe 的 5 倍($0.20 vs $0.04)。Pro $20/月给你 225 vibe + 125 spec requests。这个双轨制让成本核算变得复杂。
适合谁: 说实话,现阶段不太推荐。Kiro 的 spec-driven 理念有价值,但连续的重大事故说明执行层面有严重问题。等 90 天 safety reset 完成、后续版本证明稳定性后再考虑。如果你深度依赖 AWS 生态(Lambda、CDK、CloudFormation),可以关注但别重度依赖。
选购速查表
| 你的情况 | 首选 | 备选 | 理由 |
|---|---|---|---|
| VS Code 用户,想要最全面的体验 | Cursor | Windsurf | Supermaven 补全 + Composer 多 Agent 并行 |
| 终端党,喜欢命令行操作 | Claude Code | Codex CLI | 80.8% SWE-bench, 100万上下文, Agent Teams |
| 预算有限,想花最少的钱 | Copilot ($10) | Windsurf ($15) | 最低价入门, 跨编辑器支持 |
| JetBrains / Neovim 用户 | Copilot | 无 | 唯一支持这些编辑器的选手 |
| 团队采购,需要 PR 工作流 | Codex | Copilot Business | 异步委托 + PR 审核天然适配团队 |
| 想要性价比 IDE 体验 | Windsurf | Cursor | 便宜 $5/月,Cascade 体验不错 |
| Google 生态深度用户 | Antigravity | Cursor | Agent-First 范式,但注意配额问题 |
| AWS 基础设施项目 | 观望 Kiro | Claude Code | Spec-driven 理念好,但等稳定性验证 |
我的搭配方案
说实话,2026 年已经不是"选一个工具走天下"的时代了。我现在的日常搭配:
主力: Claude Code (终端里处理复杂任务、大型重构、跨文件修改) 辅助: Copilot (编辑器里的自动补全,$10/月的底层保障) 偶尔: Cursor (需要看 UI diff、做前端调整的时候)
三个加在一起,月成本大约 $130-150(Claude Code Max 5x + Copilot Pro + Cursor Pro),覆盖了几乎所有开发场景。
如果预算有限只选一个,选 Copilot。$10/月,跨编辑器,够用。
如果预算充足只选一个,选 Cursor。最全面的 IDE 体验,补全 + Agent + 多模型一应俱全。
如果你是终端原教旨主义者,选 Claude Code。没有第二个选择。
Kiro 事件的启示
不管你用哪个工具,Amazon Kiro 的事故是整个行业的警钟。
630 万个订单不是因为 AI 写了烂代码。是因为没有人审查 AI 写的代码就直接部署了。是因为 AI Agent 被给了过多的权限,可以自主决定"删掉整个环境重建"。
HashiCorp 创始人 Mitchell Hashimoto 说得对: “我强迫自己学会如何让 Agent 产出与我相同质量的结果。”
AI 编码不是 vibe coding。是有纪律的人机协作。
底线规则:
- AI 改的代码必须 review,和人写的代码一视同仁
- 破坏性操作(删库、改权限、推生产)必须人类确认
- 给 AI 设权限边界,不能自主执行不可逆操作
- 定期审计 AI 的操作日志
工具会越来越强。但用工具的人,也需要越来越有纪律。
本文首发于 aieii.com,一个关注 AI 工具与趋势的中文内容平台。