Cursor 3:不只是升级,而是重新定义
2026 年 4 月 2 日,Anysphere 发布了 Cursor 3。这不是一次常规的版本迭代——它是对"AI 编程工具应该长什么样"这个问题的一次彻底重答。
Cursor 的起点是 VS Code 的一个分支,赌的是开发者愿意为更好的 AI 辅助买单。这个赌注赢得很彻底:ARR(年度经常性收入)在 2026 年初达到了 20 亿美元,三个月内翻了一倍。Slack 花了五年才到 10 亿,Zoom 花了九年,Cursor 只用了不到两年。
但 Cursor 团队没有停在"更好的代码补全"上。他们的内部数据揭示了一个关键转折:Agent 用户已经以 2:1 的比例超过了 Tab 补全用户。一年前,这个比例还是反过来的。Cursor 3 就是对这个数据趋势的产品化回应——IDE 不再是中心,Agent 才是。
如果你还不了解 AI Agent 的基本概念,可以先阅读 AI Agent(智能体) 术语解释。
本文将从架构变革、核心功能到实战配置,全面解析 Cursor 3 的每一个关键能力。
统一 Agent 工作空间:告别编辑器中心思维
Cursor 3 最显眼的变化是引入了 Agents Window(Agent 窗口)。这不是在编辑器侧边栏多加了一个面板,而是一个从零开始围绕 Agent 构建的全新界面。
从文件驱动到 Agent 驱动
传统 IDE 的核心概念是"文件"——你打开文件、编辑文件、保存文件。AI 功能只是叠加在文件操作之上的辅助层。Cursor 3 反转了这个关系:
- Agents Window 是默认的工作界面,显示所有正在运行的 Agent 及其状态
- 每个 Agent 以标签页形式呈现,支持平铺布局(Tiled Layout),你可以同时查看多个 Agent 的工作进度
- 传统的 VS Code 编辑器仍然保留——当你需要手动检查文件、调试代码或做细粒度编辑时,随时可以切换回去
Cursor 团队的 VP of Developer Education Lee Robinson 解释了保留编辑器的原因:"即使 Agent 写了 98% 的代码,剩下那 2% ——查看文件、调试、小改动、跳转到定义、LSP 支持——仍然不可或缺。"
多 Agent 并行执行
在 Agent 窗口中,你可以同时启动多个 Agent,每个处理不同的任务:
# Agent 1: 重构后端服务层
> cursor agent --task "Refactor the auth service to use JWT rotation"
# Agent 2: 编写单元测试
> cursor agent --task "Write unit tests for the payment module"
# Agent 3: 更新文档
> cursor agent --task "Update API docs to reflect v3 endpoints"
每个 Agent 运行在独立的 Git worktree 中,互不干扰。你还可以使用 /best-of-n 命令让不同模型竞速解决同一问题:
/best-of-n sonnet, gpt, composer Fix the flaky logout test
Cursor 会为每个模型创建独立的 Git worktree,完成后你可以比较结果,选择最佳方案并用 /apply-worktree 合并到主分支。
多入口触发
Agent 不再只能从桌面 IDE 启动。Cursor 3 支持从以下入口触发 Agent:
- 桌面应用(macOS、Windows、Linux)
- Web 端和移动端
- Slack:直接在频道中 @Cursor 分配任务
- GitHub:通过 Issue 或 PR 评论触发
- Linear:从项目管理工具直接派发开发任务
这意味着你可以在手机上审查 Agent 的工作成果,在地铁里就把一个 Bug 修复任务分配给云端 Agent。
Cloud Agent:你关上笔记本,它继续写代码
Cloud Agent 是 Cursor 3 最具颠覆性的能力。这不是"在云端运行你的 IDE",而是给 Agent 一台独立的虚拟机,让它自主完成整个开发任务。
隔离 VM 架构
每个 Cloud Agent 运行在一台独立的 Ubuntu 虚拟机中,不是共享内核的容器,而是完全隔离的 VM:
VM 内包含完整的开发环境——系统包、语言运行时、开发服务器、测试套件、浏览器。你可以通过两种方式配置环境:
方式一:Agent 自主配置。 指定仓库地址和必要的 Secrets,Agent 自己搞清楚如何搭建环境。
方式二:声明式配置文件。 在仓库根目录放置 .cursor/environment.json:
{
"setup": {
"commands": [
"nvm install 20",
"npm ci",
"npx prisma generate"
]
},
"services": {
"database": "postgres:16",
"cache": "redis:7"
},
"env_file": ".env.cloud"
}
安全提醒:Secrets 应该保存在 Cursor Settings 的 Secrets 标签页中,不要写在配置文件里。
Agent 的自主工作流
Cloud Agent 的工作方式真正体现了"委派"而非"指挥":
- 你描述任务——可以是自然语言,可以附带截图、设计稿
- Agent 克隆仓库——在 VM 中拉取最新代码
- Agent 编写代码——理解项目结构,修改相关文件
- Agent 运行测试——执行测试套件,如果失败会自行修复
- Agent 录制 Demo——通过浏览器操作,生成视频和截图证明功能正常
- Agent 提交 PR——附带视频、截图和日志,等待你审查
关闭笔记本后,这一切都在继续。完成时你会收到通知。
本地与云端无缝切换
Agent 会话可以在本地和云端之间双向迁移:
- 本地 → 云端:长时间运行的任务推到云端,关机也不影响
- 云端 → 本地:需要访问本地文件系统或开发服务器时,拉回本地继续
对于企业用户,自托管 Cloud Agent(Self-hosted Cloud Agents)自 2026 年 3 月 25 日起可用。代码、工具执行和构建产物全部运行在你自己的基础设施内,worker 进程通过 HTTPS 出站连接到 Cursor 云,无需入站端口或 VPN。
想深入了解 Agent 架构设计?推荐阅读 AI Agent 导航 中收录的开源 Agent 框架。
Composer 2:专为 Agent 打造的自研模型
2026 年 3 月 19 日发布的 Composer 2 是 Cursor 的第一个真正意义上的自研编码模型。它不是通用大模型,而是专门为 Agent 编程场景优化的"编码引擎"。
技术架构
Composer 2 基于 Moonshot AI 的 Kimi K2.5 进行了持续预训练,并在此基础上进行了 4 倍规模的强化学习。Cursor 没有在发布时公开基座模型信息——一位用户在 API 响应头中发现了 Kimi 标识后,联合创始人 Aman Sanger 承认了这一点:"没有在博客中提到 Kimi 基座是我们的失误。下一个模型我们会改正。"
性能数据(来自 CursorBench,非独立审计):
| 指标 | Composer 2 | Composer 1.5 | Claude Opus 4.6 |
|---|---|---|---|
| CursorBench 得分 | 61.3 | 44.2 | ~55 |
| 推理速度 | 200+ tokens/s | ~100 tokens/s | ~80 tokens/s |
| 输入成本 (每 M tokens) | $0.50 (Standard) | — | $15.00 |
| 输出成本 (每 M tokens) | $2.50 (Standard) | — | $75.00 |
Composer 2 有两个变体:
Standard: $0.50/M 输入, $2.50/M 输出 — 适合日常编码
Fast(默认): $1.50/M 输入, $7.50/M 输出 — 更快的响应速度
在更复杂的任务上,GPT-5.4 仍然表现更强。但在 CursorBench 的典型场景(平均 352 行代码、8 个文件的修改)中,Composer 2 的性价比碾压一切——成本比 Claude Opus 4.6 低约 90%。
200K 上下文窗口与自动摘要
Composer 2 支持 200,000 token 的上下文窗口。当对话长度接近上限时,模型会自动将之前的上下文压缩为约 1,000 tokens 的摘要,然后继续工作。这意味着一个 Agent 可以在单次会话中持续迭代,不会因为上下文耗尽而"失忆"。
了解更多关于上下文管理的策略,请参阅 上下文工程(Context Engineering) 术语解释。
与第三方模型的关系
Composer 2 在 Pro 及以上方案中拥有独立的使用额度池,不占用 Claude、GPT 等第三方模型的额度。这意味着你可以让 Agent 日常任务用 Composer 2(便宜快速),遇到难题时切换到 Claude Opus 或 GPT-5(更强但更贵),两者互不冲突。
Bugbot:会自我进化的代码审查 Agent
Bugbot 从一个 Bug 检测器进化为 Cursor 3 中最有"生命力"的功能——它不只是静态地扫描代码,而是能从你的团队行为中学习,持续进化审查策略。
Learned Rules:从反馈中学习
Learned Rules 是 Bugbot 最核心的创新。它的工作机制如下:
- Bugbot 对 PR 发表审查评论
- 团队成员通过表情回应(点赞或踩)、回复评论给出反馈
- 人类审查者自己写的评论也被分析
- Bugbot 从这些信号中生成候选规则
- 候选规则经过验证后,自动融入后续审查
# .cursor/bugbot-rules.yaml(Learned Rules 示例)
learned_rules:
- id: "rule-auth-check"
source: "PR #342 reviewer feedback"
pattern: "API endpoint without auth middleware"
severity: "error"
message: "All /api/* routes must use authMiddleware()"
- id: "rule-error-boundary"
source: "PR #358 emoji reaction"
pattern: "React component without ErrorBoundary"
severity: "warning"
message: "Top-level page components should be wrapped with ErrorBoundary"
MCP 支持
2026 年 4 月 8 日的更新为 Bugbot 增加了 MCP(模型上下文协议) 支持。这意味着 Bugbot 可以连接外部工具——比如你的内部安全扫描服务、性能分析平台或自定义 linter——将它们的输出作为审查的额外上下文。
Autofix 改进
Bugbot Autofix 不只是指出问题,还会自动生成修复代码。2026 年 4 月的版本达到了历史最高的 resolution rate(解决率)。结合 Learned Rules,Bugbot 的修复建议会越来越贴合你的代码规范。
Canvases:Agent 创建的可视化画布
2026 年 4 月 15 日发布的 Canvases 是 Cursor 3.1 的亮点功能。它解决了一个长期痛点:Agent 的输出不再只有文字和 Markdown。
从文本到交互界面
Canvases 允许 Agent 创建包含以下元素的可视化内容:
- 仪表盘:展示真实数据的交互图表
- 表格:结构化数据的展示和排序
- 流程图和架构图:用 Cursor 原生组件渲染
- Diff 视图:代码变更的可视化对比
- 待办列表:可交互的任务管理
在 Agents Window 中,Canvas 是持久化的产物(durable artifact),与终端、浏览器、源代码控制并列存在于侧边面板中。
使用场景举例:
你: "分析这个 PR 的变更,用可视化方式展示受影响的模块"
Agent 创建 Canvas:
┌─────────────────────────────────────┐
│ PR #487 影响分析仪表盘 │
│ │
│ ┌──────┐ ┌──────┐ ┌──────┐ │
│ │ Auth │───→│ User │───→│ API │ │
│ │ 3 files│ │ 5 files│ │ 2 files│ │
│ └──────┘ └──────┘ └──────┘ │
│ │
│ 变更统计: +342 / -128 / 10 files │
│ 测试覆盖: 87% → 91% │
│ 风险评估: 中等 │
└─────────────────────────────────────┘
这比阅读一堵文字墙高效得多。Agent 甚至可以利用 Canvas 来辅助 PR 代码审查、学习新框架或在 Cursor 内创建小型应用原型。
实战配置:让 Cursor 3 最大化发挥
.cursorrules 项目配置
Cursor 的规则系统是 上下文工程(Context Engineering) 在 AI IDE 中的最佳实践。一份好的规则文件能将 Agent 的任务成功率从 30% 提升到 90%:
{
"version": 2,
"rules": [
{
"name": "tech-stack",
"content": "This is a Next.js 14 + TypeScript project using App Router. Use Server Components by default. All data fetching should happen in Server Components or Route Handlers."
},
{
"name": "code-style",
"content": "Use functional components with hooks. Named exports only. camelCase for variables, PascalCase for components. No 'any' type."
},
{
"name": "testing",
"content": "Write tests with Vitest + Testing Library. Each component must have a corresponding test file. Mock external services, never test implementation details."
},
{
"name": "forbidden",
"content": "Never use class components. Never hardcode strings—all user-facing text must use i18n. Never commit .env files."
}
],
"bugbot": {
"enabled": true,
"autofix": true,
"learnedRules": true,
"mcpServers": ["internal-security-scanner"]
}
}
在编写和验证 JSON 格式的配置文件时,推荐使用 JSON 格式化工具 检查语法。
Worktree 配置
// .cursor/worktrees.json
{
"defaults": {
"cleanup": "after-merge",
"isolateNodeModules": true
},
"profiles": {
"feature": {
"branch_prefix": "feat/",
"auto_test": true
},
"hotfix": {
"branch_prefix": "hotfix/",
"auto_test": true,
"auto_deploy_staging": true
}
}
}
MCP Server 集成
// .cursor/mcp-servers.json
{
"servers": {
"database": {
"command": "npx",
"args": ["@cursor/postgres-mcp"],
"env": {
"DATABASE_URL_ENV": "POSTGRES_URL"
}
},
"monitoring": {
"url": "https://api.internal.com/mcp",
"auth": {
"type": "bearer",
"token_env": "MONITORING_TOKEN"
}
}
}
}
了解更多关于 MCP 的使用方式,可参考我们的 提示词工程(Prompt Engineering) 术语,以及 AI 编程助手定制化指南 中的详细实践。
商业数据与行业定位
ARR 火箭式增长
Cursor 的商业数据令人瞠目:
- 2025 年 1 月:ARR 约 1 亿美元
- 2025 年底:ARR 约 10 亿美元
- 2026 年 3 月:ARR 突破 20 亿美元——三个月翻倍
- 超过一半的财富 500 强企业是 Cursor 客户
- 付费开发者超过 100 万
据报道,SpaceX 参与了 Cursor 母公司 Anysphere 的投资,估值高达 600 亿美元。Cursor 正在从一个开发工具公司转型为一个 AI 编码基础设施平台。
定价方案全解
| 方案 | 月费 | 核心价值 |
|---|---|---|
| Hobby | 免费 | 有限 Agent 请求 + Tab 补全,适合评估 |
| Pro | $20/月 | Cloud Agent、Composer 2、Bugbot、MCP |
| Pro+ | $60/月 | Pro 的所有功能 + 3 倍模型用量 |
| Ultra | $200/月 | 20 倍模型用量 + 新功能优先体验 |
| Teams | $40/人/月 | 共享聊天、组织策略、团队管理 |
| Enterprise | 定制 | SSO、审计日志、自托管 Cloud Agent |
关键细节:Composer 2 有独立的使用额度池,基于消费金额($)而非请求次数。不同模型的 API 成本不同,会以不同速度消耗你的包含额度。
vs 其他工具的差异化
相比 Vibe Coding 工具横评 中涉及的其他 AI 编程工具,Cursor 3 的差异化定位非常清晰:
- vs GitHub Copilot:Cursor 拥有自研模型(Composer 2)和更激进的 Agent-first 界面,但 Copilot 在 GitHub 生态集成上无可匹敌
- vs Claude Code:Cursor 是 GUI 优先的全功能 IDE,Claude Code 是终端优先的轻量级 Agent
- vs TRAE SOLO:Cursor 强调多 Agent 并行和模型竞速,TRAE 强调端到端自动化和免费策略
- vs Windsurf/Augment:Cursor 在自研模型和 Agent 基础设施上的投入远超同类
Cursor 3 的核心竞争力不在于某个单点功能,而在于它构建了一个完整的 Agent 操作系统——从自研模型、到 Agent 运行时、到云端 VM 基础设施、再到 Bugbot 的持续学习。
想了解更完整的工具对比?推荐阅读 2026 AI 编程工具全景对比。
未来展望:从编辑器到代码工厂
Cursor CEO Michael Truell 描述了 AI 软件开发的三个时代:
- Tab 补全时代:AI 填充样板代码
- 同步 Agent 时代:开发者逐步引导 Agent
- Cloud Agent 时代:Agent 在云端自主运行,开发者扮演"导演"
Truell 说过一句引人深思的话:"Cursor 不再主要是关于写代码。而是关于帮助开发者构建一座创造软件的工厂。"
这当然是愿景而非现实。今天使用 Cursor 3 的大多数开发者仍然需要频繁审查和修正 Agent 的输出。但趋势是明确的:
- Spec Coding(规约编程) 将取代 Vibe Coding 成为 Agent 时代的主流方法论
- Vibe Coding(氛围编程) 仍然适合快速原型和探索性开发
- 开发者的核心价值将转向架构设计、需求定义和质量把关
Cursor 3 是这个转变的一个重要里程碑。无论你是否选择它作为主力工具,理解它背后的设计理念——Agent-first、自研模型、持续学习——对每一位现代开发者都有参考价值。
相关资源
- AI 工具导航 — 发现更多 AI 开发工具
- Agent 导航 — 探索开源 Agent 框架
- AI 编程助手定制化指南 — 深度定制你的 AI IDE
- Vibe Coding 工具横评 — AI IDE 全面对比
- Spec Coding 深度解析 — 规约编程方法论
- Vibe Coding 核心理念与实践 — 氛围编程入门