AI 编程正在经历一次根本性的范式转移。从 Tab 补全到同步 Agent,再到如今运行在独立云端虚拟机上的 Cloud Agent——开发者不再需要逐行引导 AI,而是启动多个自主 Agent,让它们在云端独立完成从编码到测试、从构建到演示的完整开发流程。Cursor 内部已有超过 35% 的合并 PR 由 Agent 自主创建,Agent 使用量年增长 15 倍。这不是渐进式的改良,而是一次范式级的跳跃。
核心要点
- 三个时代:Tab 补全(第一时代)→ 同步 Agent(第二时代)→ Cloud Agent(第三时代),每一代的转换周期都在加速
- Cloud Agent 本质:Agent 运行在独立的云端 VM 中,拥有完整的开发环境(浏览器、终端、测试运行器),开发者可并行启动多个 Agent
- 产出变革:从 diff 到 artifact——Cloud Agent 的产出包括日志、视频录制、实时预览和可合并的 PR
- 数据验证:Cursor 内部 35% 已合并 PR 由 Agent 创建,Agent 用户数量已是 Tab 用户的 2 倍
- 角色转变:开发者从写代码转向分解问题 → 启动 Agent → 审查 artifact → 给出反馈
想要快速浏览和对比各种 AI 编程工具和 Agent 框架?访问我们的工具导航:
👉 AI 工具导航 · Agent 工具导航
AI 编程的三个时代:从补全到自治
要理解 Cloud Agent 的革命性意义,我们需要先回顾 AI 编程演进的完整脉络。Cursor CEO Michael Truell 将其精炼地划分为三个时代,每个时代都从根本上重新定义了人与 AI 的协作模式。
第一时代:Tab 补全(2022-2024)
第一时代的代表是 GitHub Copilot 和 Cursor Tab。AI 识别低熵的重复代码模式,开发者按下 Tab 接受建议。这是"AI 辅助"的起点——AI 处理机械性的编码,开发者保留完整的控制权。
# 第一时代:Tab 补全
# 开发者写下函数签名,AI 补全函数体
def calculate_fibonacci(n: int) -> int:
# AI 自动补全 ↓
if n <= 1:
return n
return calculate_fibonacci(n - 1) + calculate_fibonacci(n - 2)
这个时代持续了近两年。开发者仍然手写绝大部分逻辑,Tab 补全主要消除的是边缘摩擦。
第二时代:同步 Agent(2024-2025)
当大语言模型(LLM)的推理能力提升到足以充当"对话式代理"时,第二时代到来。开发者不再逐行敲代码,而是通过 prompt-response 循环引导 Agent 完成任务。Cursor 的 Composer、Copilot Chat、TRAE 的 IDE 模式都是典型代表。
// 第二时代:同步 Agent 对话
// 开发者: "给用户列表添加分页功能,每页20条,支持上一页/下一页"
// Agent 生成完整实现 ↓
interface PaginationParams {
page: number;
pageSize: number;
}
function paginateUsers(users: User[], params: PaginationParams) {
const { page, pageSize } = params;
const startIndex = (page - 1) * pageSize;
return {
data: users.slice(startIndex, startIndex + pageSize),
total: users.length,
currentPage: page,
totalPages: Math.ceil(users.length / pageSize),
};
}
同步 Agent 的限制也很明显:它与开发者的本地机器资源竞争,需要开发者在每个决策点保持在场,单次只能处理一个任务。
第三时代:Cloud Agent(2026-)
第三时代彻底打破了这两个限制。Cloud Agent 运行在隔离的云端虚拟机中,接收任务后自主工作数小时,返回包含完整 artifact(日志、视频录制、实时预览)的合并就绪 PR。开发者的角色从"写代码"变为"定义问题并评估产出"。
# 第三时代:Cloud Agent 任务描述
# 开发者在 Slack 中启动一个 Cloud Agent
task: |
用户报告了一个剪贴板数据泄露的安全漏洞。
请:
1. 复现问题并构建 PoC 演示页面
2. 定位根因并实现修复
3. 添加回归测试
4. 录制修复前后的对比视频
5. 创建合并就绪的 PR
# Agent 自主在 VM 中执行:
# → 启动后端服务 → 构建 HTML 演示页 → 运行测试 → 录制视频 → 提交 PR
# 开发者收到通知后审查 artifact
时代演进的速度在加速:Tab 时代持续了近两年,同步 Agent 时代可能不到一年就会被 Cloud Agent 全面替代。
Cloud Agent 的核心架构:VM 隔离与 Artifact 产出
Cloud Agent 之所以能实现真正的自主执行,关键在于其底层的虚拟机隔离架构和全新的 artifact 产出模式。
独立 VM 架构
每个 Cloud Agent 运行在一个完全隔离的云端虚拟机中,拥有:
- 完整的开发环境:编辑器、终端、构建工具、测试运行器
- 浏览器实例:能够启动服务器、导航网页、验证 UI 效果
- 文件系统访问:读写代码库、操作 Git 分支
- 网络能力:访问 API、下载依赖、与外部服务交互
这意味着 Agent 不再与开发者的本地机器竞争 CPU、内存和 GPU 资源。开发者可以同时启动 5 个、10 个甚至更多 Agent,每个 Agent 在自己的 VM 中独立工作。
// Cloud Agent 运行环境的概念模型
const cloudAgent = {
vm: {
os: "Linux",
cpu: "dedicated vCPUs",
memory: "dedicated RAM",
storage: "ephemeral SSD",
network: "isolated VPC",
},
tools: {
editor: "headless VS Code / Cursor",
terminal: "full bash shell",
browser: "headless Chromium",
git: "full Git CLI with repo access",
testRunner: "jest / pytest / go test",
},
capabilities: [
"read and write files",
"run shell commands",
"start servers",
"navigate web pages",
"take screenshots",
"record video demos",
"create pull requests",
],
};
从 Diff 到 Artifact:产出模式的根本变化
同步 Agent 时代,AI 的产出主要是代码 diff——开发者需要逐行审查每一处变更,在脑中重建完整上下文。Cloud Agent 时代,产出变成了丰富的 artifact:
| 产出类型 | 同步 Agent | Cloud Agent |
|---|---|---|
| 代码变更 | diff/patch | 合并就绪的 PR |
| 执行过程 | 实时终端输出 | 结构化日志 |
| 验证证据 | 无 | 测试报告 + 截图 |
| 演示素材 | 无 | 视频录制 + 实时预览 |
| 审查方式 | 逐行 code review | 先看 demo,再审代码 |
这个转变带来了一个关键优势:并行审查成为可能。当 5 个 Agent 同时完成任务时,开发者可以先看每个 Agent 的演示视频和截图,快速判断方向是否正确,然后再深入审查值得关注的 PR 代码细节。
数据说话:Agent 正在接管代码生产
来自行业头部团队的数据清晰地展示了这场转变的速度和规模。
Cursor 的内部数据
Cursor CEO Michael Truell 在 2026 年 2 月披露了几组关键数据:
- 35% 的已合并 PR 由在云端 VM 中自主运行的 Agent 创建
- Agent 使用量年增长 15 倍:Agent 从实验性功能变成了核心工作流
- 用户比例反转:2025 年 3 月,Tab 用户是 Agent 用户的 2.5 倍;到 2026 年初,Agent 用户反过来是 Tab 用户的 2 倍
- Cursor 团队认为,同步 Agent 时代可能不到一年就会被取代,比 Tab 时代的两年更短
这些数据来自 Cursor 自身团队的实际开发流程——不是实验室数据,而是生产环境的真实产出。当一家 AI 编程工具公司自己都用 Agent 完成了三分之一的代码合并,这说明 Cloud Agent 已经越过了实用性的临界点。
Agent 的能力进化
2026 年 2 月 24 日,Cursor 发布了"Agent 可以控制自己的计算机"更新。这不仅仅是一个功能点,而是能力边界的质变:
- Agent 可以启动服务器、打开浏览器、导航网页
- Agent 可以操作电子表格、运行测试套件
- Agent 可以与它自己创建的软件进行交互
- 开发者可以远程接管 Agent 的桌面,直接操作修改后的软件
- 所有操作均在隔离的 VM 中完成,不影响本地环境
这意味着 Agent 的任务范围从"生成代码"扩展到了"构建并演示可工作的软件"。
主流 Cloud Agent 实践:Cursor、TRAE 与 GitHub
Cloud Agent 范式不是单一产品的创新,而是整个行业的趋势。以下是三个最具代表性的实践。
Cursor Background Agent
Cursor 的 Background Agent 是目前最成熟的 Cloud Agent 实现。其工作流程为:
- 开发者在 Cursor(桌面端/Web 端/移动端/Slack/GitHub)中描述任务
- Agent 在云端 VM 中自动加载代码库、理解项目结构
- Agent 自主执行编码、测试、调试循环
- Agent 生成合并就绪的 PR,附带日志、视频录制和实时预览
- 开发者审查 artifact,通过远程桌面直接体验修改后的软件
# 通过 Cursor CLI 启动 Background Agent
cursor agent start \
--task "重构认证模块,将 session-based auth 迁移到 JWT" \
--branch "feature/jwt-auth-migration" \
--notify slack:#engineering \
--artifacts video,preview,logs
# Agent 在云端 VM 中自主执行:
# 1. 克隆仓库 → 分析代码结构
# 2. 实现 JWT 认证逻辑
# 3. 迁移所有路由的中间件
# 4. 运行测试套件 → 修复失败的测试
# 5. 录制演示视频 → 生成实时预览链接
# 6. 创建 PR → 通知 Slack
TRAE SOLO:响应式编码 Agent
TRAE(The Responsive Coding Agent)采取了不同的路径。它的定位是"响应式编程智能体",SOLO 模式让 AI 主导整个开发过程:
- IDE 模式:保留传统开发流程,AI 在侧边辅助(类似第二时代的同步 Agent)
- SOLO 模式:AI 自主驱动整个开发流程,从需求理解到代码交付
SOLO Coder 的独特之处在于其多 Agent 架构——不是单个 Agent 串行执行,而是多个专业化 Agent 并行协作:一个负责架构设计,一个负责代码实现,一个负责测试编写,一个负责代码审查。
关于 AI Agent 的更多基础概念和架构设计,可以参考我们的深度指南:《如何构建 AI Agent?架构设计与代码实战指南》。
GitHub Agentic Workflows
GitHub 从另一个角度切入 Cloud Agent 范式——将 Agent 嵌入 CI/CD 流水线。2026 年初进入 Technical Preview 的 GitHub Agentic Workflows 有几个核心特征:
- Markdown 替代 YAML:用自然语言 Markdown 文件描述工作流意图,替代复杂的 YAML 配置
- 运行在 GitHub Actions 中:Agent 在 Actions runner 中执行,利用现有的 CI/CD 基础设施
- 覆盖百万仓库:与 GitHub Actions 生态集成,可跨越数百万个仓库部署
<!-- .github/workflows/auto-triage.md -->
# Issue 自动分类与修复
当新 Issue 被创建时:
1. 分析 Issue 描述,判断是 Bug 报告还是功能请求
2. 如果是 Bug:尝试复现,定位根因,创建修复 PR
3. 如果是功能请求:评估影响范围,生成技术方案草案
4. 自动添加合适的标签和负责人
5. 在 Issue 中回复分析结果
这种 Agentic Workflow 的意义在于:Agent 不再是开发者手动触发的一次性工具,而是持续运行在仓库中的"数字员工"——自动处理 Issue 分类、PR 审查、CI 失败分析、依赖维护等日常工作。
关于 LLM 在 CI/CD 中的实际集成方案,推荐阅读:《LLM 驱动的 CI/CD:自动化代码审查实战》。
自驱动代码库:从愿景到路线图
所有这些 Cloud Agent 实践指向同一个终极愿景——自驱动代码库(Self-Driving Codebase)。这个类比借用了自动驾驶的分级模型,描述了代码库从人工维护到自主演化的渐进过程。
三阶段演进路径
阶段一:建立 Agent 原语(Primitives)
在代码库中引入基础的 Cloud Agent 能力——自动化测试、自动代码审查、自动依赖更新。这是"L2 辅助驾驶",Agent 处理特定的、定义明确的任务。
阶段二:发现系统瓶颈
随着 Agent 承担更多任务,系统中的瓶颈开始浮现:不充分的测试覆盖率、不清晰的需求文档、缺失的 Context Engineering(上下文工程) 实践。这个阶段的核心工作是优化"Agent 的工作环境"。
阶段三:规模化软件工厂
多个 Agent 并行运行,每个 Agent 专注于不同的职责。开发者从 in-the-loop(深度参与每个步骤)转变为 on-the-loop(监督和指导整体方向)。
实践中的自驱动模式
以一个典型的中型 SaaS 项目为例,自驱动代码库可能包含以下持续运行的 Agent:
# self-driving-codebase.yaml
agents:
- name: triage-agent
trigger: "new issue created"
action: "分析 Issue → 分类 → 分配 → 尝试自动修复"
- name: review-agent
trigger: "new PR created"
action: "代码审查 → 安全扫描 → 性能分析 → 反馈"
- name: dependency-agent
trigger: "weekly schedule"
action: "扫描依赖 → 更新次要版本 → 运行测试 → 创建 PR"
- name: docs-agent
trigger: "API schema changed"
action: "同步 API 文档 → 更新 SDK → 通知下游"
- name: test-agent
trigger: "coverage drops below threshold"
action: "分析未覆盖路径 → 生成测试用例 → 创建 PR"
对多 Agent 系统架构感兴趣的读者,可以深入了解:《多 Agent 系统架构深度解析》。
开发者角色的根本转变
Cloud Agent 时代对开发者的影响远超工具层面——它正在重新定义"软件工程师"这个职业的核心技能要求。
从代码编写者到 Agent 协调者
| 维度 | 传统开发者 | Cloud Agent 时代开发者 |
|---|---|---|
| 核心技能 | 编写高质量代码 | 分解问题 + 审查 artifact |
| 时间分配 | 70% 写代码,30% 审查 | 20% 写代码,40% 审查,40% 规划 |
| 工具关系 | 使用 IDE 写代码 | 协调多个 Agent 并行工作 |
| 质量保证 | 手动测试 + code review | 定义审查标准 + 评估 Agent 产出 |
| 工作模式 | 同步、串行 | 异步、并行 |
这种转变的本质可以用 Cursor 团队的工厂比喻来概括:开发者不再直接构建产品,而是构建和监督"构建产品的系统"。
新时代的核心能力
问题分解能力:将模糊的需求拆解为 Agent 可执行的明确任务,这比写代码更考验工程思维。
上下文工程:为 Agent 准备充分且精准的上下文——项目规范文件、架构文档、测试策略——直接决定 Agent 的输出质量。关于这个重要话题,推荐阅读 Context Engineering 概念解析。
Artifact 审查能力:快速评估 Agent 产出的质量——不是逐行看代码,而是先看演示视频、测试报告和性能指标,再决定是否深入代码细节。
反馈精确度:当 Agent 的产出不符合预期时,给出精确的反馈(而非重新写一遍),引导 Agent 迭代改进。
同步 Agent vs Cloud Agent:全面对比
为了帮助团队评估是否以及如何迁移到 Cloud Agent 工作流,以下是两种模式的系统性对比:
| 对比维度 | 同步 Agent | Cloud Agent |
|---|---|---|
| 运行环境 | 开发者本地机器 | 独立云端 VM |
| 资源竞争 | 与本地 IDE/浏览器竞争 | 完全隔离,无竞争 |
| 任务时长 | 分钟级(需持续关注) | 小时级(异步执行) |
| 并行度 | 单任务串行 | 多 Agent 并行 |
| 开发者在场 | 每个决策点都需在场 | 仅审查最终 artifact |
| 产出格式 | 代码 diff | PR + 日志 + 视频 + 预览 |
| 审查方式 | 逐行 code review | 先看 demo,再审代码 |
| 适用场景 | 小范围修改、探索性编码 | 跨文件重构、功能开发、Bug 修复 |
| 成本模型 | 按 token 计费 | 按 VM 时间 + token 计费 |
| 成熟度 | 已广泛采用 | 快速成熟中(2026 年主流化) |
| 代表产品 | Cursor Composer, Copilot Chat | Cursor Background Agent, TRAE SOLO |
两种模式不是替代关系,而是互补关系。同步 Agent 适合快速的探索性编码和小范围修改,Cloud Agent 适合可以明确定义的中大型任务。Vibe Coding(氛围编程)的理念可以同时应用于两种模式——关于如何高效地与 AI 协作编程,推荐阅读:《Vibe Coding 实战:AI 编程的艺术与科学》。
安全与信任:Cloud Agent 的阿喀琉斯之踵
当 Agent 拥有代码仓库的完整访问权、能够自主执行命令和创建 PR 时,安全问题不再是理论风险。
核心风险矩阵
| 风险类型 | 描述 | 缓解措施 |
|---|---|---|
| 代码注入 | Agent 可能引入含有漏洞的代码 | 必须通过 CI 安全扫描 |
| 数据泄露 | Agent 访问包含敏感信息的文件 | 最小权限 + 文件级访问控制 |
| 供应链攻击 | Agent 可能引入恶意依赖 | 锁定依赖版本 + 审计新增依赖 |
| Prompt 注入 | Issue/PR 中的恶意指令操纵 Agent | 输入清洗 + Agent 行为边界 |
| 过度信任 | 自动合并未经充分审查的 PR | 设置人工审批门禁 |
安全最佳实践
# agent-security-policy.yaml
security:
sandbox:
type: "isolated-vm"
network: "restricted"
allowed_domains:
- "github.com"
- "registry.npmjs.org"
blocked_operations:
- "modify CI/CD config"
- "access production secrets"
- "delete branches"
review_gates:
- name: "ci-must-pass"
required: true
- name: "security-scan"
required: true
- name: "human-approval"
required_for:
- "changes to auth modules"
- "infrastructure config changes"
- "dependency additions"
audit:
log_all_commands: true
log_file_access: true
retention: "90 days"
安全问题的本质是:我们正在将更多的自主权交给 AI 系统,这需要更成熟的工程实践来确保信任边界。关于 Agent 系统的安全性和护栏设计,可以参考 MCP(Model Context Protocol) 在工具调用安全方面的设计思路,也可以通过 MCP 服务器导航 了解更多安全相关的 MCP 工具集成。
展望:当代码库学会自我驱动
Cloud Agent 时代才刚刚开始。2026 年初的现状是:Cursor Background Agent 已经证明了可行性,TRAE SOLO 正在探索响应式编码的新边界,GitHub Agentic Workflows 正将 Agent 能力嵌入全球最大的代码托管平台。
未来 12-18 个月的关键趋势:
- Agent 间协议标准化:多个 Agent 之间需要标准化的通信协议(MCP 已经在工具调用层面开始这项工作),实现跨平台的 Agent 协作
- 从代码 Agent 到产品 Agent:Agent 的能力将从代码生成扩展到产品设计、用户测试、A/B 实验——覆盖完整的产品交付链路
- Agent 评估体系成熟:如何衡量 Agent 的输出质量、可靠性和安全性,将催生新的评估框架和基准测试
- 开发者教育转型:编程教育将从"如何写代码"转向"如何分解问题、协调 Agent、审查产出"
这不是关于 AI 是否会取代开发者的讨论——而是关于开发者如何在一个 Agent 驱动的世界中重新定义自己的价值。最好的开发者将是那些能够构建和管理"自驱动代码库"的人。
本文是 AI Agent 开发实战 专栏的第 9 篇。上一篇我们深入探讨了 Claude Code 的终端到 CI/CD 全链路实践,下一篇将继续探索 Agent 工程化的前沿实践。