什么是 Agent 轨迹(Agent Trajectory)?

Agent 轨迹(Agent Trajectory)是 AI Agent 一次运行的有序记录,包括观察、消息、决策、工具调用、工具结果、错误、审批、状态变化和最终输出。

工作原理

Agent 轨迹是 Agent 实际做了什么的证据链。它不同于最终答案:它捕获导致答案或动作的中间步骤。轨迹对调试、评估、审计、成本分析和安全审查至关重要。轨迹应有足够结构,便于回放或检查;但它也需要谨慎隐私处理,因为其中可能包含用户数据、检索文档、工具输出和敏感推理产物。

主要特点

  • 有序运行记录:保留观察、决策、动作和结果的顺序
  • 调试资产:帮助定位 Agent 从哪一步开始错误、卡住或不安全
  • 评估输入:可评估工具选择、证据使用、策略合规和任务成功
  • 审计轨迹:记录审批、副作用、错误和最终输出
  • 隐私敏感:可能包含提示词、用户数据、检索上下文和工具输出

常见用途

  1. 调试 Agent 为什么调用了错误工具
  2. 评估 RAG Agent 是否使用了合适证据
  3. 审计邮件或工单等外部可见动作
  4. 从失败或成功的 Agent 运行中构建回归测试
  5. 按步骤计算自主工作流的成本和延迟

示例

loading...
Loading code...

常见问题

Agent 轨迹和聊天记录有什么区别?

聊天记录只记录可见消息。轨迹还包括工具调用、检索证据、审批、错误、状态变化和中间观察等内部步骤。

为什么轨迹对评估重要?

最终答案不能说明 Agent 是否用了正确证据或采取过不安全步骤。轨迹让评估者能判断过程质量,而不只是输出质量。

轨迹可以回放吗?

有时可以。回放需要稳定工具版本、保存输入、尽可能确定的设置,并谨慎处理外部副作用。

轨迹中应脱敏什么?

敏感用户数据、凭据、私有文档、不必要的原始提示词和高风险工具输出,都应根据策略脱敏或访问控制。

相关工具

相关术语

相关文章