什么是 Agent 轨迹(Agent Trajectory)?
Agent 轨迹(Agent Trajectory)是 AI Agent 一次运行的有序记录,包括观察、消息、决策、工具调用、工具结果、错误、审批、状态变化和最终输出。
工作原理
Agent 轨迹是 Agent 实际做了什么的证据链。它不同于最终答案:它捕获导致答案或动作的中间步骤。轨迹对调试、评估、审计、成本分析和安全审查至关重要。轨迹应有足够结构,便于回放或检查;但它也需要谨慎隐私处理,因为其中可能包含用户数据、检索文档、工具输出和敏感推理产物。
主要特点
- 有序运行记录:保留观察、决策、动作和结果的顺序
- 调试资产:帮助定位 Agent 从哪一步开始错误、卡住或不安全
- 评估输入:可评估工具选择、证据使用、策略合规和任务成功
- 审计轨迹:记录审批、副作用、错误和最终输出
- 隐私敏感:可能包含提示词、用户数据、检索上下文和工具输出
常见用途
- 调试 Agent 为什么调用了错误工具
- 评估 RAG Agent 是否使用了合适证据
- 审计邮件或工单等外部可见动作
- 从失败或成功的 Agent 运行中构建回归测试
- 按步骤计算自主工作流的成本和延迟
示例
loading...
Loading code...常见问题
Agent 轨迹和聊天记录有什么区别?
聊天记录只记录可见消息。轨迹还包括工具调用、检索证据、审批、错误、状态变化和中间观察等内部步骤。
为什么轨迹对评估重要?
最终答案不能说明 Agent 是否用了正确证据或采取过不安全步骤。轨迹让评估者能判断过程质量,而不只是输出质量。
轨迹可以回放吗?
有时可以。回放需要稳定工具版本、保存输入、尽可能确定的设置,并谨慎处理外部副作用。
轨迹中应脱敏什么?
敏感用户数据、凭据、私有文档、不必要的原始提示词和高风险工具输出,都应根据策略脱敏或访问控制。