什么是 引用溯源(Citation)?

引用溯源(Citation)是把 AI 生成声明归因到支持该声明的具体来源文档、片段、URL、记录或工具输出。

工作原理

引用溯源是事实锚定中用户可见的部分。在 RAG 系统中,引用帮助读者验证声明、检查来源上下文,并发现无依据答案。强引用应指向支持某个声明的具体片段或记录,而不仅是宽泛文档。它还应保留 URL、标题、时间戳、页码、章节和访问范围等来源元数据。引用质量取决于检索质量、分块边界、来源偏移量,以及生成步骤是否真的使用了被引用证据。

主要特点

  • 把生成声明归因到具体来源或证据记录
  • 当引用具体且正确时,可提升可审计性和用户信任
  • 需要来源元数据、分块偏移量和稳定文档标识
  • 如果被引用来源并不支持声明,引用也可能误导用户
  • 可用于文档、网页、数据库行、工具输出和上传文件

常见用途

  1. 在 RAG 答案下展示来源片段
  2. 把政策答案链接到手册中的精确章节
  3. 将 Agent 决策追踪到工具输出和检索记录
  4. 帮助用户验证医疗、法律、金融或合规声明
  5. 通过检查被引用证据调试无依据答案

示例

loading...
Loading code...

常见问题

RAG 中好的引用是什么样的?

好的引用会指向直接支持声明的具体来源片段,并提供足够元数据让用户或审计者验证。

引用也会错吗?

会。系统可能把引用附到相关但并不支持具体声明的来源上,因此需要评估引用忠实度。

文档级引用够用吗?

有时够用,但片段级或章节级引用通常更好,因为它降低了验证答案所需的成本。

引用和文档分块有什么关系?

分块决定来源片段和偏移量。糟糕分块会让引用过宽、不完整或难以审计。

相关工具

相关术语

相关文章