什么是 上下文精确率(Context Precision)?

上下文精确率(Context Precision)是一种 RAG 评估指标,用于衡量检索到的上下文中有多少内容与用户问题或期望答案相关。

工作原理

上下文精确率关注提供给模型的证据究竟主要有用,还是主要是噪声。高上下文精确率意味着检索分块相关,不会干扰生成模型;低精确率意味着上下文窗口中充满无关片段,可能增加成本、混淆模型,或引入无依据说法。它通常需要与上下文召回率一起评估,因为系统可能很精确但漏掉必要证据,也可能覆盖很广但噪声很大。

主要特点

  • 关注检索上下文本身的相关性,而不只看最终答案
  • 惩罚提示词中的噪声、重复或离题分块
  • 与衡量必要证据是否被检索到的上下文召回率互补
  • 可由人工、参考答案或 LLM-as-Judge 流水线评判
  • 适合调优 top-k、分块、过滤、重排和查询改写

常见用途

  1. 评估 RAG 检索是否返回过多无关上下文
  2. 比较检索器和重排器配置
  3. 在调整分块大小或重叠后发现噪声分块
  4. 优化上下文窗口使用和生成成本
  5. 为检索质量建立回归测试

示例

loading...
Loading code...

常见问题

上下文精确率低意味着什么?

这意味着检索器向模型发送了太多无关或重复证据,会浪费上下文并可能损害答案质量。

上下文精确率会不会过高?

如果系统检索内容很少,看起来可能很精确,但仍可能漏掉必要证据。因此还需要看上下文召回率。

如何提升上下文精确率?

常见手段包括改善分块、使用元数据过滤、重排、降低 top-k、查询改写和混合检索。

上下文精确率等于答案准确率吗?

不是。它衡量检索证据质量。生成模型仍可能基于好上下文给出坏答案,或偶然从差上下文中答对。

相关工具

相关术语

相关文章