什么是上下文召回率（Context Recall）？

上下文召回率（Context Recall）是一种 RAG 评估指标，用于衡量检索到的上下文是否包含回答用户问题所需的证据。

工作原理

上下文召回率关注检索系统是否找到了必要证据。如果所需来源片段从未进入模型，RAG 答案就无法可靠地事实锚定。低上下文召回率可能来自糟糕分块、弱嵌入、缺失元数据、过滤过严、top-k 不足，或查询需要改写。它应与上下文精确率一起评估，因为盲目提高召回可能让模型看到大量无关上下文。

主要特点

衡量证据覆盖，而不是证据纯净度
识别必要事实是否出现在检索上下文中
与惩罚无关分块的上下文精确率互补
对 top-k、查询改写、分块、过滤和检索模型选择敏感
当 RAG 答案不完整或缺乏依据时，是关键诊断指标

常见用途

检查 gold evidence 是否出现在 top-k 检索结果中
诊断模型根本没看到正确来源导致的 RAG 失败
比较稠密、稀疏和混合检索的召回率
在不丢失必要证据的前提下调优 top-k 和元数据过滤
为高价值问题建立检索回归测试

示例

loading...

Loading code...

常见问题

上下文召回率低说明什么？

这说明检索阶段没有包含有依据回答所需的证据，因此生成模型可能猜测或回答不完整。

提高 top-k 能改善上下文召回率吗？

经常可以，但也可能加入无关分块而降低上下文精确率。通常还需要重排和更好的检索策略。

上下文召回率和答案召回率有什么区别？

上下文召回率评估检索证据覆盖，答案召回率评估最终答案是否包含期望信息。

哪些方法可以提升上下文召回率？

更好的分块、混合检索、查询改写、元数据修复、嵌入模型选择和谨慎调优过滤条件都可能有帮助。

相关工具

JSON 格式化

免费在线JSON格式化(Format)与美化解析工具，一键快速格式化、语法校验和压缩任意复杂的JSON数据字符串。支持直观的代码语法高亮显示、可折叠的交互式树形视图(Tree View)、最近格式化历史记录保存和一键快速复制结果。广泛适用于前后端API接口调试、日志数据分析、以及各类系统配置文件编辑。无需注册登录，100%纯前端本地处理，绝不泄露您的数据隐私。

文本分析器

免费在线全能文本分析与高级字数统计工具。提供极其详尽的字数、总字符数、句子数、段落数精确统计功能，全面支持多语言智能分词(包含中文字符与英文字词独立识别统计)。提供核心高频关键词提取分析、用户平均阅读时间预估和文本排版特征深度检测。专为职业作家、文案编辑、自媒体运营和学生群体设计的文本内容优化辅助神器，即开即用。

AI网站导航

权威、全面且持续更新的 AI 人工智能工具与生态资源导航目录。深度覆盖全球与国内顶尖的大语言模型提供商、开放生态与开源项目、前沿学术研究索引与评测排行榜、以及开发者必备的平台与工具目录等。为你提供快速发现、横向能力对比与高效技术选型的最佳入口。支持精准的关键词搜索与个人收藏分组功能，分类分区清晰易用，助你轻松掌握 AI 时代生产力。

相关术语

上下文精确率（Context Precision）

上下文精确率（Context Precision）是一种 RAG 评估指标，用于衡量检索到的上下文中有多少内容与用户问题或期望答案相关。

检索增强生成

检索增强生成是一种 AI 架构，通过在生成响应之前从外部知识库检索相关信息来增强大语言模型的输出，结合信息检索系统和生成式 AI 的优势，产生更准确、更新和可验证的答案。

检索器（Retriever）

检索器（Retriever）是查询到上下文的组件，接收用户或 Agent 查询，并返回相关文档、分块、记录、段落或可供工具读取的上下文，用于后续推理和生成。

查询改写（Query Rewriting）

查询改写（Query Rewriting）是在搜索前，把用户原始问题转换为一个或多个更清晰、扩展后或更适合检索的查询的过程。

相关文章

上下文工程：LLM 系统的选择、证据与状态管理

一套不绑定 Provider 的 LLM 与 Agent 上下文工程方法，适合需要控制检索质量、记忆、Token 预算和数据风险的团队。本文定义 Context Contract，讲解证据选择、来源追踪、压缩、持久化、权限、删除、延迟成本预算和任务级评估，不把 Prompt 或上下文误当成安全边界。

长上下文时代 RAG 还有必要吗？成本 vs 准确性的决策框架

系统回答长上下文时代 RAG 是否仍有必要的问题。围绕成本、准确性和延迟三大维度，对比百万 Token 直塞、上下文缓存、RAG 检索、Lost in the Middle、实时更新、来源溯源和混合架构，帮助 AI 工程师判断小型固定文档、动态知识库、全文摘要、精确事实检索和企业级问答分别该选择哪种方案。

上下文工程四层架构：指令、知识、记忆与编排

用版本敏感的四层模型设计 AI 上下文：指令层、知识层、记忆层和编排层。本文覆盖 Token 预算、检索路由、来源新鲜度、记忆压缩、租户隔离、工具结果校验、权限边界、Prompt Injection、失败路径、成本延迟遥测和可复现评测，适用于 RAG、客服 Agent、企业知识库和多轮会话，不把固定比例或模型行为当作通用事实。