什么是 中间遗忘现象(Lost in the Middle)?

中间遗忘现象(Lost in the Middle)是语言模型相比上下文开头或结尾,更不稳定地使用长上下文中间信息的倾向。

工作原理

中间遗忘现象是实际长上下文失败模式。即使模型上下文窗口足以容纳全部证据,它也可能不如使用开头或结尾信息那样可靠地关注中间位置证据。这会影响 RAG、Agent 记忆、法律审查和长文档问答。缓解通常需要更好的排序、上下文压缩、章节排序、摘要、引用,以及测试证据出现位置的评估用例,而不只是测试证据是否出现。

主要特点

  • 当重要证据埋在长提示词中间时出现
  • 即使模型技术上支持该上下文长度,也可能发生
  • 影响 RAG 答案、长文档问答、Agent 记忆和多文档提示
  • 取决于模型架构、训练、提示结构和证据位置
  • 需要通过改变证据在上下文中的位置来评估

常见用途

  1. 测试 RAG 答案是否使用位于上下文中间的证据
  2. 重排检索分块,把关键证据放到模型更容易关注的位置
  3. 在生成前压缩长上下文
  4. 为长文档问答设计章节摘要提示
  5. 诊断证据已检索但引用缺失的问题

示例

loading...
Loading code...

常见问题

更大的上下文窗口能解决中间遗忘吗?

不能单独解决。更大窗口允许更多文本,但模型仍可能因位置和提示结构而低估证据。

如何发现中间遗忘现象?

使用同一证据分别位于上下文开头、中间和结尾的评估用例,对比答案质量。

如何缓解这个问题?

谨慎排序证据、压缩上下文、在摘要中重复关键事实、使用引用,并避免塞入无关分块。

为什么它对 RAG 很重要?

检索器可能返回了正确证据,但如果证据埋在长上下文中,生成模型仍可能漏用它。

相关工具

相关术语

相关文章