什么是 倒数排名融合(Reciprocal Rank Fusion)?

倒数排名融合(Reciprocal Rank Fusion)是一种排名聚合方法,它根据每个文档在各个结果列表中排名的倒数来合并多个检索列表。

工作原理

倒数排名融合常简称 RRF,是合并不同检索器排序结果的一种简单稳健方法。它不要求 BM25、稠密检索或其他系统的原始分数可比较,而是使用排名位置。一个文档如果在多个列表中都排在前面,就会获得更高的融合分数。RRF 在混合 RAG 中很常见,因为词法分数和向量分数通常不能直接比较,而排名更容易可靠合并。

主要特点

  • 合并排序列表时不需要校准不同检索器的分数
  • 奖励在多个检索分支中排名靠前的文档
  • 适合融合 BM25 和稠密检索的混合搜索
  • 通过平滑常数降低对第一名结果的过度强调
  • 实现简单,常作为生产系统中的强基线

常见用途

  1. 为 RAG 融合 BM25 和向量搜索排名
  2. 合并多个查询改写产生的检索结果
  3. 融合不同嵌入模型返回的检索列表
  4. 在学习式排名融合前建立稳健基线
  5. 减少对不可比较原始检索分数的依赖

示例

loading...
Loading code...

常见问题

为什么用倒数排名融合而不是平均分数?

不同检索器的原始分数通常尺度不兼容。RRF 使用排名位置,因此融合更稳定。

RRF 中的常数有什么作用?

这个常数会平滑不同排名的贡献,让靠前位置更重要,但靠后的结果仍可贡献分数。

RRF 是学习模型吗?

不是。它是确定性的排名聚合方法,因此容易实现和调试。

RRF 会替代重排吗?

不一定。RRF 可以先合并候选结果,随后再用重排器对融合列表做更精确的相关性打分。

相关工具

相关术语

相关文章