什么是 倒数排名融合(Reciprocal Rank Fusion)?
倒数排名融合(Reciprocal Rank Fusion)是一种排名聚合方法,它根据每个文档在各个结果列表中排名的倒数来合并多个检索列表。
工作原理
倒数排名融合常简称 RRF,是合并不同检索器排序结果的一种简单稳健方法。它不要求 BM25、稠密检索或其他系统的原始分数可比较,而是使用排名位置。一个文档如果在多个列表中都排在前面,就会获得更高的融合分数。RRF 在混合 RAG 中很常见,因为词法分数和向量分数通常不能直接比较,而排名更容易可靠合并。
主要特点
- 合并排序列表时不需要校准不同检索器的分数
- 奖励在多个检索分支中排名靠前的文档
- 适合融合 BM25 和稠密检索的混合搜索
- 通过平滑常数降低对第一名结果的过度强调
- 实现简单,常作为生产系统中的强基线
常见用途
- 为 RAG 融合 BM25 和向量搜索排名
- 合并多个查询改写产生的检索结果
- 融合不同嵌入模型返回的检索列表
- 在学习式排名融合前建立稳健基线
- 减少对不可比较原始检索分数的依赖
示例
loading...
Loading code...常见问题
为什么用倒数排名融合而不是平均分数?
不同检索器的原始分数通常尺度不兼容。RRF 使用排名位置,因此融合更稳定。
RRF 中的常数有什么作用?
这个常数会平滑不同排名的贡献,让靠前位置更重要,但靠后的结果仍可贡献分数。
RRF 是学习模型吗?
不是。它是确定性的排名聚合方法,因此容易实现和调试。
RRF 会替代重排吗?
不一定。RRF 可以先合并候选结果,随后再用重排器对融合列表做更精确的相关性打分。