什么是交叉编码器（Cross-Encoder）？

交叉编码器（Cross-Encoder）是一种排序模型架构，它联合编码查询和候选文档或片段，并输出相关性分数。

工作原理

交叉编码器会把查询和片段放在一起评估，使注意力可以跨越两段文本。这通常比比较独立嵌入产生更好的相关性判断，尤其适合细致问题、否定表达、约束条件和短片段。代价是延迟：每个查询-片段对都必须在请求时打分。因此，交叉编码器通常作为重排器使用，在 BM25、稠密检索或混合搜索先产生可管理候选集之后再排序。

主要特点

在打分前联合读取查询和候选片段
在许多重排任务上比双编码器更精确
计算成本较高，因为每个查询-文档对都要单独评估
适合处理否定、约束和细微措辞差异
通常只应用于 top-k 候选，而不是整个语料库

常见用途

在把上下文送入 LLM 前重排前 50 个稠密检索结果
改善第一阶段检索返回噪声候选时的 RAG 答案
根据详细合规问题排序政策片段
为检索评估打分查询-文档对
把 BM25 和向量候选整合为最终排序列表

示例

loading...

Loading code...

常见问题

为什么交叉编码器通常比双编码器更准确？

它联合处理查询和片段，因此模型可以在输出相关性分数前直接比较约束、实体和措辞。

为什么不把交叉编码器用于全部检索？

在大规模语料上成本太高，因为每次查询都需要与每个文档或分块成对计算。

交叉编码器在 RAG 中放在哪一步？

它通常在 BM25、稠密检索或混合检索产生候选集后进行重排，再组装最终上下文。

LLM 可以充当交叉编码器重排器吗？

LLM 可以为片段打分或比较片段，但专用交叉编码器重排器在高频检索中通常更便宜、更稳定。

相关工具

AI网站导航

权威、全面且持续更新的 AI 人工智能工具与生态资源导航目录。深度覆盖全球与国内顶尖的大语言模型提供商、开放生态与开源项目、前沿学术研究索引与评测排行榜、以及开发者必备的平台与工具目录等。为你提供快速发现、横向能力对比与高效技术选型的最佳入口。支持精准的关键词搜索与个人收藏分组功能，分类分区清晰易用，助你轻松掌握 AI 时代生产力。

JSON 格式化

免费在线JSON格式化(Format)与美化解析工具，一键快速格式化、语法校验和压缩任意复杂的JSON数据字符串。支持直观的代码语法高亮显示、可折叠的交互式树形视图(Tree View)、最近格式化历史记录保存和一键快速复制结果。广泛适用于前后端API接口调试、日志数据分析、以及各类系统配置文件编辑。无需注册登录，100%纯前端本地处理，绝不泄露您的数据隐私。

文本分析器

免费在线全能文本分析与高级字数统计工具。提供极其详尽的字数、总字符数、句子数、段落数精确统计功能，全面支持多语言智能分词(包含中文字符与英文字词独立识别统计)。提供核心高频关键词提取分析、用户平均阅读时间预估和文本排版特征深度检测。专为职业作家、文案编辑、自媒体运营和学生群体设计的文本内容优化辅助神器，即开即用。

相关术语

Rerank

Rerank（重排序）是信息检索和 RAG 流程中的一个进阶阶段。在传统的向量检索（如余弦相似度）或关键词检索（如 BM25）快速召回大量候选文档后，Rerank 引入一个计算成本更高但理解能力更强的交叉编码器（Cross-Encoder）模型。该模型同时接收用户的查询（Query）和候选文档（Document），计算它们之间深度的语义相关性得分，并据此重新排列文档顺序，从而将最相关的片段推至最前列，供 LLM 生成最终答案。

双编码器（Bi-Encoder）

双编码器（Bi-Encoder）是一种检索模型架构，它分别把查询和文档编码为嵌入向量，使二者可以通过相似度搜索高效比较。

稠密检索（Dense Retrieval）

稠密检索（Dense Retrieval）是一种语义搜索方法，它把查询和文档表示为稠密嵌入向量，并通过向量相似度检索结果。

Hybrid Search

Hybrid Search（混合检索）是一种在信息检索和 RAG（检索增强生成）系统中同时使用多种搜索算法的技术。最常见的组合是将捕获上下文和概念含义的**密集向量检索（Dense Vector Retrieval）**与专注于精确词汇匹配和特定实体查找的**稀疏关键词检索（Sparse Keyword Retrieval，通常指 BM25 算法）**融合在一起。系统分别运行这两路搜索，然后通过融合算法（如 RRF，倒数排名融合）将它们的结果合并，从而在理解用户意图的同时，确保不会漏掉包含特定产品名称、ID 或行业黑话的关键文档。

相关文章

Eino RAG Pipeline 实战指南：从文档入库到智能问答

完整讲解 Eino RAG Pipeline 从文档入库到智能问答的全链路实现。覆盖 Document Loader、Transformer、Embedding、Indexer、Retriever、Reranker、Hybrid Search、切分策略和企业知识库问答系统，帮助 Go 团队构建可替换、可优化的生产级 RAG。

RAG检索质量优化方案：从Rerank到Hybrid Search

深入解析企业级 RAG 检索质量优化方案，说明纯向量检索在专有名词、型号、代码和精确数值场景下为何失效。覆盖 Hybrid Search、BM25、Dense Retrieval、RRF 融合、Cross-Encoder Rerank、两阶段检索管道、延迟权衡和 Python 实战代码，帮助开发者提升 Top-K 召回准确率。

多模态RAG进阶：图文混合检索与跨模态对齐【2026】

面向生产环境讲解高级多模态 RAG 的跨模态检索与对齐工程。覆盖 CLIP、SigLIP、ColPali、图文混合召回、延迟交互、模态感知重排序、分数校准、线上漂移监控、Python 与 TypeScript 实现，帮助团队稳定处理文本查图、图查文、PDF 页面检索和视觉文档问答，并解决表格、图表、扫描件在传统文本 RAG 中丢失语义的问题。