type
Post
status
Published
date
Jan 26, 2026
slug
summary
tags
人工智能
category
技术分享
icon
password
Rerank与Embedding Models是两种不同的技术方案,它们在工作方式和应用场景上有显著区别:
核心区别
输入输出方式不同:
- Embedding Models:将非结构化数据(如文本、图像)转换为高维空间中的数值向量表示(1)
- Reranker:接受查询和文档作为输入,直接返回相似度分数,而不是嵌入向量(2)
功能定位不同:
- Embedding Models:用于数据的向量化表示,是搜索的基础(1)
- Reranker:用于优化初始搜索结果的顺序,是搜索的增强(2)
工作流程中的位置
Embedding Models在搜索流程的前端:
- 将原始数据转换为向量嵌入(1)
- 存储在Milvus向量数据库中(1)
- 支持快速的向量相似度搜索(1)
Reranker在搜索流程的后端:
- 在第一阶段检索(通常是ANN搜索)之后使用(2)
- 通过更深入的上下文分析优化结果顺序(2)
- 使用BERT或其他Transformer模型进行语义理解(2)
技术架构差异
Embedding Models:
- 使用双编码器(dual-encoder)架构(1)
- 分别编码查询和文档为向量(1)
- 通过向量距离计算相似度(1)
Reranker:
- 使用交叉编码器(cross-encoder)架构(2)
- 同时处理查询-文档对(2)
- 直接输出相关性分数(2)
性能特点
Embedding Models:
- 计算效率高,适合大规模快速检索(1)
- 可以预先计算文档向量(1)
Reranker:
- 计算成本更高,但提供更精确的相关性评估(2)
- 通常只对候选集(如top-K结果)进行重排(2)
实际应用
在RAG系统中,两者通常配合使用(3):
- 第一阶段:使用Embedding Models进行快速的候选文档检索(3)
- 第二阶段:使用Reranker对候选结果进行精确重排(3)
- 第三阶段:将重排后的结果用于生成最终答案(3)
这种两阶段检索管道平衡了速度和准确性,既保证了检索效率,又提高了结果的相关性(3)。
- Author:guderain
- URL:https://wangguanxi.space/article/3152b727-a3a3-8032-844c-e92333235ac0
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!
Relate Posts

.webp?table=collection&id=92be88af-5f71-4631-9d3e-ee3bd53dcced&t=92be88af-5f71-4631-9d3e-ee3bd53dcced&width=1080&cache=v2)
