type
Post
status
Published
date
Jan 26, 2026
slug
summary
tags
人工智能
category
技术分享
icon
password
Rerank与Embedding Models是两种不同的技术方案,它们在工作方式和应用场景上有显著区别:

核心区别

输入输出方式不同:
  • Embedding Models:将非结构化数据(如文本、图像)转换为高维空间中的数值向量表示(1)
  • Reranker:接受查询和文档作为输入,直接返回相似度分数,而不是嵌入向量(2)
功能定位不同:
  • Embedding Models:用于数据的向量化表示,是搜索的基础(1)
  • Reranker:用于优化初始搜索结果的顺序,是搜索的增强(2)

工作流程中的位置

Embedding Models在搜索流程的前端:
  1. 将原始数据转换为向量嵌入(1)
  1. 存储在Milvus向量数据库中(1)
  1. 支持快速的向量相似度搜索(1)
Reranker在搜索流程的后端:
  1. 在第一阶段检索(通常是ANN搜索)之后使用(2)
  1. 通过更深入的上下文分析优化结果顺序(2)
  1. 使用BERT或其他Transformer模型进行语义理解(2)

技术架构差异

Embedding Models:
  • 使用双编码器(dual-encoder)架构(1)
  • 分别编码查询和文档为向量(1)
  • 通过向量距离计算相似度(1)
Reranker:
  • 使用交叉编码器(cross-encoder)架构(2)
  • 同时处理查询-文档对(2)
  • 直接输出相关性分数(2)

性能特点

Embedding Models:
  • 计算效率高,适合大规模快速检索(1)
  • 可以预先计算文档向量(1)
Reranker:
  • 计算成本更高,但提供更精确的相关性评估(2)
  • 通常只对候选集(如top-K结果)进行重排(2)

实际应用

在RAG系统中,两者通常配合使用(3):
  1. 第一阶段:使用Embedding Models进行快速的候选文档检索(3)
  1. 第二阶段:使用Reranker对候选结果进行精确重排(3)
  1. 第三阶段:将重排后的结果用于生成最终答案(3)
这种两阶段检索管道平衡了速度和准确性,既保证了检索效率,又提高了结果的相关性(3)
Agent嵌入记忆-reAct与Function call,以及1.0中的实现Agent与RAG
Loading...