7 分钟 读完 (大约 1053 个字)
核心观点:RAG 系统的”最后一公里”决定成败。向量检索负责”广撒网”(Recall),而重排序(Rerank)负责”精挑选”(Precision)。
1. 引言:大海捞针的漏斗
上一章我们建立了向量索引。但你很快会发现一个问题:
用户搜:”谁是马斯克?”
向量检索可能召回:”马斯克的火箭”、”马斯克的汽车”、”马斯克的前女友”。
虽然都相关,但第一条可能并不是用户最想要的精确定义。
为了解决这个问题,我们需要一个漏斗系统:先用低成本的方法捞出一大堆,再用高成本的方法精细排序。
2. 核心概念:混合检索 (Hybrid Search)
2.1 为什么只有向量是不够的?
向量检索(Dense