第 04 章:RAG 进阶:重排序与混合检索

核心观点:RAG 系统的”最后一公里”决定成败。向量检索负责”广撒网”(Recall),而重排序(Rerank)负责”精挑选”(Precision)。 1. 引言:大海捞针的漏斗 上一章我们建立了向量索引。但你很快会发现一个问题: 用户搜:”谁是马斯克?” 向量检索可能召回:”马斯克的火箭”、”马斯克的汽车”、”马斯克的前女友”。 虽然都相关,但第一条可能并不是用户最想要的精确定义。 为了解决这个问题,我们需要一个漏斗系统:先用低成本的方法捞出一大堆,再用高成本的方法精细排序。 2. 核心概念:混合检索 (Hybrid Search) 2.1 为什么只有向量是不够的? 向量检索(Dense

第 03 章:RAG 基石:Embedding 与向量检索

核心观点:在 AI 的眼里,万物皆是坐标。RAG(检索增强生成)的本质,就是把用户的自然语言问题,映射到知识库的坐标系中,寻找最近的”邻居”。 1. 引言:计算机不懂中文,它只懂数学 你问 AI:”苹果怎么卖?” 在计算机底层,它根本不知道”苹果”是水果还是手机。 但如果你告诉它:”苹果”的坐标是 [0.8, 0.2],”香蕉”的坐标是 [0.85, 0.1],”卡车”的坐标是 [-0.5, 0.9]。 它会立刻计算出:苹果和香蕉很近,离卡车很远。 这就是 Embedding(向量化) —— 它是 RAG 系统地基中的地基。 2. 核心概念:Embedding Space (向量空间) 2
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×