RAG on Simon Sun

RAG on Simon Sunhttps://fatflowers.github.io/zh/tags/rag/Recent content in RAG on Simon SunHugo -- 0.155.3zhTue, 02 Jun 2026 00:00:00 +0000[WIP]深入拆解RAG技术https://fatflowers.github.io/zh/posts/original-tech/rag-deepdive/Tue, 02 Jun 2026 00:00:00 +0000https://fatflowers.github.io/zh/posts/original-tech/rag-deepdive/<p>RAG（Retrival Augumented Generation）技术对于扩充模型的知识，减少幻觉，提高实用性上非常重要。这篇文章主要是介绍一个RAG系统的各个工作环节，对应的可调节参数以及应用场景。</p> <p>RAG系统的工作流程</p> <p>Ingestion</p> <ul> <li>parsing（pdf html）</li> <li>chunking <ul> <li>metadata 来源、标题、章节、日期、权限</li> <li>contextual retrieval</li> </ul> </li> <li>Vector db indexing <ul> <li>dense model choice 模型维度、语言支持、是否非对称</li> <li>sparse / bm25 indexing</li> </ul> </li> <li>embedding/index 的更新机制</li> </ul> <p>Retrieve</p> <ul> <li>Query processing <ul> <li>rewrite</li> <li>expand</li> <li>HyDE</li> <li>query routing</li> </ul> </li> <li>metadata filtering</li> <li>Hybrid search 融合 RRF 或加权</li> <li>rerank</li> <li>上下文压缩 / 去重(把检索到的内容裁剪、去冗余,省 context window)</li> <li>chunk 扩展(检索命中小 chunk,但喂给 LLM 时取回它的相邻上下文或父文档,即 “small-to-big” / parent-document retrieval)</li> </ul> <p>Generation</p> <ul> <li> <p>no-answer / 兜底</p> </li> <li> <p>prompt 拼装(把 query + 检索结果组织成 prompt)</p> </li> <li> <p>生成</p> </li> <li> <p>citation / attribution(标注答案出自哪个 chunk,可溯源)</p>