<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>RAG on Simon Sun</title><link>https://fatflowers.github.io/zh/tags/rag/</link><description>Recent content in RAG on Simon Sun</description><generator>Hugo -- 0.155.3</generator><language>zh</language><lastBuildDate>Tue, 02 Jun 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://fatflowers.github.io/zh/tags/rag/index.xml" rel="self" type="application/rss+xml"/><item><title>[WIP]深入拆解RAG技术</title><link>https://fatflowers.github.io/zh/posts/original-tech/rag-deepdive/</link><pubDate>Tue, 02 Jun 2026 00:00:00 +0000</pubDate><guid>https://fatflowers.github.io/zh/posts/original-tech/rag-deepdive/</guid><description>&lt;p&gt;RAG（Retrival Augumented Generation）技术对于扩充模型的知识，减少幻觉，提高实用性上非常重要。这篇文章主要是介绍一个RAG系统的各个工作环节，对应的可调节参数以及应用场景。&lt;/p&gt;
&lt;p&gt;RAG系统的工作流程&lt;/p&gt;
&lt;p&gt;Ingestion&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;parsing（pdf html）&lt;/li&gt;
&lt;li&gt;chunking
&lt;ul&gt;
&lt;li&gt;metadata 来源、标题、章节、日期、权限&lt;/li&gt;
&lt;li&gt;contextual retrieval&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;Vector db indexing
&lt;ul&gt;
&lt;li&gt;dense model choice 模型维度、语言支持、是否非对称&lt;/li&gt;
&lt;li&gt;sparse / bm25 indexing&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;embedding/index 的更新机制&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Retrieve&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Query processing
&lt;ul&gt;
&lt;li&gt;rewrite&lt;/li&gt;
&lt;li&gt;expand&lt;/li&gt;
&lt;li&gt;HyDE&lt;/li&gt;
&lt;li&gt;query routing&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;metadata filtering&lt;/li&gt;
&lt;li&gt;Hybrid search 融合 RRF 或加权&lt;/li&gt;
&lt;li&gt;rerank&lt;/li&gt;
&lt;li&gt;上下文压缩 / 去重(把检索到的内容裁剪、去冗余,省 context window)&lt;/li&gt;
&lt;li&gt;chunk 扩展(检索命中小 chunk,但喂给 LLM 时取回它的相邻上下文或父文档,即 &amp;ldquo;small-to-big&amp;rdquo; / parent-document retrieval)&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Generation&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;
&lt;p&gt;no-answer / 兜底&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;prompt 拼装(把 query + 检索结果组织成 prompt)&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;生成&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;citation / attribution(标注答案出自哪个 chunk,可溯源)&lt;/p&gt;</description></item></channel></rss>