RAG全流程拆解——从“只会聊天”到“能查资料”的质变

发布时间:2026/6/30 5:21:48
RAG全流程拆解——从“只会聊天”到“能查资料”的质变 大模型有一个致命缺陷它不知道你公司的产品手册、内部政策、客户案例。RAG就是解决这个问题的——让大模型“开卷考试”。本课是整个RAG模块最重要的基础课完整走通了从文档到答案的全流程。RAG全流程一览步骤做什么关键工具PM关注点1.文档加载读取PDF/Word/PPTMinerU、python-docx文档格式兼容性2.切分Chunk把大文档切成小片段RecursiveCharacterTextSplitterchunk_size和overlap的设置3.向量化每个chunk→1024维向量bge-m3/Qwen3-Embedding模型选择影响效果4.存储向量存入FAISSFAISS存储容量和检索速度5.检索问题→向量→找最相似的TopKFAISS searchK值设置6.生成问题相关chunks→LLM生成答案DeepSeek/QwenPrompt上下文管理一、文档切分第一步就决定上限两种切分方式规则切分LLM语义切分按token数固定切分从语义角度理解后切分支持重叠overlap不存在重叠速度快成本低更准确但成本高推荐首选适合要求极高的场景 chunk_size1000, overlap200 是常用的起始参数。overlap的作用是防止关键信息被“切断”。二、课堂实战DeepSeek FAISS本地知识库以迪士尼门票政策为例完整演示了RAG全流程加载文档→切分chunk→生成向量→存入FAISS→查询匹配。 PM启发企业知识库项目的关键问题“效果不好先调什么”答案是——提示词 RAG优化 微调。先调Prompt再调知识库最后才考虑微调模型。三、课堂真实问答同学提问老师回答“RAG有数据量大小的限制吗”TopK chunks受LLM窗口大小限制200K“效果不好先调什么”提示词 RAG 微调“向量数据库不用安装吗”faiss是库pip install即用“PDF中复杂表格怎么处理”用MinerU提取表格、图片、公式四、下次写需求时你可以这样做设计知识库产品时先梳理文档来源PDF、Word、PPT各多少在需求文档里明确chunk的策略是按固定长度还是语义切分设定测试集10个问题 标准答案用来衡量RAG效果评估时问一句“效果不好先调什么”记住答案提示词 RAG 微调收获总结✅ RAG的本质让大模型“开卷考试”从知识库找答案✅ 全流程文档加载→切分→向量化→存储→检索→生成✅ 切分参数chunk_size1000, overlap200 是常用起始值✅ 优化顺序提示词 RAG 微调不要一上来就微调✅ PDF复杂表格用MinerU处理效果远好于直接切分你觉得企业知识库项目最容易踩的坑是什么来评论区分享一下。这里给大家精心整理了一份全面的AI大模型学习资源包括AI大模型全套学习路线图从入门到实战、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等资料免费分享扫码免费领取全部内容1. 成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。2. 大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF3. 大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。4. 2026行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5. 大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。6. 大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。7. 资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容