RAG 實戰手冊:如何讓 AI 讀懂你的私人文件?
· 3 min read

在 LLM(大型語言模型)的時代,我們常遇到一個難題:AI 不知道你公司的內規,也不知道你電腦裡的私密文件。 要解決這個問題,我們不需要重新訓練模型,而是使用 RAG(Retrieval-Augmented Generation,檢索增強生成)。簡單來說,就是「先幫 AI 翻書(檢索),再讓它回答(生成)」。
一、 RAG 的核心工作流
一個典型的 RAG 流程可以拆解為兩個階段:資料處理(離線)與問答檢索(在線)。
1. 資料處理階段 (Indexing)
這是將你的知識庫轉換為「機器可讀」格式的過程:
- Loading: 讀取 PDF、Markdown 或資料庫內容。
- Chunking (切片): 將長文章切碎成小塊。
- Embedding (嵌入): 將文字轉化為向量(數字)。
- Storage: 存入向量資料庫(Vector Database)。