Karpathy 提出的個人知識庫模式:不靠 RAG 即時擷取,而是讓 LLM 漸進式建立並維護一個持久、互聯的 markdown wiki,夾在你與原始資料之間。本 vault 自身就是這套模式的實作,這篇是它的方法論原典與出處。
與 RAG 的根本差異
RAG 每次查詢都從原始文件重新擷取、重新拼湊——什麼都不累積,問一個需要綜合五份文件的問題,每次都得重找。
LLM Wiki 相反:知識被編譯一次後持續維護。交叉引用已建好、矛盾已標記、綜合分析已反映讀過的所有內容。wiki 是複利資產——每加一個來源、每問一個問題都讓它更豐富。
判準:知識要不要跨時間累積、要不要互聯成網 → 用 Wiki;只是一次性問答檢索 → RAG 就夠。
三層架構
原文是三層,不是四層(坊間「raw/wiki/index/log 四層」把 wiki 內的特殊檔案誤升成獨立層):
- Raw sources(原始來源) — 你精選的來源,不可變。LLM 只讀不改,是事實來源。
- Wiki — LLM 生成與維護的 markdown:摘要、條目、概念、比較、綜合。完全由 LLM 掌管,你只負責讀。
- Schema — 規範文件(
CLAUDE.md/AGENTS.md),告訴 LLM wiki 的結構、慣例與工作流程。這是把 LLM 從通用聊天機器人變成「有紀律的 wiki 維護者」的關鍵。
index.md(內容導向目錄)與 log.md(時序僅追加紀錄)是 wiki 層內的兩個特殊檔案,不是獨立層級。
flowchart LR Human[👤 人類<br/>蒐集 / 提問] Raw[📥 原始來源<br/>不可變] Schema[📐 Schema<br/>規範] LLM((🤖 LLM)) Wiki[📚 Wiki<br/>複利資產] Human -->|精選| Raw Human -->|提問 / 引導| LLM Schema -.->|規範| LLM Raw -->|讀取| LLM LLM -->|擷取 / 查詢 / 健檢| Wiki Wiki -->|閱讀| Human
三個日常動作
- Ingest(擷取) — 加入新來源 → LLM 讀 → 與你討論重點 → 寫摘要頁、更新 index、更新相關條目/概念頁、log 記一筆。單一來源可牽動 10–15 頁。
- Query(查詢) — 向 wiki 提問,LLM 讀 index → 找頁 → 綜合附引用的答案。關鍵:好答案應回存成新頁,讓探索跟來源一樣複利累積。
- Lint(健檢) — 定期掃矛盾、過時主張、孤立頁、缺專屬頁的概念、缺交叉引用、資料空缺,產出修補與新探究建議。
為什麼有效
知識庫繁瑣的不是讀或想,是書目整理——更新交叉引用、保持摘要最新、維護數十頁一致。人類放棄 wiki 是因為維護負擔長得比價值快。LLM 不會無聊、不會忘記更新、可一次動 15 個檔案,維護成本趨近於零,所以 wiki 得以持續存活。
分工:人類蒐集來源、引導分析、提好問題、判斷意義;LLM 包辦其餘。
反指標:結構化垃圾場
若 AI 生成了一堆精美 wiki,但你從不讀、不拿來決策,再精緻也只是「結構化垃圾場」。Wiki 的價值在被人消化與使用,不在生成量——這也是本 vault「已內化才升 Card」原則的根據。
淵源
精神上承接 Vannevar Bush 1945 年的 Memex:私人、主動策管、文件間的聯想路徑與文件本身同等重要。Bush 無法解決「誰來做維護」——LLM 解決了。
相關
- Context-Engineering — wiki 是長期 context 的外部化載體