上週政府某局處承辦來電:「AJ,我們三年前有一份會議紀錄,現在要找其中一段關於某政策草案的討論,整個檔案夾翻爛了,找不到。」我跟他說:「你不是找不到,是當年沒把它放對地方。」
知識庫的問題從來不是搜尋,是建構——而 LLM 剛好是建構成本的剋星。這就是我拍這支影片的原因。
Karpathy 那則推文打到我
影片裡我用的核心思路,來自 Andrej Karpathy 2026 年 4 月的一則推文。他講了一句很直接的話:
「別讓人整理,讓 LLM 整理。」—— Andrej Karpathy, X, 2026.04
過去我們建知識庫的瓶頸是「人不願意花時間把資訊整理進去」。但今天,整理這件事 LLM 比人做得好——你只需要把原始材料丟給它,它幫你整理成結構化的 Markdown 知識庫。
為什麼是 Codex,不是 ChatGPT
一般人用 ChatGPT 也能整理,但有個限制——它一次只能處理你貼進去的內容,無法主動去翻你的整個資料夾。
Codex 不一樣。它跑在你的本機(或雲端 sandbox),可以自己讀資料夾、自己建立檔案、自己跑命令。我在影片裡示範的整個流程:
- 把 120 份 PDF 丟到一個資料夾
- 寫一份
Agent.md告訴 Codex 要怎麼整理 - 讓它跑——它會自己一份一份讀、抽重點、建索引、做 wikilink
- 結束後你有一份結構化的 Markdown 知識庫,可以丟 Obsidian、丟 Notion、做網站
整支影片沒有打開 PowerPoint、沒有寫 Python、沒有用 LangChain。只有一個資料夾、一份 Agent.md、一個 ChatGPT 帳號。
三個 take-away(沒空看影片的話)
- Codex 不需要 API key,只要你的 ChatGPT 帳號——Plus、Pro 都能用。對非工程師最大的門檻就是這個。
- Agent.md 是這套流程的靈魂。寫得好,Codex 跑得乖;寫得爛,跑出來的知識庫一樣亂。
- 這套方法不只能整理知識庫——把它套到「整理客戶資料」「整理會議紀錄」「整理研究素材」都成立。本質是「把整理這件事外包給 LLM」。
給不同角色的話
給承辦人員:如果你手上有一堆三年五年累積的會議紀錄、政策草案、長官指示,這套方法可以救你的命。前提是這些檔案在你本機或某個 Codex 能讀的地方。
給知識工作者:你看的書、你寫的筆記、你發過的信,這些其實已經是一座知識庫——只是沒整理。試試看一個週末用 Codex 把過去半年的筆記建成一份結構化目錄。你會嚇到。
給我自己:我用同一套流程做了那個數位整個官網的內容索引、課程素材庫、客戶提案資料庫。省下來的不是時間,是「找東西」這件事的心智負擔。
結語
我們以為知識庫的瓶頸是搜尋,原來是建構——而 Codex 把建構的成本壓到一個週末。
沒有 Python、沒有向量資料庫、沒有 LangChain。只有一個資料夾、一份 Agent.md、一個 ChatGPT 帳號。