新工具評估 SOP

狀態：有效｜版本：v1.0 ｜建立：2026-06-10 ｜負責：KM 來源：江江教練 2026-04-19 通識課「給文科生的 AI 知識管理：Harness Engineering × LLM Wiki」（完整分析：knowledge/analyses/2026-06-10-yt-jiangjiang-harness-lecture.md 維度 3 概念 5）適用情境：任何爆紅 AI 工具出現、需判斷「要不要進入 Tim 工作流」時

核心原則

「熱門工具我叫我的 AI 去研究」 — 不跟風立即學習，先讓 AI 評估，確認與職涯顧問業務有實際整合價值後才進入系統。

新工具爆紅時最大的成本不是「沒跟上」，而是「花時間學了一個 3 週後就不用的東西」。本 SOP 用 7 週節奏，讓 Tim 用最低時間成本做出「進 / 不進」的決定。

一、觸發條件（什麼叫「爆紅」）

以下任一成立 → 啟動第 0 週：

Tim 在 3 天內從 ≥ 2 個管道（Threads / LINE 群 / 媒體報導 / 客戶提問）看到同一工具名詞
競品掃描（knowledge-inflow-active-sop.md D4）發現競品已廣泛採用某新工具
Tim 主動說「[工具名] 要不要用 / 值不值得學 / 試試看嗎 / 怎麼樣」

多工具同時爆紅的優先規則：同一週 ≥ 2 個工具觸發 → 先評估「與現有 SKILL 整合潛力最高」者，其餘排隊（不並行，避免分散）。

適用工具範圍：以 AI 工具 + 與職涯顧問業務相關的工具為主（內容創作 / 知識管理 / 諮詢輔助 / 求職市場相關）。純技術工具（如純圖像生成、與業務無關者）→ 可只跑第 0–1 週快評，第 4 週小結後直接結束。

二、7 週落地節奏（TZLTH-HQ 版）

週次	動作	WHY	時間投入
第 0 週	只看不動	bug 還多、社群評價未沉澱，此時投入易踩雷	0（被動觀察）
第 1 週	叫 AI 做 3 步評估（見第三節）→ 輸出 `tool-evaluations/` 記錄	低成本獲取完整資訊，AI 全代做	~30 分鐘
第 2–4 週	遇到合適任務就用此工具完成，真實場景至少使用 3 次，每次記一行觀察	整合入系統而非孤立學；用真實摩擦點驗證，非紙上評估	不安排專門時間，隨任務發生；每週 ~1–2 hr
第 5 週	系統穩定、3 次驗證通過 → 可在諮詢中向客戶推薦	確保對外推薦的是 Tim 親自驗證過的可靠工具	視諮詢場景
第 6 週	視深度心得決定整合方式（升 SKILL / 加課程 notes / 寫 Threads）	知識資產化，讓一次評估產生複利	視整合方式
第 7 週	更新 `tool-evaluations/[檔]` 最終決定（已整合 / 結束）	留下決策記錄，避免未來重複評估同工具	~10 分鐘

「不進」（No-go）條件 — 第 1 週結束即停，跳過第 2–4 週

以下任一成立 → 評估到第 1 週為止，記錄「評估結束（未進入）」+ No-go 原因：

社群主流反映「bug 多、穩定性差」
功能與現有 SKILL 高度重疊（重疊率 > 70%）
需要付費訂閱且當前無預算
Tim 諮詢場景中客戶用不到此工具

第 6 週「升 SKILL」決策標準

第 2–4 週使用 ≥ 2 次 且比現有方法 省時 > 30% → 升輕量 SKILL（建獨立 .claude/skills/ 檔）
否則 → 加入現有 SKILL 的 notes / 寫 Threads 分享，不建獨立 SKILL 文件

Week 5–7 例外

工具與諮詢業務無直接關聯 → 第 4 週小結後直接結束，第 5–7 週跳過。

三、AI 總管 3 步評估流程（第 1 週執行）

Week 1 啟動 Prompt 模板（Tim 直接複製貼上）

新工具評估啟動：[工具名]
1. 爬官方頁，摘要主要功能和目標用戶
2. 搜尋社群負評、已知 bug、主要爭議
3. 比對我現有的 .claude/skills/ 清單，這工具能接哪些既有流程？
4. 輸出三項建議：要不要進、怎麼進、先接哪個 SKILL

Claude 輸出格式（3 步結果）

步驟	項目	內容
Step 1	外部研究摘要	官方定位 + 社群主要正評 / 負評 / 未知風險
Step 2	技能包比對	可接入的現有 SKILL 清單（掃 `.claude/skills/`）+ 重疊率估計
Step 3	總管建議	進 / 不進 + 理由；若進：第 2–4 週從哪個 SKILL 開始整合

若 Tim 在第 1 週看到的是介紹此工具的 YouTube 影片 → 先跑 yt-learning-sop.md 八維分析，其結果可作為 Step 1「外部研究摘要」的輸入；網頁同理走 web-learning-sop.md。

Week 1 完成後 Claude 自動動作（防遺忘機制）

評估完成、判定「進入第 2–4 週」後，Claude 自動在 dev/tasks.md 新增追蹤條目：

- [ ] P3：【KM】[工具名] 工具評估 Week 2-4——至 YYYY-MM-DD 完成 3 次真實場景使用觀察（評估檔：knowledge/tool-evaluations/YYYY-MM-[工具名].md）

WHY：7 週是長週期，Week 1 評估完容易放著忘記。寫入 tasks.md → 總部儀表板讀得到，不會被遺忘。

四、TZLTH-HQ 使用指引

觸發方式

Tim 輸入：「新工具評估 [工具名]」或自然語言問「[工具名] 要不要用」 → Claude 依本 SOP 第三節執行 3 步評估

Week 2–4 觀察記錄方式

每次用完此工具，Tim 說一句：

記到工具評估：工具[X] 比 [既有方法] 快/慢/一樣，摩擦點：[XXX]

→ Claude 追加至 tool-evaluations/[檔] 的「融合觀察」區塊

Week 4 小結

Tim 說「彙整 [工具名] 觀察」→ Claude 讀 3 次觀察 → 輸出「融合評估小結」+ 建議（進第 5 週 / 結束）

與其他 SOP 的邊界

SOP	負責問題	與本 SOP 關係
`new-tool-evaluation-sop.md`（本檔）	這工具 Tim 自己要不要用？	—
`knowledge-inflow-active-sop.md` D4	競品如何使用此工具影響職涯市場？	D4 發現新工具廣泛採用 → 反向參考：代表工具已成熟，可加速進入 Week 2
`yt-learning-sop.md` / `web-learning-sop.md`	單一影片 / 網頁的內容學習	其分析結果可作為本 SOP Step 1 的輸入

五、存檔規定

評估記錄位置

knowledge/tool-evaluations/YYYY-MM-[工具名].md（格式見該資料夾 README）

記錄時機

Week 1：3 步評估完成後建檔
Week 2–4：每次使用觀察追加
Week 4 / 7：小結 + 最終決定回填

「不進」也要記錄

判定 No-go 時，同樣建檔並在「最終決定」勾選「評估結束（未進入）」+ 填 No-go 原因。 → 6 個月後再看到同一工具，先查 tool-evaluations/ 避免重複評估。

SOP 自身維護

每完成一個完整 7 週循環，在收尾「對話品質自查」中補記一條 IMP 觀察（流程是否順暢、哪一週卡住）；累積 ≥ 2 條同類 → 評估升規。

前置條件 / 預期結果 / 常見錯誤

前置條件：knowledge/tool-evaluations/ 資料夾存在；Tim 已看到工具達觸發條件。

預期結果：每個被評估的工具都有一份 tool-evaluations/ 記錄，明確標注「已整合 / 評估結束」，無懸而未決的工具。

常見錯誤：

❌ 工具一爆紅就立即深度學習（跳過第 0 週觀察期）→ 易踩 early bug
❌ Week 1 評估完忘記繼續（→ 已有 tasks.md 自動追蹤條目防護）
❌ 「不進」不記錄 → 半年後重複評估同工具
❌ 把與業務無關的工具也跑滿 7 週 → 適用範圍已限縮（見第一節）