新工具評估 SOP
狀態:有效 | 版本:v1.0 | 建立:2026-06-10 | 負責:KM 來源:江江教練 2026-04-19 通識課「給文科生的 AI 知識管理:Harness Engineering × LLM Wiki」(完整分析:
knowledge/analyses/2026-06-10-yt-jiangjiang-harness-lecture.md維度 3 概念 5) 適用情境:任何爆紅 AI 工具出現、需判斷「要不要進入 Tim 工作流」時
核心原則
「熱門工具我叫我的 AI 去研究」 — 不跟風立即學習,先讓 AI 評估,確認與職涯顧問業務有實際整合價值後才進入系統。
新工具爆紅時最大的成本不是「沒跟上」,而是「花時間學了一個 3 週後就不用的東西」。本 SOP 用 7 週節奏,讓 Tim 用最低時間成本做出「進 / 不進」的決定。
一、觸發條件(什麼叫「爆紅」)
以下任一成立 → 啟動第 0 週:
- Tim 在 3 天內從 ≥ 2 個管道(Threads / LINE 群 / 媒體報導 / 客戶提問)看到同一工具名詞
- 競品掃描(
knowledge-inflow-active-sop.mdD4)發現競品已廣泛採用某新工具 - Tim 主動說「[工具名] 要不要用 / 值不值得學 / 試試看嗎 / 怎麼樣」
多工具同時爆紅的優先規則:同一週 ≥ 2 個工具觸發 → 先評估「與現有 SKILL 整合潛力最高」者,其餘排隊(不並行,避免分散)。
適用工具範圍:以 AI 工具 + 與職涯顧問業務相關的工具為主(內容創作 / 知識管理 / 諮詢輔助 / 求職市場相關)。純技術工具(如純圖像生成、與業務無關者)→ 可只跑第 0–1 週快評,第 4 週小結後直接結束。
二、7 週落地節奏(TZLTH-HQ 版)
| 週次 | 動作 | WHY | 時間投入 |
|---|---|---|---|
| 第 0 週 | 只看不動 | bug 還多、社群評價未沉澱,此時投入易踩雷 | 0(被動觀察) |
| 第 1 週 | 叫 AI 做 3 步評估(見第三節)→ 輸出 tool-evaluations/ 記錄 |
低成本獲取完整資訊,AI 全代做 | ~30 分鐘 |
| 第 2–4 週 | 遇到合適任務就用此工具完成,真實場景至少使用 3 次,每次記一行觀察 | 整合入系統而非孤立學;用真實摩擦點驗證,非紙上評估 | 不安排專門時間,隨任務發生;每週 ~1–2 hr |
| 第 5 週 | 系統穩定、3 次驗證通過 → 可在諮詢中向客戶推薦 | 確保對外推薦的是 Tim 親自驗證過的可靠工具 | 視諮詢場景 |
| 第 6 週 | 視深度心得決定整合方式(升 SKILL / 加課程 notes / 寫 Threads) | 知識資產化,讓一次評估產生複利 | 視整合方式 |
| 第 7 週 | 更新 tool-evaluations/[檔] 最終決定(已整合 / 結束) |
留下決策記錄,避免未來重複評估同工具 | ~10 分鐘 |
「不進」(No-go)條件 — 第 1 週結束即停,跳過第 2–4 週
以下任一成立 → 評估到第 1 週為止,記錄「評估結束(未進入)」+ No-go 原因:
- 社群主流反映「bug 多、穩定性差」
- 功能與現有 SKILL 高度重疊(重疊率 > 70%)
- 需要付費訂閱且當前無預算
- Tim 諮詢場景中客戶用不到此工具
第 6 週「升 SKILL」決策標準
- 第 2–4 週使用 ≥ 2 次 且 比現有方法 省時 > 30% → 升輕量 SKILL(建獨立
.claude/skills/檔) - 否則 → 加入現有 SKILL 的 notes / 寫 Threads 分享,不建獨立 SKILL 文件
Week 5–7 例外
工具與諮詢業務無直接關聯 → 第 4 週小結後直接結束,第 5–7 週跳過。
三、AI 總管 3 步評估流程(第 1 週執行)
Week 1 啟動 Prompt 模板(Tim 直接複製貼上)
新工具評估啟動:[工具名]
1. 爬官方頁,摘要主要功能和目標用戶
2. 搜尋社群負評、已知 bug、主要爭議
3. 比對我現有的 .claude/skills/ 清單,這工具能接哪些既有流程?
4. 輸出三項建議:要不要進、怎麼進、先接哪個 SKILL
Claude 輸出格式(3 步結果)
| 步驟 | 項目 | 內容 |
|---|---|---|
| Step 1 | 外部研究摘要 | 官方定位 + 社群主要正評 / 負評 / 未知風險 |
| Step 2 | 技能包比對 | 可接入的現有 SKILL 清單(掃 .claude/skills/)+ 重疊率估計 |
| Step 3 | 總管建議 | 進 / 不進 + 理由;若進:第 2–4 週從哪個 SKILL 開始整合 |
若 Tim 在第 1 週看到的是介紹此工具的 YouTube 影片 → 先跑
yt-learning-sop.md八維分析,其結果可作為 Step 1「外部研究摘要」的輸入;網頁 同理走web-learning-sop.md。
Week 1 完成後 Claude 自動動作(防遺忘機制)
評估完成、判定「進入第 2–4 週」後,Claude 自動在 dev/tasks.md 新增追蹤條目:
- [ ] P3:【KM】[工具名] 工具評估 Week 2-4——至 YYYY-MM-DD 完成 3 次真實場景使用觀察(評估檔:knowledge/tool-evaluations/YYYY-MM-[工具名].md)
WHY:7 週是長週期,Week 1 評估完容易放著忘記。寫入 tasks.md → 總部儀表板讀得到,不會被遺忘。
四、TZLTH-HQ 使用指引
觸發方式
Tim 輸入:「新工具評估 [工具名]」或自然語言問「[工具名] 要不要用」 → Claude 依本 SOP 第三節執行 3 步評估
Week 2–4 觀察記錄方式
每次用完此工具,Tim 說一句:
記到工具評估:工具[X] 比 [既有方法] 快/慢/一樣,摩擦點:[XXX]
→ Claude 追加至 tool-evaluations/[檔] 的「融合觀察」區塊
Week 4 小結
Tim 說「彙整 [工具名] 觀察」→ Claude 讀 3 次觀察 → 輸出「融合評估小結」+ 建議(進第 5 週 / 結束)
與其他 SOP 的邊界
| SOP | 負責問題 | 與本 SOP 關係 |
|---|---|---|
new-tool-evaluation-sop.md(本檔) |
這工具 Tim 自己要不要用? | — |
knowledge-inflow-active-sop.md D4 |
競品如何使用此工具影響職涯市場? | D4 發現新工具廣泛採用 → 反向參考:代表工具已成熟,可加速進入 Week 2 |
yt-learning-sop.md / web-learning-sop.md |
單一影片 / 網頁的內容學習 | 其分析結果可作為本 SOP Step 1 的輸入 |
五、存檔規定
評估記錄位置
knowledge/tool-evaluations/YYYY-MM-[工具名].md(格式見該資料夾 README)
記錄時機
- Week 1:3 步評估完成後建檔
- Week 2–4:每次使用觀察追加
- Week 4 / 7:小結 + 最終決定回填
「不進」也要記錄
判定 No-go 時,同樣建檔並在「最終決定」勾選「評估結束(未進入)」+ 填 No-go 原因。
→ 6 個月後再看到同一工具,先查 tool-evaluations/ 避免重複評估。
SOP 自身維護
每完成一個完整 7 週循環,在收尾「對話品質自查」中補記一條 IMP 觀察(流程是否順暢、哪一週卡住);累積 ≥ 2 條同類 → 評估升規。
前置條件 / 預期結果 / 常見錯誤
前置條件:knowledge/tool-evaluations/ 資料夾存在;Tim 已看到工具達觸發條件。
預期結果:每個被評估的工具都有一份 tool-evaluations/ 記錄,明確標注「已整合 / 評估結束」,無懸而未決的工具。
常見錯誤:
- ❌ 工具一爆紅就立即深度學習(跳過第 0 週觀察期)→ 易踩 early bug
- ❌ Week 1 評估完忘記繼續(→ 已有 tasks.md 自動追蹤條目防護)
- ❌ 「不進」不記錄 → 半年後重複評估同工具
- ❌ 把與業務無關的工具也跑滿 7 週 → 適用範圍已限縮(見第一節)