為什麼需要 Claude Nexus

3Q 的 fleet 跨 8 台機器，每台都不可替代：

1 台 dev server（工程師同時開 N 個 Claude Code session）
1 台 Docker host（容器主場）
1 台 AI server（GPU + Ollama）
2 台 Windows workstation（跑 Win-only 客戶工具）
1 台 Raspberry Pi（IoT 專案）
1 台 Proxmox VE node（其實上面好幾台 Linux 是它的 VM）
1 台 DNS / DDNS server（公網入口）

Claude Code 跑在每一台。三個操作問題立刻出現：

沒有可視性 — 8 個 tmux session，誰跑完了誰還在跑，沒人知道
沒有 mobility — workstation 上開的對話，到了會議裡用手機接不上
派發很煩 — SSH 進去 → attach tmux → 輸入 prompt → detach，每台機器都要這樣一輪

ℹ

為什麼不買 Nagios / Datadog / Ansible

Nagios / Zabbix 太重、學習曲線陡，跨團隊維護不划算
Datadog / New Relic 按 host 計費，8 台每月燒上千美金
Ansible / Terraform 是「派發」工具不是「監控」，declarative 對「臨時下個指令」太重
純 SSH + bash 腳本 — alert 都丟到信箱沒人看、cron 失敗無聲死亡

關鍵 insight：我們不是在管 server farm，是在管 fleet of Claude Code agents。需要的是 multi-agent control plane，不是傳統 sysadmin tool。

Operations — 雷達螢幕

左邊 topology 看所有機器、中間 session list 看所有正在跑的 Claude session、右邊 detail pane 看單一 session 的：

AGENTS — 即時 dataflow graph，顯示 main session 跟它 spawn 的 sub-agents（透過 Task tool）。每個 sub-agent 一個 node，標註角色、token 用量、用過哪些 tool。
TOOLS — 該 session 的 tool calls 時序流（Bash / Read / Edit / browser_*），with just now timestamp
CONVERSATION — 最近的 USER + CLAUDE turns，完整 markdown 渲染

Operations 頁面 — Operations — 拓撲圖 + Session list + 詳情面板（AGENTS / TOOLS / CONVERSATION 三段）

✓

這頁取代「我不知道誰在做什麼」。隊友的 Claude 哪邊卡住了、哪邊在 burn token，不用打擾他、不用 screen share，自己看。

Browse — 團隊共享記憶

8 台機器、691 個 sessions、282 k 訊息（截圖當下數字）— Browse 是這些東西的索引 + 全文搜尋。

關鍵設計：它收集所有 Claude client 的對話，不只 browser Chat：

來源	怎麼收進來
Claude Code CLI（terminal）	寫到 `~/.claude/projects/` 的 JSONL，`claude-sync` daemon 用 inotify 推進 Postgres
Claude Desktop App	同上 — 一樣寫 JSONL，一樣被 sync
VS Code Claude extension	同上
Browser Chat（Nexus 自己的）	直接寫 DB

工程師早上 9 點在 terminal 開的對話、中午吃飯時用 Desktop 的 Claude 問的問題、下午在 VS Code 改的 code，全部在同一個 timeline 裡可以搜。

Browse 頁面 — Browse — Server → Project → Session → 完整對話的層級式索引

💡

新人上線：Browse 翻 10 分鐘，知道團隊現在每個專案在做什麼。請假一週回來：翻最近 session，full context 重新拿回。

Chat — 每天的 daily driver

Terminal 版的 Claude Code 很好。但一旦你跑多 session、跨多專案、跨多機器，terminal 就不夠。Chat 解這個問題。

在桌前 — Chat 比 terminal 強的地方

🪟 每個 Chat 是獨立視窗（1400×900 native browser window，不是 tab）— 寬螢幕一次擺 4-6 個 Chat 並排
🎨 真正的 markdown 渲染 — 表格、syntax highlight code、ordered list、連結
🧩 Tool-call pipeline 收合 — 12 步的 Read → Bash → Edit → ... 折成一行
🔄 Streaming partial response — 看 Claude 一邊打字一邊渲染
📎 Drag-drop 截圖 — UI bug 直接拖進去
🔗 可分享 session URL — 丟 Slack 給隊友，他點開就能看到
📑 Window title 反映狀態 — Chat · pibar (.Dev) · ✓ idle，Alt-Tab 看得到

離開電腦 — Chat 是唯一介面

手機、平板、出差用的旅館筆電，任何瀏覽器接得回來。

Chat 頁面 — Chat — markdown 渲染 + tool pipeline 收合 + streaming response

Dashboard — fleet 健康狀態 + 認證

CPU / RAM / disk / Docker / Claude Code 認證在每台機器上的狀態。 Plan-usage meter for the active subscription。Active sessions 跨整個 fleet。 CLI / SDK 版本一鍵升級。第一頁載入確認 fleet 健康。

Projects — 跨機器專案索引

486 個專案跨整個 fleet（截圖當下），自動分層、分類、依領域分群（Claude 生態、金融 / 交易、政府、教育、生產系統等）。 Tier-1 專案（對業務最重要的）自動浮頂。活動條顯示 30 天訊息數，一眼看到哪個專案在動。

Team Dispatch — 多角色專家團隊派遣

Pre-built templates 給常見 workflow：full-stack / security audit / refactor / data analysis / debug emergency / devops / content creation / UI design / business strategy / product planning。

每個 template 定義一組角色；一鍵派發就在 fleet 上啟動一組 跨機器協作的多 agent 團隊。

Meeting — 多模型圓桌討論

把 Opus、Sonnet、Gemini 拉進同一個對話。每個參與者一欄、輪流發言（可設定回合數）、完整 markdown 渲染。

我們用這個的時機：當設計決策值得有競爭觀點並排，而不是單一模型的第一答案。範例 — Sonnet 當 Reviewer + Opus 當 Devil-Advocate，同個提示，兩種視角，< 60 秒。

Knowledge Wiki — 自動萃取結構化知識

每段對話餵進一個知識管線，自動產出：SOP、伺服器設定、問題 / 解法對、技術決策、工具 know-how、偏好。

372 筆 wiki 條目從團隊自己的對話歷史自動生成（截圖當下）。Tag 化、版本化、可搜尋、自動去重。

Architecture Graph — 自動畫的程式碼架構

對任何 Nexus 看到的專案跑 tree-sitter pass，產出分層架構圖： pages / components / APIs / services / modules / configs / databases / externals，連接以 imports / calls / renders / proxies / reads / writes / depends 邊。

範例：Nexus 自己的架構圖 — 29 nodes / 37 edges / 5 layers。有 inline AI Q&A 框（「這個 API 怎麼認證？」）即時答。

Showcase — 自家 GitHub repos 同框

一個自我參照的頁面 — Nexus 把自己的 GitHub repo 也當成它管的成品之一列出來。每個 repo 顯示：live stats (stars / forks / watchers / issues)、recent commits、recent issues + PRs、自動偵測 README 多語言版本（README.md / README.zh-TW.md 變成可切換 tabs）。

Mobile — 手機 / 平板完整功能（不是水印版）

底部 nav、card-stack 排版、跟桌面 完全一樣的功能。不是「閹割版手機 view」。任何地方都能接續工作。

5 個自製組件 — 全 first-party

Nexus 不是單一 binary，是一組小星座。每塊獨立部署、用穩定 HTTP / WebSocket API 通訊、可以被替換。每個組件都是我們自己做的，沒有包別人 hosted service。

組件	跑在哪	做什麼
Nexus dashboard	central host (1)	Next.js + WebSocket 主介面
`chat_server.py`	每台機器 (N)	FastAPI :8082，本機 spawn Claude SDK，提供 `/health`, `/ws/chat`, `/worker/dispatch`
`claude-sync`	每台機器 (N)	inotify daemon，把每個 Claude client 寫的 JSONL 推進 Postgres，< 1s 延遲
`browser-knowledge` MCP	central host	跨對話搜尋 + Wiki 萃取的 MCP server
`fleet-dispatch` MCP	central host	給 control plane 用的「跨機器跑指令」MCP — 取代 SSH chain

為什麼跑這套便宜

3 個結構性選擇讓成本壓得很低：

1. 一台 Proxmox + 多 VM

「8 台 Linux」其實大部分是同一台 Proxmox VE node 上的 VM（dev server / Docker host / DNS / Nexus host / AI server）。1U rack 空間，邏輯隔離。要加第 9 台 host？qm clone，不是採購單。

2. 全 Open Source stack

Ubuntu / PostgreSQL / MySQL / Redis / MinIO / FastAPI / Next.js / Postfix / BIND / Nginx / OpenResty / Mattermost / Jellyfin / Ollama。Zero per-seat、per-core、per-CAL 授權費。Replacing Windows Server + SQL Server 一條線就省下5-6 位數的年費。

3. AI 接管 Linux 維運

apt upgrade / restart: unless-stopped 健檢 / systemd debug / 憑證輪替 / 容器救援 — 操作員用自然語言描述意圖，Claude（透過 dashboard 跟 fleet-dispatch MCP）在對的 host 上執行。你不需要養一個 Linux 專家在編制裡。

✓

合起來看：一個小團隊跑著「平常需要 SRE + DBA + Microsoft 授權 budget」才能跑的 production infrastructure。同樣 uptime，分數的成本。

取得方式（Open Source + 客製）

Open Source

完整 blueprint + 設計決策 + recipes 開源在 GitHub：

👉 https://github.com/henryopen/claude-nexus

MIT 授權，repo 故意不放完整源碼，只放 blueprint — 理由是每家公司的 fleet 不一樣，應該用 AI 重建適合自己的，不是搬一套不適配的。

客製 / 整合服務（依工時報價）

3Q 可以幫你：

評估你現在的 fleet 規模 / 工作流，給規劃書
客製版本（保留你的內網安全模型）
整合進你既有的 monitoring / SSO
陪你 ramp up 到能自主維護

諮詢免費，依工時報價。中小團隊、有跨機器的 Claude Code workflow、覺得「我們應該有這種 dashboard 但沒空做」 — 適合聊。

Claude Nexus