自有產品 · Open Source3Q 自家內部在用MIT License持續迭代中

Claude Nexus

自架的 Claude Code fleet management dashboard

4 個工程師、8 台機器(Windows + Linux 混合)、691 個 sessions、282 k 訊息,全部從一個瀏覽器分頁看完、控管、續寫。
Operations / Browse / Chat 三個頁面,取代每天 30 分鐘的「對齊時間」。
Open Source 架構藍圖,MIT 授權 — 任何團隊都能照這個 pattern 建一套自己的。

Operations
雷達螢幕
跨機派遣
無 SSH chain
AI 接管維運
apt / cert / docker
手機 / 平板
完整功能
01

為什麼需要 Claude Nexus

3Q 的 fleet 跨 8 台機器,每台都不可替代:

  • 1 台 dev server(工程師同時開 N 個 Claude Code session)
  • 1 台 Docker host(容器主場)
  • 1 台 AI server(GPU + Ollama)
  • 2 台 Windows workstation(跑 Win-only 客戶工具)
  • 1 台 Raspberry Pi(IoT 專案)
  • 1 台 Proxmox VE node(其實上面好幾台 Linux 是它的 VM)
  • 1 台 DNS / DDNS server(公網入口)

Claude Code 跑在每一台。三個操作問題立刻出現:

  1. 沒有可視性 — 8 個 tmux session,誰跑完了誰還在跑,沒人知道
  2. 沒有 mobility — workstation 上開的對話,到了會議裡用手機接不上
  3. 派發很煩 — SSH 進去 → attach tmux → 輸入 prompt → detach,每台機器都要這樣一輪
為什麼不買 Nagios / Datadog / Ansible
  • Nagios / Zabbix 太重、學習曲線陡,跨團隊維護不划算
  • Datadog / New Relic 按 host 計費,8 台每月燒上千美金
  • Ansible / Terraform 是「派發」工具不是「監控」,declarative 對「臨時下個指令」太重
  • 純 SSH + bash 腳本 — alert 都丟到信箱沒人看、cron 失敗無聲死亡
關鍵 insight:我們不是在管 server farm,是在管 fleet of Claude Code agents。 需要的是 multi-agent control plane,不是傳統 sysadmin tool。
02

Operations — 雷達螢幕

左邊 topology 看所有機器、中間 session list 看所有正在跑的 Claude session、右邊 detail pane 看單一 session 的:

  • AGENTS — 即時 dataflow graph,顯示 main session 跟它 spawn 的 sub-agents(透過 Task tool)。每個 sub-agent 一個 node,標註角色、token 用量、用過哪些 tool。
  • TOOLS — 該 session 的 tool calls 時序流(Bash / Read / Edit / browser_*),with just now timestamp
  • CONVERSATION — 最近的 USER + CLAUDE turns,完整 markdown 渲染
Operations 頁面
Operations — 拓撲圖 + Session list + 詳情面板(AGENTS / TOOLS / CONVERSATION 三段)
這頁取代「我不知道誰在做什麼」。隊友的 Claude 哪邊卡住了、哪邊在 burn token,不用打擾他、不用 screen share,自己看。
03

Browse — 團隊共享記憶

8 台機器、691 個 sessions、282 k 訊息(截圖當下數字)— Browse 是這些東西的索引 + 全文搜尋。

關鍵設計:它收集所有 Claude client 的對話,不只 browser Chat:

來源怎麼收進來
Claude Code CLI(terminal)寫到 ~/.claude/projects/ 的 JSONL,claude-sync daemon 用 inotify 推進 Postgres
Claude Desktop App同上 — 一樣寫 JSONL,一樣被 sync
VS Code Claude extension同上
Browser Chat(Nexus 自己的)直接寫 DB

工程師早上 9 點在 terminal 開的對話、中午吃飯時用 Desktop 的 Claude 問的問題、下午在 VS Code 改的 code,全部在同一個 timeline 裡可以搜

Browse 頁面
Browse — Server → Project → Session → 完整對話的層級式索引
💡
新人上線:Browse 翻 10 分鐘,知道團隊現在每個專案在做什麼。請假一週回來:翻最近 session,full context 重新拿回。
04

Chat — 每天的 daily driver

Terminal 版的 Claude Code 很好。但一旦你跑多 session、跨多專案、跨多機器,terminal 就不夠。Chat 解這個問題。

在桌前 — Chat 比 terminal 強的地方

  • 🪟 每個 Chat 是獨立視窗(1400×900 native browser window,不是 tab)— 寬螢幕一次擺 4-6 個 Chat 並排
  • 🎨 真正的 markdown 渲染 — 表格、syntax highlight code、ordered list、連結
  • 🧩 Tool-call pipeline 收合 — 12 步的 Read → Bash → Edit → ... 折成一行
  • 🔄 Streaming partial response — 看 Claude 一邊打字一邊渲染
  • 📎 Drag-drop 截圖 — UI bug 直接拖進去
  • 🔗 可分享 session URL — 丟 Slack 給隊友,他點開就能看到
  • 📑 Window title 反映狀態Chat · pibar (.Dev) · ✓ idle,Alt-Tab 看得到

離開電腦 — Chat 是唯一介面

手機、平板、出差用的旅館筆電,任何瀏覽器接得回來。

Chat 頁面
Chat — markdown 渲染 + tool pipeline 收合 + streaming response
05

Dashboard — fleet 健康狀態 + 認證

CPU / RAM / disk / Docker / Claude Code 認證在每台機器上的狀態。 Plan-usage meter for the active subscription。Active sessions 跨整個 fleet。 CLI / SDK 版本一鍵升級。第一頁載入確認 fleet 健康。

Dashboard
Dashboard — fleet 健康總覽
Fleet Grid
Fleet Grid — 每台機器一張卡,狀態一目了然
06

Projects — 跨機器專案索引

486 個專案跨整個 fleet(截圖當下),自動分層、分類、依領域分群(Claude 生態、金融 / 交易、政府、教育、生產系統等)。 Tier-1 專案(對業務最重要的)自動浮頂。活動條顯示 30 天訊息數,一眼看到哪個專案在動。

Projects
Projects — 跨機器自動分類的專案索引
07

Team Dispatch — 多角色專家團隊派遣

Pre-built templates 給常見 workflow:full-stack / security audit / refactor / data analysis / debug emergency / devops / content creation / UI design / business strategy / product planning。

每個 template 定義一組角色;一鍵派發就在 fleet 上啟動一組 跨機器協作的多 agent 團隊

Team Dispatch
Team Dispatch — 多角色 template 一鍵派發
08

Meeting — 多模型圓桌討論

Opus、Sonnet、Gemini 拉進同一個對話。每個參與者一欄、輪流發言(可設定回合數)、完整 markdown 渲染。

我們用這個的時機:當設計決策值得有競爭觀點並排,而不是單一模型的第一答案。 範例 — Sonnet 當 Reviewer + Opus 當 Devil-Advocate,同個提示,兩種視角,< 60 秒。

Meeting
Meeting — 多模型同題並排討論
09

Knowledge Wiki — 自動萃取結構化知識

每段對話餵進一個知識管線,自動產出:SOP、伺服器設定、問題 / 解法對、技術決策、工具 know-how、偏好。

372 筆 wiki 條目從團隊自己的對話歷史自動生成(截圖當下)。Tag 化、版本化、可搜尋、自動去重。

Knowledge Wiki
Knowledge Wiki — 從對話自動萃取的 SOP / 解法 / 偏好
10

Architecture Graph — 自動畫的程式碼架構

對任何 Nexus 看到的專案跑 tree-sitter pass,產出分層架構圖: pages / components / APIs / services / modules / configs / databases / externals, 連接以 imports / calls / renders / proxies / reads / writes / depends 邊。

範例:Nexus 自己的架構圖 — 29 nodes / 37 edges / 5 layers。 有 inline AI Q&A 框(「這個 API 怎麼認證?」)即時答。

Architecture Graph
Architecture Graph — Nexus 自己的架構圖(自我參照)
11

Showcase — 自家 GitHub repos 同框

一個自我參照的頁面 — Nexus 把自己的 GitHub repo 也當成它管的成品之一列出來。 每個 repo 顯示:live stats (stars / forks / watchers / issues)、recent commits、recent issues + PRs、自動偵測 README 多語言版本README.md / README.zh-TW.md 變成可切換 tabs)。

Showcase
Showcase — 自家 repos 統計 + 最近 commits + 多語 README tabs
12

Mobile — 手機 / 平板完整功能(不是水印版)

底部 nav、card-stack 排版、跟桌面 完全一樣的功能不是「閹割版手機 view」。任何地方都能接續工作。

Mobile home
Mobile Home
Mobile operations
Mobile Operations
13

5 個自製組件 — 全 first-party

Nexus 不是單一 binary,是一組小星座。每塊獨立部署、用穩定 HTTP / WebSocket API 通訊、可以被替換。每個組件都是我們自己做的,沒有包別人 hosted service

組件跑在哪做什麼
Nexus dashboardcentral host (1)Next.js + WebSocket 主介面
chat_server.py每台機器 (N)FastAPI :8082,本機 spawn Claude SDK,提供 /health, /ws/chat, /worker/dispatch
claude-sync每台機器 (N)inotify daemon,把每個 Claude client 寫的 JSONL 推進 Postgres,< 1s 延遲
browser-knowledge MCPcentral host跨對話搜尋 + Wiki 萃取的 MCP server
fleet-dispatch MCPcentral host給 control plane 用的「跨機器跑指令」MCP — 取代 SSH chain
14

為什麼跑這套便宜

3 個結構性選擇讓成本壓得很低:

1. 一台 Proxmox + 多 VM

「8 台 Linux」其實大部分是同一台 Proxmox VE node 上的 VM(dev server / Docker host / DNS / Nexus host / AI server)。1U rack 空間,邏輯隔離。要加第 9 台 host?qm clone,不是採購單。

2. 全 Open Source stack

Ubuntu / PostgreSQL / MySQL / Redis / MinIO / FastAPI / Next.js / Postfix / BIND / Nginx / OpenResty / Mattermost / Jellyfin / Ollama。Zero per-seat、per-core、per-CAL 授權費。Replacing Windows Server + SQL Server 一條線就省下5-6 位數的年費

3. AI 接管 Linux 維運

apt upgrade / restart: unless-stopped 健檢 / systemd debug / 憑證輪替 / 容器救援 — 操作員用自然語言描述意圖,Claude(透過 dashboard 跟 fleet-dispatch MCP)在對的 host 上執行。你不需要養一個 Linux 專家在編制裡

合起來看:一個小團隊跑著「平常需要 SRE + DBA + Microsoft 授權 budget」才能跑的 production infrastructure。同樣 uptime,分數的成本
15

取得方式(Open Source + 客製)

Open Source

完整 blueprint + 設計決策 + recipes 開源在 GitHub:

👉 https://github.com/henryopen/claude-nexus

MIT 授權,repo 故意不放完整源碼,只放 blueprint — 理由是每家公司的 fleet 不一樣,應該用 AI 重建適合自己的,不是搬一套不適配的。

客製 / 整合服務(依工時報價)

3Q 可以幫你:

  • 評估你現在的 fleet 規模 / 工作流,給規劃書
  • 客製版本(保留你的內網安全模型)
  • 整合進你既有的 monitoring / SSO
  • 陪你 ramp up 到能自主維護

諮詢免費,依工時報價。中小團隊、有跨機器的 Claude Code workflow、 覺得「我們應該有這種 dashboard 但沒空做」 — 適合聊。

想做類似的 fleet management?

Repo 在 GitHub 上隨拿,諮詢、客製、整合服務依工時報價。