今天 3 件最值得 3Q 客戶看的事:Claude Code 推出動態工作流,複雜自動化任務可即時拆解為多代理平行處理,解決長時間執行的「代理怠惰」問題;Anthropic 工程團隊公開 AI 原生工程組織的實際運作方式,從規劃到審查全面重塑開發流程;Project Glasswing 資安計畫擴展至 150 家以上關鍵基礎設施企業,用 AI 主動掃描程式碼弱點。AI 代理工具鏈正從「試試看」步入日常正式部署階段。
產品動態
Claude Code 推出動態工作流:複雜任務可即時拆分多代理平行處理
Claude Code 新增動態工作流功能,模型在執行時可即興建立並協調多代理框架來處理複雜任務。透過執行特定 JavaScript 檔案產生擁有獨立上下文視窗的子代理,可解決長時間執行任務的「代理怠惰」問題。適用場景包含研究、資安分析、程式碼審查等高價值複雜任務,通常消耗較多 Token,最佳實踐仍在持續演進中。
對 3Q 客戶意義:3Q 承接的多系統串接、遺留 ERP 遷移、大量資料清洗等複雜專案,動態工作流可讓 Claude Code 自動拆分子任務平行處理,直接降低失誤率與人工介入頻率。
Anthropic 工程團隊實戰分享:AI 原生工程組織如何重塑開發流程
在 Code w/ Claude SF 2026 活動上,Claude Code 工程團隊公開導入 AI 原生開發後的三大流程轉變:規劃改為即時原型加快速反饋(JIT 模式);「怎麼做」的第一步從查文件改為先問 Claude;程式碼審查中 Claude 負責風格與測試,人工專注於法律合規、資安等需高度判斷的環節。工程瓶頸已從「寫程式碼」轉向「驗證、審查與安全維護」。
對 3Q 客戶意義:這套實踐方法 3Q 內部工程師現在就可以套用,同時也是陪伴客戶 IT 團隊升級工作方式的具體參考範本。
Claude Code 實戰技巧:讓代理交回成果前自行做品質檢查
Claude Devs 官方分享實用技巧:在 Claude Code 工作流中加入自我檢查環節,讓模型在交回成果前主動驗證輸出品質,形成反饋迴圈。透過明確定義「完成條件」,可讓 Claude 自動關閉驗證循環,減少人工往返確認的次數,提升整體輸出可靠度。
對 3Q 客戶意義:3Q 使用 Claude Code 執行自動化任務時,加入自我檢查步驟可顯著減少客戶交付的人工驗收工時,直接提升服務品質。
GitHub Copilot App 正式定位為「代理原生桌面體驗」
微軟 Build 2026 上,GitHub 將新版 Copilot App 定位為「代理原生桌面體驗」,讓 AI 代理以開發者習慣的方式融入日常工作流程。同步發布多項工具與整合更新,強調代理能力從輔助功能升格為核心架構。
對 3Q 客戶意義:主流 IDE 生態的 AI 代理整合已成標配,3Q 在協助客戶評估開發工具或導入 IT 現代化方案時,代理能力應列為基本採購需求。
來源:GitHub 官方部落格
產業動態
Anthropic Project Glasswing 擴展至 150 家以上關鍵基礎設施企業
Anthropic 將 Project Glasswing 從約 50 家擴展至 150 家以上合作組織,遍及 15 個以上國家,涵蓋電力、水務、醫療、通信、硬體等關鍵基礎設施行業。計畫使用 Claude 前沿模型(含 Claude Mythos Preview)主動掃描程式碼弱點並協助修復,應對 AI 驅動的網路安全威脅。同步推出面向一般企業的 Claude Security 產品,可掃描程式碼並建議修補程式。
對 3Q 客戶意義:台灣的政府單位和製造業客戶,若有老舊 VFP/FoxPro 轉 Web 的遺留程式碼,3Q 可主動提出 AI 輔助弱點掃描的評估方案。
開放模型已佔全球 AI 推論 69%,競爭格局持續洗牌
根據 OpenRouter 平台資料,開放權重模型已產生 69.1% 的 Token 使用量,閉源模型僅佔 30.9%。開放模型市場內部競爭激烈,DeepSeek 早期優勢已被 MiniMax、Kimi、Qwen、騰訊 Hy3 等模型輪流取代。數據顯示開發者越來越願意將正式流量路由至開放模型,尤其在資料隱私有顧慮的場景。
對 3Q 客戶意義:對資料不能出境的製造業和政府客戶,本地部署開放模型已是可行的正式方案,3Q 可主動評估並提出內網部署建議。
工具開源
微軟開源 AI 行為測試框架:用文字描述就能產生評估測試案例
微軟開源發布 Adaptive Spec-driven Scoring for Evaluation and Regression Testing 框架。開發者只需用文字描述 AI 應有的行為,即可快速產生對應的測試案例,用於模型評估與回歸測試。大幅降低建立 AI 評估流程的技術門檻,非 ML 背景的工程師也能維護 AI 品質。
對 3Q 客戶意義:3Q 在為客戶整合 AI 功能時,可用此類工具快速建立驗收測試,確保 AI 行為符合業務需求後再上線,降低交付風險。
3Q 編輯部觀點
今天的新聞可以用一句話總結:AI 代理開發工具鏈正在快速成熟,從工具功能到組織文化都在同步演進,而這對 3Q 客戶的意義已超出「技術趨勢」層次,進入「現在就要決策」的範疇。
Claude Code 今天有三個值得仔細讀的訊號。首先是動態工作流功能:過去做複雜自動化任務,單一 Claude 對話視窗容易出現「代理怠惰」——模型走到後段開始敷衍、漏做步驟。現在可以即時拆分為多個子代理,每個子代理有獨立上下文,互相協作。對 3Q 承接的多系統串接、遺留 ERP 遷移、大量資料清洗等任務,這個功能直接降低失誤率。
其次是 Anthropic 工程團隊自己的組織實踐分享。他們導入 AI 原生開發後,有三件事改變了:規劃不再是冗長的前期文件,改為快速原型加反饋;「怎麼做」的第一步不是查 Stack Overflow,而是先問 Claude;程式碼審查中 Claude 負責風格、測試、lint,人工專注於法律合規、安全判斷等高階決策。這不是遙遠的大公司經驗——3Q 的工程師現在就可以套用,也可以作為陪伴客戶 IT 團隊升級的具體藍圖。
資安方面,Project Glasswing 擴展到 150 家以上關鍵基礎設施企業是個明確訊號:AI 輔助的主動資安掃描正在從研究走向落地。電力、水務、醫療、通信都在範圍內。台灣的政府單位和製造業客戶,如果程式碼庫裡有老舊 VFP/FoxPro 轉 Web 的遺留邏輯,更應該認真考慮做一次 AI 輔助弱點掃描。這是 3Q 可以主動提案的服務項目,而不是等客戶出事後才補救。
最後一個值得留意的結構性變化:開放模型已佔全球 AI 推論 69%。這對 3Q 的意義很直接——越來越多資料不能出境的工廠主和政府單位客戶,本地部署開放模型已從「技術可行」變成「工程選項」。下次遇到這類客戶,可以主動評估 Qwen、LLaMA 等在內網跑的可行性,而不是預設只能接受 OpenAI 或 Claude API。今天的重點不是哪個模型 benchmark 最高,而是怎麼把 AI 真正用進日常工程流程——這才是 3Q 陪客戶走數位轉型的核心。
資料素材來源:AIHOT (aihot.virxact.com)。本文由 3Q 編輯部用 Claude 篩選、翻譯為繁體中文、加上對 3Q 客戶意義的觀點。各則新聞著作權屬原始發佈者,請點上方連結看原文。