今天有三件事值得 3Q 客戶停下來想一想：Claude 在五天內協助安全團隊突破蘋果耗費五年打造的 M5 硬體級防護，AI 輔助滲透測試的速度已遠超傳統節奏；Anthropic CEO 與微軟 AI 執行長同週示警，軟體成本趨近於零、白領工作大規模自動化的時代比多數人預期的更近；學術研究則指出 AI Agent 自動「整理記憶」反而讓可靠性大幅下降，這對正在導入 AI 工作流的企業是一個不可忽視的設計警訊。

產品動態

Claude 五天攻破 Apple M5 macOS 核心漏洞，AI 輔助資安研究進入新紀元

Anthropic 的 Claude Mythos Preview 協助安全研究團隊 Calif，在短短五天內成功建構並演示首個針對 Apple M5 晶片 macOS 核心的記憶體破壞提權攻擊鏈。此攻擊繞過了蘋果耗時五年、投入數十億美元打造的 MIE 硬體級記憶體完整性防護，從普通使用者權限透過純資料操作即可取得 root 權限。Apple 已在後續更新中修復漏洞並致謝。此事件標誌著 AI 驅動的資安研究已能以極快速度突破頂尖硬體防護，顯著改變了攻防的速度與平衡。

對 3Q 客戶意義：AI 輔助滲透測試已大幅壓縮漏洞發現的時間成本，IT 顧問在協助客戶做資安評估時，必須重新檢視現有防禦架構是否跟得上 AI 加速的威脅節奏。

來源：X：Berry Xia (@berryxia)

論文研究

研究警告：AI Agent 自動整理記憶反而降低可靠性，GPT-4 任務成功率從 100% 跌至 54%

伊利諾大學與清華大學等機構研究發現，LLM Agent 將原始經歷壓縮成書面教訓的「記憶重寫」機制，會嚴重損害記憶可靠性。在網頁購物、模擬世界及 ARC 風格謎題等任務測試中，反覆重寫記憶導致錯誤分組、規則過度概括或過擬合。以 GPT-4 為例，無記憶時可 100% 解決小型 ARC-AGI 問題集，建立記憶並串流更新後，性能降至約 54%。研究建議 Agent 記憶系統應保留原始經歷作為關鍵證據，而非自動將所有體驗壓縮為摘要。

對 3Q 客戶意義：正在或計畫導入 AI Agent 工作流程的企業，應要求供應商說明記憶架構設計，避免「越學越差」的問題侵蝕系統可靠性。

來源：X：Rohan Paul (@rohanpaul_ai)

產業動態

Anthropic CEO：軟體成本即將趨近於零，現有工作結構面臨根本性巨變

Anthropic 執行長 Dario Amodei 在《華爾街日報》訪談中表示，軟體成本將急劇下降、可能基本免費，傳統軟體依賴大量用戶分攤開發成本的商業前提將不再成立。他警告，數十年來建立的許多工作與職業可能消失，而社會目前完全未意識到即將到來的變革規模，強調不是不能適應，而是適應的速度必須加快。

對 3Q 客戶意義：軟體免費化趨勢一旦成真，「選哪個工具」的問題將被「怎麼整合進業務流程」取代，3Q 協助客戶做 AI 工作流整合的顧問價值將大幅提升。

來源：X：Rohan Paul (@rohanpaul_ai)

微軟 AI 執行長：18 個月內 AI 將自動化大多數白領工作，會計、法律、專案管理首當其衝

微軟 AI 執行長 Mustafa Suleyman 在 Fortune 訪談中預測，AI 將在 18 個月內達到人類水準的表現，並全面自動化包括會計、法律、行銷與專案管理在內的大多數專業任務。他指出，所有涉及「坐在電腦前」的白領工作都將被 AI 取代，並透露其使命是構建「超級智慧」，未來創建新 AI 模型將像寫部落格一樣便捷。

對 3Q 客戶意義：對 3Q 客戶中的 IT 老闆與工廠主而言，現在開始導入 AI 並讓員工學會與 AI 協作，比等到衝擊發生後再應對，代價要小得多。

來源：X：Kim (@kimmonismus)

工具開源

Zerostack 1.0.0 發佈：純 Rust 撰寫、Unix 哲學驅動的輕量級程式設計代理

Zerostack 正式發佈 1.0.0 版本，以純 Rust 語言開發，遵循 Unix「做一件事並做好」的設計哲學，已在 Rust 套件管理平台 crates.io 上架。Rust 語言以記憶體安全與高效能著稱，Unix 設計強調簡潔與模組化，Zerostack 結合兩者優勢，定位為輕量且可靠的程式碼輔助工具。本次發佈在技術社群 Hacker News 獲得 115 點關注，反映開發者對高品質輔助工具的高度興趣。

對 3Q 客戶意義：對有 Web ERP 或進銷存系統開發需求的 3Q 客戶，Rust 生態的 AI 輔助工具逐漸成熟，適合評估納入開發工具鏈。

來源：Hacker News 熱門（buzzing.cc 中文翻譯）

3Q 編輯部觀點

今天的新聞有個清晰的主軸：AI 的速度與能力，正在以多數人沒有預料到的方式重塑各領域的遊戲規則。

Claude 五天破解 Apple M5 這件事，不只是資安新聞，它是一個信號。過去需要頂尖紅隊花數個月的工作，現在 AI 可以在一個工作週內完成。對 3Q 協助的 IT 維運客戶來說，現有的安全評估週期和弱點管理節奏都需要跟著調整。等季度一次的弱點掃描，已經跟不上 AI 加速的攻擊發現速度。這不是恐嚇，而是實際發生過的案例。

Dario Amodei 和 Mustafa Suleyman 同週都在說同一件事，只是角度不同。Amodei 說「軟體免費」，Suleyman 說「白領工作消失」，本質上是同一個問題的兩個側面：當 AI 以接近零成本完成原本需要人力的任務，整個產業的定價邏輯都會改變。對 3Q 客戶中的 IT 老闆和工廠主而言，這不是哲學討論，而是三到五年內就會碰到的現實衝擊。現在開始推動 AI 工作流整合、讓員工學會和 AI 協作，比等到衝擊發生後再應對，代價要小得多。

LLM Agent 記憶研究的發現，則給所有正在部署 AI 自動化流程的企業一個很實際的提醒：AI 系統的設計細節會大幅影響可靠性。GPT-4 加了記憶整理後性能腰斬的例子說明，「加了 AI」不等於「可靠地加了 AI」。企業在評估 AI 工具時，必須要求供應商說清楚記憶與上下文的管理機制，不能只看 Demo 表現。

整體而言，今天的新聞告訴我們：AI 的節奏快到業界老手自己都在公開示警。對 3Q 這樣的 B2B IT 顧問而言，能在混亂中幫客戶找到可落地、可驗證的 AI 整合路徑，才是當下最有價值的事。

資料素材來源：AIHOT (aihot.virxact.com)。本文由 3Q 編輯部用 Claude 篩選、翻譯為繁體中文、加上對 3Q 客戶意義的觀點。各則新聞著作權屬原始發佈者，請點上方連結看原文。

2026-05-18 AI 動態：Claude 攻破 Apple 安全防線