2026-06-10 — Claude Fable 5 / Mythos 5 發布、OpenCV 5 DNN 重寫、LLM 路由器效能高原

Claude Fable 5 與 Mythos 5 發布：程式碼遷移、分子生物學假說與雙軌安全架構

Anthropic · 2026-06-09

Anthropic 於 2026 年 6 月 9 日發布 Claude Fable 5 與 Claude Mythos 5，定位為「最困難的知識工作與程式碼任務」。定價為每百萬 input token $10、output token $50，約為前代 Mythos Preview 的一半。Fable 5 即日起公開可用；Mythos 5 以受限形式開放，面向 Project Glasswing 網路安全合作夥伴與部分生醫研究人員。

核心改動

在軟體工程方面，Stripe 報告 Fable 5 將「數月工程壓縮成數天」；Cognition FrontierCode 評測中取得各 frontier 模型最高分。最具代表性的實際案例是將五千萬行 Ruby 程式碼庫在一天內完成遷移，同樣工作先前需要兩個月以上。長文脈方面，搭配持久記憶時在 Slay the Spire 的表現比 Opus 4.8 提升 3 倍、進入最終章的頻率高出 3 倍。視覺方面，Fable 5 在僅使用視覺介面的條件下通關 Pokémon FireRed。

Mythos 5 在生命科學上表現突出：科學家約 80% 的時間偏好 Mythos 5 提出的分子生物學假說（對照組為 Opus 級別模型）；自主訓練出的基因體模型在規模縮小百倍的情況下仍優於 Science 期刊已發表模型；藥物設計特定步驟速度提升約 10 倍。知識工作方面，在 Hebbia Finance Benchmark 的資深推理評測中取得最高分。

安全架構：自動降級與硬限制

Fable 5 的安全機制採用自動分類器，觸發以下條件時自動降回 Claude Opus 4.8 處理：

攻擊性網路安全任務、漏洞開發、代理式入侵
基因治療設計、危險病毒研究
未授權的能力萃取（model distillation）嘗試

Anthropic 報告 95% 以上的 Fable 工作階段完全未觸發降級。外部漏洞賞金計畫在超過 1,000 小時測試中未發現通用越獄手法。Mythos 5 的資料保留政策為 30 天，所有人員存取均留有記錄，到期後刪除，不用於模型訓練或非安全目的。

原始來源：Anthropic

OpenCV 5 在 CVPR 2026 發布：DNN 引擎重寫、80% ONNX 覆蓋率、原生 LLM 推論

OpenCV · 2026-06-08（CVPR 2026，丹佛）

OpenCV 5 於 CVPR 2026 正式發布（pip 版本 2026-06-08），帶來自 4.x 以來最大規模的架構更動。核心變化是 DNN 模組的圖形化重寫，以及對 LLM/VLM 的原生支援。

DNN 引擎重寫：從平面層到型別運算圖

新引擎以帶型別的運算圖表示模型，支援 shape inference、constant folding 與 operator fusion，能對完整計算流程進行整體優化。ONNX operator 覆蓋率從 4.x 的約 22% 跳升至超過 80%，新增包含 MatMul/Attention fusion、Softmax/BatchNorm fusion 及動態 shape operator。CPU 效能實測（對比 ONNX Runtime）：

XFeat：快 31.25%
YOLOv8n：快 11.5%
OWLv2：快 36.6%
BiRefNet：快 32.4%

引擎以 cv::dnn::EngineType 列舉選擇，包含 ENGINE_CLASSIC（4.x 引擎，支援 CUDA/OpenVINO）、ENGINE_NEW（圖形化，CPU only）、ENGINE_AUTO（預設，優先新引擎後回退）及 ENGINE_ORT（內建 ONNX Runtime 包裝）。

原生 LLM 整合與 HAL 2.0

OpenCV 5 首次在函式庫內建 tokenizer 與 KV-cache，支援自回歸解碼，無需外部 runtime。已驗證模型包含 Qwen 2.5（逐 token 與 ONNX Runtime 一致）、Gemma 3、PaliGemma 及 GPT-2/4 系列。

重新設計的 HAL 提供統一介面，供 Intel IPP/IPPICV、Arm KleidiCV（NEON/SVE/SME）、Qualcomm FastCV（Hexagon DSP/NPU）及 RISC-V Vector 插入最佳化核。新增原生資料型別：FP16（cv::hfloat）、BF16（cv::bfloat）、bool、64-bit integer，以及 0D/1D tensor。破壞性變更：Legacy C API 正式棄用；C++17 為最低標準；calib3d 模組拆分為 3d、calib、stereo。

原始來源：OpenCV Blog

LLM 路由器的效能高原：21 種方法的系統性分析

arXiv cs.LG · 2606.07587 · 2026-05-27 提交

Lu 等人系統性評測了 21 種 LLM 路由方法（包括 kNN、learned classifier、pairwise ranking、confidence-based 等）在 5 個基準測試上的表現，發現大多數方法收斂至幾乎相同的準確率區間，且均遠低於 oracle router。論文將此現象命名為「路由器效能高原（routing plateau）」。

可預測性瓶頸

研究找出根本原因：現有路由器學習的是模型整體效能的聚合模式，而非針對個別查詢的特徵信號。這使路由器在簡單查詢上表現良好，但在需要個別判斷的困難查詢上集體失效。路由器掌握的是「模型 A 整體比模型 B 強」的通則，而非「這條特定 query 哪個模型更適合」的個案判斷。

突破高原的三條路徑

作者提出三種可行方向：

擴大訓練資料量：更多帶標記的 query-model 配對，增加個別案例信號密度
採用更強的 encoder：提升 query 表示品質，擷取更精細的語意特徵
端對端微調：讓路由器全部管線對目標任務共同優化，而非各部分獨立訓練

論文共 23 頁、12 張表格與 9 張圖表，是迄今規模最大的 LLM 路由方法橫向比較研究。對於需要在多個 LLM 之間根據成本與效能動態調度的系統，此分析揭示了為何現有方案常遇到效能天花板。

原始來源：arXiv 2606.07587

End of article