Claude Fable 5 與 Mythos 5 發布:程式碼遷移、分子生物學假說與雙軌安全架構
Anthropic · 2026-06-09
Anthropic 於 2026 年 6 月 9 日發布 Claude Fable 5 與 Claude Mythos 5,定位為「最困難的知識工作與程式碼任務」。定價為每百萬 input token $10、output token $50,約為前代 Mythos Preview 的一半。Fable 5 即日起公開可用;Mythos 5 以受限形式開放,面向 Project Glasswing 網路安全合作夥伴與部分生醫研究人員。
核心改動
在軟體工程方面,Stripe 報告 Fable 5 將「數月工程壓縮成數天」;Cognition FrontierCode 評測中取得各 frontier 模型最高分。最具代表性的實際案例是將五千萬行 Ruby 程式碼庫在一天內完成遷移,同樣工作先前需要兩個月以上。長文脈方面,搭配持久記憶時在 Slay the Spire 的表現比 Opus 4.8 提升 3 倍、進入最終章的頻率高出 3 倍。視覺方面,Fable 5 在僅使用視覺介面的條件下通關 Pokémon FireRed。
Mythos 5 在生命科學上表現突出:科學家約 80% 的時間偏好 Mythos 5 提出的分子生物學假說(對照組為 Opus 級別模型);自主訓練出的基因體模型在規模縮小百倍的情況下仍優於 Science 期刊已發表模型;藥物設計特定步驟速度提升約 10 倍。知識工作方面,在 Hebbia Finance Benchmark 的資深推理評測中取得最高分。
安全架構:自動降級與硬限制
Fable 5 的安全機制採用自動分類器,觸發以下條件時自動降回 Claude Opus 4.8 處理:
- 攻擊性網路安全任務、漏洞開發、代理式入侵
- 基因治療設計、危險病毒研究
- 未授權的能力萃取(model distillation)嘗試
Anthropic 報告 95% 以上的 Fable 工作階段完全未觸發降級。外部漏洞賞金計畫在超過 1,000 小時測試中未發現通用越獄手法。Mythos 5 的資料保留政策為 30 天,所有人員存取均留有記錄,到期後刪除,不用於模型訓練或非安全目的。
原始來源:Anthropic
OpenCV 5 在 CVPR 2026 發布:DNN 引擎重寫、80% ONNX 覆蓋率、原生 LLM 推論
OpenCV · 2026-06-08(CVPR 2026,丹佛)
OpenCV 5 於 CVPR 2026 正式發布(pip 版本 2026-06-08),帶來自 4.x 以來最大規模的架構更動。核心變化是 DNN 模組的圖形化重寫,以及對 LLM/VLM 的原生支援。
DNN 引擎重寫:從平面層到型別運算圖
新引擎以帶型別的運算圖表示模型,支援 shape inference、constant folding 與 operator fusion,能對完整計算流程進行整體優化。ONNX operator 覆蓋率從 4.x 的約 22% 跳升至超過 80%,新增包含 MatMul/Attention fusion、Softmax/BatchNorm fusion 及動態 shape operator。CPU 效能實測(對比 ONNX Runtime):
- XFeat:快 31.25%
- YOLOv8n:快 11.5%
- OWLv2:快 36.6%
- BiRefNet:快 32.4%
引擎以 cv::dnn::EngineType 列舉選擇,包含 ENGINE_CLASSIC(4.x 引擎,支援 CUDA/OpenVINO)、ENGINE_NEW(圖形化,CPU only)、ENGINE_AUTO(預設,優先新引擎後回退)及 ENGINE_ORT(內建 ONNX Runtime 包裝)。
原生 LLM 整合與 HAL 2.0
OpenCV 5 首次在函式庫內建 tokenizer 與 KV-cache,支援自回歸解碼,無需外部 runtime。已驗證模型包含 Qwen 2.5(逐 token 與 ONNX Runtime 一致)、Gemma 3、PaliGemma 及 GPT-2/4 系列。
重新設計的 HAL 提供統一介面,供 Intel IPP/IPPICV、Arm KleidiCV(NEON/SVE/SME)、Qualcomm FastCV(Hexagon DSP/NPU)及 RISC-V Vector 插入最佳化核。新增原生資料型別:FP16(cv::hfloat)、BF16(cv::bfloat)、bool、64-bit integer,以及 0D/1D tensor。破壞性變更:Legacy C API 正式棄用;C++17 為最低標準;calib3d 模組拆分為 3d、calib、stereo。
原始來源:OpenCV Blog
LLM 路由器的效能高原:21 種方法的系統性分析
arXiv cs.LG · 2606.07587 · 2026-05-27 提交
Lu 等人系統性評測了 21 種 LLM 路由方法(包括 kNN、learned classifier、pairwise ranking、confidence-based 等)在 5 個基準測試上的表現,發現大多數方法收斂至幾乎相同的準確率區間,且均遠低於 oracle router。論文將此現象命名為「路由器效能高原(routing plateau)」。
可預測性瓶頸
研究找出根本原因:現有路由器學習的是模型整體效能的聚合模式,而非針對個別查詢的特徵信號。這使路由器在簡單查詢上表現良好,但在需要個別判斷的困難查詢上集體失效。路由器掌握的是「模型 A 整體比模型 B 強」的通則,而非「這條特定 query 哪個模型更適合」的個案判斷。
突破高原的三條路徑
作者提出三種可行方向:
- 擴大訓練資料量:更多帶標記的 query-model 配對,增加個別案例信號密度
- 採用更強的 encoder:提升 query 表示品質,擷取更精細的語意特徵
- 端對端微調:讓路由器全部管線對目標任務共同優化,而非各部分獨立訓練
論文共 23 頁、12 張表格與 9 張圖表,是迄今規模最大的 LLM 路由方法橫向比較研究。對於需要在多個 LLM 之間根據成本與效能動態調度的系統,此分析揭示了為何現有方案常遇到效能天花板。
原始來源:arXiv 2606.07587