AI 前沿 2026 年 6 月 22 日

瑞士學術三強聯手打造 Apertus:完全開源的主權 AI 基礎模型

AI 前沿 — 2026-06-22 瑞士學術三強聯手打造 …





AI 前沿 — 2026-06-22

瑞士學術三強聯手打造 Apertus:完全開源的主權 AI 基礎模型

Swiss AI Initiative (EPFL × ETH Zurich × CSCS) · 2026-06-22

由瑞士洛桑聯邦理工學院(EPFL)、蘇黎世聯邦理工學院(ETH Zurich)與瑞士國家超算中心(CSCS)共同主導的 Swiss AI Initiative 於 2026 年 6 月正式對外發布 Apertus 開放基礎模型,提供 8B 與 70B 兩種規格。此模型以「主權 AI」為核心理念,承諾訓練資料、程式碼、模型權重、訓練方法與對齊原則一律完整公開,並可完全復現。

完全開放的定義:不只是開源權重

Apertus 對「開放」的定義遠比一般所謂的「開源模型」更嚴格。訓練資料、程式碼、模型權重、訓練方法與對齊原則全數公開,任何研究機構或企業皆可審查並重現整個訓練流程,而非僅取得預訓練後的靜態檔案。這一立場與部分聲稱「開放」但不公開訓練資料或完整方法論的模型形成明顯對比。

在合規層面,Apertus 以符合 EU AI Act 為設計前提:系統尊重資料擁有者的退出聲明(opt-out)、移除個人識別資訊(PII)、並採取技術措施防止訓練資料被逐字記憶(memorization)。Swisscom 作為策略夥伴,支持該計畫在歐洲監管環境下的商業落地。

千種語言的多語言訓練策略

與多數模型先以英文為主訓練、再透過微調補充其他語言不同,Apertus 從訓練初期即納入超過 1,000 種語言的語料。官方說法是將多語言能力設計為「原生特性」而非事後附加,目標是讓全球各地的使用者能在母語環境中獲得同等品質的模型服務,也呼應主權 AI 的核心訴求——任何國家或社群都不應因語言劣勢而被排除在高品質 AI 之外。

目前 Apertus 官方聲稱在同等參數規模下與市場上主流開源模型具備競爭力,詳細基準測試數據已收錄於 ACL 2026 的技術論文(2026 年 4 月確認接受)。模型規格以 apertus-8bapertus-70b 兩個版本提供下載,遵循完整開放授權。

Apertus Mini:蒸餾與量化的方法論示範

2026 年 6 月隨主模型同步釋出的 Apertus Mini,是一組共 16 個較小型模型的集合,聚焦展示知識蒸餾(distillation)與模型量化(quantization)技術的完整實作路徑。Mini 系列不僅提供更低硬體門檻的部署選項,更被定位為開放式的方法論文件——研究者可從中學習如何從大型基礎模型系統性地衍生高效率的輕量版本。

Swiss AI Initiative 的整體策略是:以學術嚴謹性確保可信度,以完全開放降低壟斷風險,同時透過符合歐盟法規的設計讓商業夥伴得以在法遵框架內直接採用。這套「主權 AI」路線若能在學術社群獲得持續參與,可能成為美國主導的大型封閉模型之外的重要替代路徑。

原始來源:apertvs.ai — Apertus Open Foundation Model


Anthropic 與 Persona 合作推出 Claude 身份驗證機制

Anthropic / support.claude.com · 2026-06-22

Anthropic 於 2026 年 6 月在其支援文件中正式說明 Claude 身份驗證機制的完整流程,透過第三方身份核實服務商 Persona Identities 提供政府核發證件加活體自拍的雙重驗證,整個流程設計在五分鐘內完成。此舉旨在打擊濫用行為、強化使用政策執行,並履行相關法律義務。

驗證流程與可接受的證件類型

使用者需準備一份政府核發的實體附照身份證明文件(護照、駕照或國民身份證均可接受),並以具備鏡頭的裝置拍攝即時自拍照。文件必須為正本、無損毀、字跡清晰,且為政府核發並附有本人照片的版本。系統明確排除影印本、電子版 ID、學生證、員工識別證及臨時紙本證件。

驗證若未能一次通過,使用者可獲得多次重試機會;常見的失敗原因包括光線不足或使用非可接受的文件類型,改善拍攝條件或更換為護照通常可解決問題。若耗盡重試機會,Anthropic 提供支援表單供人工審查,確保邊緣情況有申訴管道。

資料保護架構:Anthropic 是資料控管者,圖片留存於 Persona

在資料隱私架構上,Anthropic 擔任資料控管者(data controller),但驗證過程中拍攝的證件照片與自拍影像實際儲存於 Persona 的系統,Anthropic 本身不留存這些圖像。所有資料在傳輸及靜態儲存期間均加密。Anthropic 明確聲明驗證資料的唯一用途為確認使用者身份及履行法律與安全義務,絕不用於 AI 模型訓練。

帳戶通過驗證後若仍遭停用,可能原因包括違反使用政策、使用者位於不支援的地區、違反服務條款,或被認定為未滿 18 歲。使用者可透過 claude.ai 的申訴管道提交異議。這一機制的推出,標誌著 Anthropic 在平台信任基礎設施上邁向更嚴格的 KYC(了解你的客戶)管理框架。

對開發者與 API 使用者的潛在影響

目前支援頁面說明主要針對 claude.ai 的直接用戶,但驗證機制是否將延伸至 API 操作者(operator)層級,支援文件並未明確說明。就現有內容而言,驗證觸發時機由 Anthropic 自行決定,使用者在平台介面上遭遇特定行為限制時可能才會被提示完成驗證。作為安全與法遵工程師需留意:Persona 整合意味著 Claude 平台已引入外部 IDV(Identity Verification)服務商,若後續有 API 層的身份驗證要求,對企業導入的影響將更為直接。

原始來源:Anthropic Support — Identity verification on Claude


從雜訊中提煉信號:LLM 真正有效的六個落地場景

Aggressively Paraphrasing (個人技術部落格) · 2026-06-21

一篇發表於 2026 年 6 月 21 日的工程師個人文章,作者從長期實作經驗中整理出 LLM 實際有效的使用情境,並提出一個精準的核心框架:LLM 最擅長的是「從雜訊中篩出重要訊號」,而非無差別的通用推理。文章旁及作者對 LLM 經濟與社會衝擊的矛盾情感,但主體是六個具備量化成效的工程應用案例。

核心框架:篩選(sifting)而非生成

作者提出,業界對 LLM 的期待過度集中在內容生成與複雜推理,卻忽略了一個更穩定的價值:在大量非結構化資料中快速定位「值得人類注意」的片段。這個框架的優點是對模型能力要求相對低——作者明確指出「不需要最先進(SotA)的昂貴模型」就能達成良好效果,降低了工程實作的成本門檻。

這一立場與近年部分研究呼應:embedding 加向量搜尋在分類與篩選任務上往往比強制使用 instruction-following 大模型更具成本效益。作者從個人開發者視角出發,選取的案例均以「減少人力花費的時間或注意力」為衡量指標,而非純粹的精準率提升。

六個有量化成效的應用場景

  • 客戶對話分析:透過 embedding 資料庫,從歷史客戶訊息中找出共同痛點,發現前 40% 的高價值客戶反覆提及一個特定的未解決問題。傳統作法依賴人工記憶與手動關聯,難以規模化。
  • API 故障分級(triage):以 agent 架構自動搜尋日誌、源碼與錯誤叢集,將每件事故的調查時間從 15 分鐘以上壓縮至 1–2 分鐘。附帶效益是 agent 的推理過程可讓同事學習排查思路,產生技能轉移效果。
  • 內容精簡(shortening,而非摘要):作者強調精簡與摘要的差異——摘要(summarization)會丟失細節,精簡則保留所有技術細節只刪除贅語,適合在長影片或 Podcast 中快速找到相關片段。
  • 音訊轉文字再分析:標準流程為確認字幕→下載音訊→語音辨識轉錄,再對純文字進行下游分析;是多媒體內容進入文字處理管線的關鍵前置步驟。
  • 招募信件過濾:以 15 分鐘為週期的自動化分類,判斷是否為招募信或正當郵件,大幅降低信箱維護負擔。
  • Instagram 影片索引(概念驗證):組合 OCR 字幕提取、音訊轉錄與物件偵測,搭配 embedding 搜尋,讓使用者可對收藏影片進行語意查詢——目前仍在規劃階段。

技術選型上的務實取向

貫穿全文的工程哲學是:優先使用輕量模型與結構化管線,而非直接調用旗艦模型。作者在 API 故障場景中明確點名,許多任務並不需要最新的高成本模型,embedding 加規則式後處理的組合在準確率與延遲上往往更可預期。這對成本敏感的工程團隊有直接的選型參考價值。

值得留意的是,作者坦承對 LLM 的廣泛經濟與社會衝擊感到憂慮,但刻意將個人工具使用建立在開放權重模型(open-weight models)之上,試圖在使用效益與降低中心化依賴之間取得平衡。這種技術倫理意識與工程實踐並存的敘事,在工程師社群的 LLM 討論中相對罕見,值得關注。

原始來源:Aggressively Paraphrasing — Effective use-cases for LLMs



End of article
0
Would love your thoughts, please comment.x
()
x