阿里巴巴的 Qwen 開源 Qwen-Scope 可解釋性模組,於 4 月 30 日涵蓋 7 個模型

根據 PANews,4 月 30 日,阿里巴巴的 Qwen 宣布開源 Qwen-Scope,這是一個可解釋性模組,已在 Qwen3 與 Qwen3.5 系列模型上進行訓練。該釋出涵蓋 7 個大型語言模型,包含密集式以及混合專家(mixture-of-experts)變體,並提供 14 組稀疏自編碼器(sparse autoencoder)權重。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

NVIDIA 發布 Cosmos-Reason2-32B 旗艦模型權重,並將上下文視窗擴展至 256K 個 Tokens

根據 Beating,NVIDIA 已發布 Cosmos-Reason2-32B 的權重,這是其物理 AI 推理視覺-語言模型(VLM)的旗艦版本,旨在協助機器人與自動駕駛系統理解空間、時間與物理原理。這款 320 億參數的模型,

GateNews2分鐘前

OpenAI 揭 Codex 為何禁談「哥布林」:書呆子人格獎勵失控

OpenAI 在官方部落格說明 Codex 禁談哥布林等生物,源於書呆子人格訓練中的獎勵訊號偏好生物比喻,造成跨人格污染與 RLHF 誤導。事件由 Barron Roth 爆出系統指令後,OpenAI 採取短期硬編碼與長期清除獎勵信號兩策略,警示獎勵設計的脆弱性,後訓練審計需更精細。

鏈新聞abmedia46分鐘前

Nvidia B300 AI 伺服器在供應緊縮下於中國達到 100 萬美元

根據路透社報導,輝達的 B300 AI 伺服器目前在中國的售價約為 700 萬人民幣(100 萬美元),原因是打擊走私網路的行動推動,以及當地科技公司持續需求。該價格已從 2025 年底約 400 萬人民幣(585,000 美元)大幅

GateNews1小時前

LG CNS 第一季營業利潤因 AI 與雲端成長上升 19%

根據《朝鮮日報》,LG CNS 於 4 月 30 日表示,第一季度營業利潤年增 19.4% 至 942 億韓元(64.1 百萬美元),受惠於 AI 與雲端需求。營收成長 8.6% 至 1.3 兆韓元(894 百萬美元)。 該公司的 AI 與雲端部門產生了 765.4 billi

GateNews2小時前

OpenAI 推 GPT-5.5-Cyber:對戰 Anthropic Mythos

OpenAI 公告推出 GPT-5.5-Cyber,專為網安設計,將在「未來幾天內」以政府協作的可信存取機制部署給關鍵防禦單位,非開放銷售。與 Anthropic Mythos 的開放路徑形成對照,白宮反對擴至70家。Preparedness Framework 評為 High(未到 critical),同時加強資安防護。後續觀察部署名單、CISA 可能入列與雙方資安標準分野。

鏈新聞abmedia3小時前

施耐德電氣 2025 年 Q1 營收達到 98 億歐元,受 AI 資料中心需求推動成長 11.2%

根據路透社,施耐德電氣(Schneider Electric)在 4 月 30 日公布第一季營收為 98 億歐元(114 億美元),隨著 AI 資料中心需求推升,旗下有機成長提升至 11.2%。這家法國電力與散熱設備供應商表示,該結果略高於市場一致預期,並且

GateNews3小時前
留言
0/400
暫無留言