阿里巴巴在 4 月 30 日开源 Qwen-Scope 可解释性模块,覆盖 7 个模型

据 PANews 报道,4 月 30 日,阿里巴巴的 Qwen 宣布开源 Qwen-Scope,这是一个在 Qwen3 和 Qwen3.5 系列模型上训练的可解释性模块。该发布覆盖 7 个大型语言模型,包含稠密与混合专家(MoE)变体,并提供 14 组稀疏自动编码器权重。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

英伟达发布 Cosmos-Reason2-32B 旗舰模型权重,并将上下文窗口扩展至 256K 个 Token

据 Beating 称,NVIDIA 已发布 Cosmos-Reason2-32B 的权重,这是其物理 AI 推理视觉语言模型(VLM)的旗舰版本,旨在帮助机器人和自动驾驶系统理解空间、时间和物理原理。该 320 亿参数模型,

GateNews2 分钟前

OpenAI 揭露 Codex 为何禁止谈论“哥布林”:书呆子人格奖励失控

OpenAI 在官方博客中说明 Codex 禁谈“哥布林”等生物,源于书呆子人格训练中的奖励信号偏好生物隐喻,导致跨人格污染与 RLHF 误导。事件由 Barron Roth 爆出系统指令后,OpenAI 采取短期硬编码与长期清除奖励信号两种策略,警示奖励设计的脆弱性,后续训练审计需更精细。

鏈新聞abmedia46 分钟前

英伟达 B300 AI 服务器在供应紧张之际于中国创下 100 万美元

根据路透社,英伟达的 B300 AI 服务器现在在中国的售价约为 700 万元人民币(约 100 万美元),原因是打击走私网络的行动以及本地科技公司的持续需求。该价格已从 2025 年晚些时候约 400 万元人民币(585,000 美元)大幅上涨,显著

GateNews1小时前

LG CNS 第一季度经营利润因 AI 和云增长上涨 19%

据朝鲜日报报道,LG CNS 于 4 月 30 日表示,第一季度营业利润同比增长 19.4% 至 942 亿韩元(6410 万美元),由 AI 和云需求带动。收入增长 8.6% 至 1.3 万亿韩元(8.94 亿美元)。 该公司 AI 和云业务部门产生了 765.40 亿韩元

GateNews2小时前

OpenAI 发布 GPT-5.5-Cyber:对战 Anthropic Mythos

OpenAI 公告推出 GPT-5.5-Cyber,專为網安设计,將在「未来幾天內」以政府協作的可信存取机制部署給关鍵防禦單位,非开放销售。与 Anthropic Mythos 的开放路徑形成对照,白宮反对擴至70家。Preparedness Framework 評为 High(未到 critical),同时加強资安防護。后续觀察部署名單、CISA 可能入列与雙方资安標準分野。

鏈新聞abmedia3小时前

施耐德电气 Q1 营收达 98 亿欧元,因 AI 数据中心需求增长 11.2%

据路透社报道,Schneider Electric 于 4 月 30 日公布第一季度营收 98 亿欧元(114亿美元),得益于 AI 数据中心需求,有机增长提升至 11.2%。这家法国电力与制冷设备供应商表示,该结果略高于一致预期,并且

GateNews3小时前
评论
0/400
暂无评论