乐天发布 Rakuten AI 3.0 模型，配置文件显示底层架构为 DeepSeek V3

GateNews

2026-03-17 08:53:22

Gate News 消息，3 月 17 日，乐天集团今日以「日本最大高性能 AI 模型」为名发布 Rakuten AI 3.0，以 Apache 2.0 协议免费开源。该模型为 MoE（混合专家）架构，总参数 671B，每次推理激活 37B，上下文窗口 128K，针对日语优化，在多项日语基准测试中超越 GPT-4o。该模型系日本经济产业省与新能源产业技术综合开发机构（NEDO）联合推进的 GENIAC 项目成果，日本政府为其提供了部分训练算力资助。乐天在公告中以「充分利用开源社区最优成果」描述基础模型来源，未点名具体模型。社区随即查阅 HuggingFace 上发布的模型文件，发现 config.json 中明确写入 model_type: deepseek_v3 与 architectures: DeepseekV3ForCausalLM，总参数 671B、激活 37B、上下文 128K 亦与 DeepSeek V3 完全一致，表明该模型系在 DeepSeek V3 基础上经日语数据微调而来。

免责声明：本页面信息可能来自第三方，不代表 Gate 的观点或意见。页面显示的内容仅供参考，不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证，对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为，价格波动剧烈，您可能损失全部投资本金。请充分了解相关风险，并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明。

0/400

暂无评论