Gate News 消息,3 月 17 日,乐天集团今日以「日本最大高性能 AI 模型」为名发布 Rakuten AI 3.0,以 Apache 2.0 协议免费开源。该模型为 MoE(混合专家)架构,总参数 671B,每次推理激活 37B,上下文窗口 128K,针对日语优化,在多项日语基准测试中超越 GPT-4o。该模型系日本经济产业省与新能源产业技术综合开发机构(NEDO)联合推进的 GENIAC 项目成果,日本政府为其提供了部分训练算力资助。乐天在公告中以「充分利用开源社区最优成果」描述基础模型来源,未点名具体模型。社区随即查阅 HuggingFace 上发布的模型文件,发现 config.json 中明确写入 model_type: deepseek_v3 与 architectures: DeepseekV3ForCausalLM,总参数 671B、激活 37B、上下文 128K 亦与 DeepSeek V3 完全一致,表明该模型系在 DeepSeek V3 基础上经日语数据微调而来。