Rakuten випустив модель Rakuten AI 3.0, файли конфігурації показують, що базова архітектура — DeepSeek V3

Gate News повідомляє, 17 березня компанія Rakuten Group оголосила про випуск Rakuten AI 3.0 під назвою «Найпотужніша високопродуктивна модель штучного інтелекту в Японії», яка є відкритим програмним забезпеченням за ліцензією Apache 2.0. Ця модель побудована на архітектурі MoE (змішаний експерт), має 671 мільярд параметрів, активується 37 мільярдами під час кожного висновку, з контекстним вікном 128K, оптимізована для японської мови і перевершує GPT-4o у кількох японських бенчмарках. Модель є результатом спільного проекту GENIAC, ініційованого Міністерством економіки, торгівлі та промисловості Японії та Агентством розвитку нових енергетичних технологій (NEDO), з частковим фінансуванням обчислювальних ресурсів уряду Японії. У своєму оголошенні Rakuten описала базову модель як «максимально використовуючи досягнення відкритої спільноти», не назвавши конкретну модель. Спільнота швидко перевірила файли моделі на HuggingFace і виявила, що у файлі config.json чітко вказано model_type: deepseek_v3 та architectures: DeepseekV3ForCausalLM, що знову підтверджує, що ця модель є модифікацією DeepSeek V3, доопрацьованою на основі японських даних.

Переглянути оригінал
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів