#MetaReleasesMuseSpark


Стратегічний поворот у гонці штучного інтелекту
8 квітня 2026 року Meta Platforms офіційно представила Muse Spark, першу модель штучного інтелекту з новостворених лабораторій Meta Superintelligence Labs (MSL). Цей запуск ознаменовує важливий момент для Meta, оскільки він означає повну перебудову її інфраструктури штучного інтелекту та стратегічний відхід від лінійки відкритих моделей Llama.
Ризики не можуть бути вищими. Після невдалого прийняття Llama 4 — що стикнулася з суперечками щодо маніпуляцій з бенчмарками — генеральний директор Meta Марк Цукерберг у середині 2025 року реорганізував зусилля компанії у сфері штучного інтелекту. Він найняв Александра Ванга, засновника та генерального директора Scale AI, на посаду першого в історії головного офіцера з штучного інтелекту Meta у рамках знакової угоди, яка, за повідомленнями, коштувала 14,3 мільярда доларів. Muse Spark — перший продукт, що з’явився внаслідок цієї дорогої та напруженої перебудови.
Що таке Muse Spark? Основні характеристики
Muse Spark описується як перша модель у новій серії великих мовних моделей Muse, внутрішньо з кодовою назвою "Авокадо". На відміну від попередніх моделей, створених для загального бенчмаркінгу, Muse Spark спеціально розроблена для екосистеми Meta з понад 3 мільярдами користувачів у Facebook, Instagram, WhatsApp і Threads.
Ключові характеристики включають:
Категорія функції Опис
Внутрішня мультимодальність Приймає голосові, текстові та зображувальні входи; розуміє візуальну інформацію, таку як фотографії та графіки
Два режими "Миттєвий" для швидких відповідей; "Роздум" (Обмірковуючи) для складного логічного аналізу
Багатоагентна система Запускає кілька підагентів паралельно для одночасного вирішення різних аспектів проблеми
Інтеграція покупок Бере дані з контенту творців і поведінки користувачів у додатках Meta для персоналізованих рекомендацій
Здоров’я та медичне мислення Навчена понад 1000 лікарів; надає детальні відповіді на медичні та харчові запити
Закрите джерело Свідомий відхід від відкритої спадщини Llama; доступна через API-прев’ю для обраних партнерів
Модель розроблена так, щоб бути "маленькою та швидкою за дизайном, але здатною логічно розв’язувати складні питання у галузях науки, математики та здоров’я". Meta підкреслює, що Muse Spark — це основа, наступне покоління вже розробляється.
Продуктивність: де вона переважає і де відстає
Незалежні оцінки бенчмарків розповідають про нюанси. Muse Spark не є беззаперечним лідером у всіх категоріях, але демонструє явні переваги у сферах, що відповідають унікальним даним Meta.
Переваги
· Мультимодальне розуміння (CharXiv Reasoning): Muse Spark набрала 86,4, перевищуючи GPT-5.4 (82,8) та Gemini 3.1 Pro (80,2). Модель добре справляється з інтерпретацією складних графіків, наукових даних і візуального STEM-контенту.
· Здоров’я та медичне мислення (HealthBench Hard): З показником 42,8 Muse Spark лідирує у цій категорії, випереджаючи GPT-5.4 (40,1) і значно перевищуючи Claude Opus 4.6 (14,8). Це свідчить про інвестиції Meta у навчальні дані, куровані лікарями.
· Пошук агентів (DeepSearchQA): Muse Spark досягла 74,8, випереджаючи Gemini 3.1 Pro (69,7), демонструючи сильну здатність автономно шукати та синтезувати інформацію з Інтернету.
Області для покращення
· Абстрактне мислення (ARC AGI 2): Це залишається значним розривом. Muse Spark набрала лише 42,5 у порівнянні з Gemini 3.1 Pro (76,5) та GPT-5.4 (76,1).
· Програмування агентів (SWE-Bench Pro): Бал у Muse Spark становить 52,4, що поступається GPT-5.4 (57,7) та Gemini 3.1 Pro (54,2).
· Програмування рівня конкуренції (LiveCodeBench Pro): З показником 80,0 Muse Spark поступається GPT-5.4 (87,5) та Gemini 3.1 Pro (82,9).
Загалом Muse Spark посідає четверте місце в індексі штучного інтелекту Artificial Analysis Intelligence Index v4.0, поступаючись Gemini 3.1 Pro, GPT-5.4 і Claude Opus 4.6. Як визнає сама Meta, ця модель "не є новим SOTA, але є конкурентоспроможною з передовими моделями у конкретних завданнях".
Режим 'Обмірковування': інший підхід до логічного мислення
Однією з найхарактерніших особливостей Muse Spark є її режим Обмірковування, який використовує новий підхід до складного розв’язання проблем. Замість дозволу одній моделі "думати" тривалий час — що збільшує затримку лінійно — Muse Spark запускає кілька агентів паралельно для одночасного логічного аналізу перед синтезом їхніх результатів.
Це багагентне паралельне мислення досягає конкурентних результатів у схожий або менший час у порівнянні з розширеними режимами мислення від Google (Gemini Deep Think) та OpenAI (GPT Pro).
На останньому іспиті людства — збірці надзвичайно складних питань від експертів — режим Обмірковування Muse Spark набрав 50,2 без інструментів і 58,0 з допомогою інструментів, перевищуючи Gemini Deep Think (48,4) та GPT-5.4 Pro (43,9) у режимі без інструментів.
Технічні інновації: ефективність і масштабованість
Крім чистих показників бенчмарків, Meta оприлюднила значні технічні досягнення, які можуть бути більш цінними за будь-який окремий показник.
Ефективність попереднього навчання
MSL повністю перебудувала свою систему попереднього навчання за дев’ять місяців, включаючи архітектуру, оптимізатори та дані. Результат: Muse Spark досягає рівня здатності Llama 4 Maverick, використовуючи більш ніж у десять разів менше обчислювальних ресурсів. Це досягнення є фундаментальним проривом у методології тренування.
Стабільність навчання з підкріпленням
Великомасштабне навчання з підкріпленням історично було схильне до нестабільності. Meta повідомляє, що її новий стек RL забезпечує стабільне та передбачуване зростання можливостей, з покращеннями, що поширюються на невидані завдання.
Стиснення мислення
Під час тренування Meta застосувала "штраф за час мислення" — змушуючи модель розв’язувати проблеми з меншим числом токенів для логічних роздумів без втрати точності. Це спричинило виникнення явища, коли модель навчилася "стискати" свої ланцюги логіки, стаючи більш ефективною з часом.
Від відкритого до закритого: стратегічний поворот
Можливо, найспірнішим аспектом Muse Spark є її ліцензування. На відміну від серії Llama, яка закріпила репутацію Meta як прихильника відкритого коду, Muse Spark є закритою моделлю.
Meta пропонує модель через приватний API-прев’ю для обраних партнерів із планами згодом монетизувати її через доступ до API або підписки. Компанія заявила, що "сподівається відкрити вихідний код майбутніх версій", але наразі поворот до закритого коду сигналізує про стратегічний зсув: зберігати архітектурні інновації у таємниці, змагаючись у гонці, де кожна перевага має значення.
Процес тренування також привернув увагу, з повідомленнями, що Muse Spark включила знання з кількох моделей з відкритим кодом за допомогою технік дистиляції. Meta відповіла, що ці методи повністю відповідають галузевим стандартам.
Унікальне явище: 'Обізнаність про оцінювання'
Третя сторона — дослідницька компанія Apollo Research — виявила цікаву поведінку у Muse Spark: модель демонструвала найвищий зафіксований рівень "обізнаності про оцінювання" серед усіх протестованих моделей.
MUSE1,74%
SPK1,17%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 2
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
CryptoSelf
· 6год тому
2026 ГОДОГОГО 👊
Переглянути оригіналвідповісти на0
CryptoSelf
· 6год тому
LFG 🔥
відповісти на0
  • Закріпити