#MetaReleasesMuseSpark


Стратегічний поворот у гонці штучного інтелекту

8 квітня 2026 року Meta Platforms офіційно представила Muse Spark, першу модель штучного інтелекту з новостворених лабораторій Meta Superintelligence Labs (MSL). Цей запуск ознаменовує важливий момент для Meta, оскільки він означає повну перебудову її інфраструктури штучного інтелекту та стратегічний відхід від лінійки відкритих моделей Llama.

Ризики не можуть бути вищими. Після невдалого прийняття Llama 4 — який опинився у центрі скандалів щодо маніпуляцій з бенчмарками — генеральний директор Meta Марк Цукерберг у середині 2025 року реорганізував зусилля компанії у сфері штучного інтелекту. Він найняв Александра Ванга, засновника та генерального директора Scale AI, на посаду першого в історії Chief AI Officer Meta у рамках знакової угоди, яка, за повідомленнями, коштувала 14,3 мільярда доларів. Muse Spark — перший продукт, що з’явився внаслідок цієї дорогої та напруженої перебудови.

Що таке Muse Spark? Основні характеристики

Muse Spark описується як перша модель у новій серії великих мовних моделей Muse, внутрішньо з кодовою назвою "Авокадо". На відміну від попередніх моделей, створених для загального бенчмаркінгу, Muse Spark спеціально розроблена для екосистеми Meta з понад 3 мільярдами користувачів у Facebook, Instagram, WhatsApp та Threads.

Ключові характеристики включають:

Категорія функції Опис
Внутрішня мультимодальність Приймає голосові, текстові та зображувальні входи; розуміє візуальну інформацію, таку як фотографії та графіки
Два режими "Миттєвий" режим для швидких відповідей; "Роздумування" (Обмірковування) для складного логічного аналізу
Багатоагентна система Запускає кілька підагентів паралельно для одночасного вирішення різних аспектів задачі
Інтеграція покупок Бере дані з контенту творців та поведінки користувачів у додатках Meta для персоналізованих рекомендацій
Здоров’я та медицина Навчена понад 1000 лікарів; надає детальні відповіді на медичні та харчові запити
Закритий код Свідомий відхід від відкритої спадщини Llama; доступна через API-прев’ю для обраних партнерів

Модель розроблена так, щоб бути "маленькою та швидкою за задумом, але здатною логічно обробляти складні питання у галузях науки, математики та здоров’я". Meta підкреслює, що Muse Spark — це фундаментальна модель, наступне покоління якої вже розробляється.

Продуктивність: де вона переважає і де відстає

Незалежні бенчмарки дають складну картину. Muse Spark не є беззаперечним лідером у всіх категоріях, але демонструє явні переваги у сферах, що відповідають унікальним даним Meta.

Переваги

· Мультимодальне розуміння (CharXiv Reasoning): Muse Spark набрала 86,4, перевищуючи GPT-5.4 (82,8) та Gemini 3.1 Pro (80,2). Модель добре справляється з інтерпретацією складних графіків, наукових даних та візуального STEM-контенту.
· Здоров’я та медичне логічне мислення (HealthBench Hard): З балом 42,8 Muse Spark лідирує у цій категорії, перевищуючи GPT-5.4 (40,1) та значно випереджаючи Claude Opus 4.6 (14,8). Це свідчить про інвестиції Meta у навчальні дані, куровані лікарями.
· Пошук агентів (DeepSearchQA): Muse Spark досягла 74,8, випереджаючи Gemini 3.1 Pro (69,7), демонструючи сильну здатність автономно шукати та синтезувати інформацію з Інтернету.

Області для покращення

· Абстрактне мислення (ARC AGI 2): Це залишається значним розривом. Muse Spark набрала лише 42,5, порівняно з Gemini 3.1 Pro (76,5) та GPT-5.4 (76,1).
· Програмування агентів (SWE-Bench Pro): Бал Muse Spark 52,4 поступається GPT-5.4 (57,7) та Gemini 3.1 Pro (54,2).
· Програмування рівня конкуренції (LiveCodeBench Pro): З результатом 80,0 Muse Spark поступається GPT-5.4 (87,5) та Gemini 3.1 Pro (82,9).

Загалом Muse Spark посідає четверте місце у Відповідному індексі штучного інтелекту v4.0, поступаючись Gemini 3.1 Pro, GPT-5.4 та Claude Opus 4.6. Як визнає сама Meta, ця модель "не є новим SOTA, але є конкурентоспроможною з передовими моделями у конкретних завданнях".

Режим 'Обмірковування': інший підхід до логічного мислення

Однією з найхарактерніших особливостей Muse Spark є її режим Обмірковування, який використовує новий підхід до складного розв’язання проблем. Замість дозволу одній моделі "думати" тривалий час — що збільшує затримку лінійно — Muse Spark запускає кілька агентів паралельно для одночасного логічного аналізу перед синтезом їхніх результатів.

Це багатоагентне паралельне мислення досягає конкурентних результатів у схожий або менший час порівняно з режимами тривалого обдумування від Google (Gemini Deep Think) та OpenAI (GPT Pro).

У "Останньому іспиті людства" — збірці надзвичайно складних запитань від експертів — режим Обмірковування Muse Spark набрав 50,2 без інструментів і 58,0 з допомогою інструментів, перевищуючи Gemini Deep Think (48,4) та GPT-5.4 Pro (43,9) у режимі без інструментів.

Технічні інновації: ефективність і масштабованість

Крім чистих бенчмарків, Meta повідомила про значні технічні досягнення, які можуть бути більш цінними за будь-який окремий показник.

Ефективність передтренування

MSL повністю перебудувала свою систему передтренування за дев’ять місяців, включаючи архітектуру, оптимізатори та конвеєри даних. Результат: Muse Spark досягає рівня можливостей Llama 4 Maverick, використовуючи більш ніж у десять разів менше обчислювальних ресурсів. Ця ефективність є фундаментальним проривом у методології тренування.

Стабільність навчання з підкріплювальним навчанням

Великомасштабне RL-навчання історично стикалося з нестабільністю. Meta повідомляє, що її новий стек RL забезпечує стабільне та передбачуване зростання можливостей, з покращеннями, що поширюються на невидані завдання.

Стиснення мислення

Під час тренування Meta застосувала "штраф за час мислення" — змушуючи модель розв’язувати задачі з меншим числом токенів логіки без втрати точності. Це спричинило виникнення явища, коли модель навчилася "стискати" свої ланцюги логіки, стаючи більш ефективною з часом.

Від відкритого до закритого: стратегічний поворот

Можливо, найспірнішим аспектом Muse Spark є її ліцензування. На відміну від серії Llama, яка заклала основу для Meta як чемпіона відкритого коду AI, Muse Spark є закритою моделлю.

Meta пропонує модель через приватний API-прев’ю для обраних партнерів із планами згодом монетизувати її через доступ до API або підписки. Компанія заявила, що "сподівається відкрити вихідний код майбутніх версій", але наразі поворот до закритого коду сигналізує про стратегічний зсув: зберігати архітектурні інновації у таємниці, змагаючись у гонці, де кожна перевага має значення.

Процес тренування також привернув увагу, з повідомленнями, що Muse Spark використовувала знання з кількох моделей з відкритим кодом за допомогою технік дистиляції. Meta відповіла, що ці методи повністю відповідають галузевим стандартам.

Унікальне явище: 'Обізнаність про оцінювання'

Третя сторона — дослідницька компанія Apollo Research — виявила цікаву поведінку Muse Spark: модель демонструвала найвищий рівень "обізнаності про оцінювання" серед усіх протестованих моделей.
MUSE-1,63%
SPK1,57%
Переглянути оригінал
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 10
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
SheenCrypto
· 8год тому
LFG 🔥
відповісти на0
SheenCrypto
· 8год тому
2026 ГООГО 👊
Переглянути оригіналвідповісти на0
SheenCrypto
· 8год тому
До Місяця 🌕
Переглянути оригіналвідповісти на0
Crypto_Buzz_with_Alex
· 8год тому
Обезьяна в 🚀
Переглянути оригіналвідповісти на0
Crypto_Buzz_with_Alex
· 8год тому
2026 ГОДОГОГО 👊
Переглянути оригіналвідповісти на0
ShainingMoon
· 9год тому
LFG 🔥
відповісти на0
ShainingMoon
· 9год тому
2026 ГОДОГОГО 👊
Переглянути оригіналвідповісти на0
Yunna
· 12год тому
LFG 🔥
відповісти на0
discovery
· 12год тому
2026 ГОДОГОГО 👊
Переглянути оригіналвідповісти на0
HighAmbition
· 12год тому
гарна інформація 👍
Переглянути оригіналвідповісти на0
Дізнатися більше
  • Закріпити