Google Gemini 3 Deep Think Велике оновлення: здатність до логічних висновків перевищує Opus 4.6, GPT-5.2, прагне стати «найбільш дослідницьким AI»

BTC-4,98%

Google випустила значне оновлення Gemini 3 Deep Think, яке у тесті ARC-AGI-2 показало результат 84,6%, суттєво перевищивши Claude Opus 4.6 (68,8%) та GPT-5.2 (52,9%), одночасно досягнувши рівня «легендарного майстра» у Codeforces.
(Попередній огляд: З’явилася модель ChatGPT для навчання: західний закат або нова ера освіти?)
(Додатковий контекст: Google офіційно презентувала «Gemini 3»! Що робить цю модель найрозумнішою у світі?)

Зміст статті

  • Не лише тестування, а й виявлення людських помилок
  • Зміни у ринкових долях
  • Вплив на криптоіндустрію
  • Науковий етап перемоги тільки починається

13-го числа Google оголосила про значне оновлення Gemini 3 Deep Think. У тесті ARC-AGI-2, спеціально розробленому для перевірки здатності моделей логічно мислити без заздалегідь заданих правил, Gemini 3 Deep Think набрав 84,6%.

Для порівняння, Claude Opus 4.6 (у режимі Thinking Max) отримав 68,8%, GPT-5.2 (у режимі Thinking xhigh) — 52,9%, а середня оцінка людських тестувальників становить близько 60%.

Ще більш вражаюче, що на базовій версії ARC-AGI-1 Deep Think показав результат 96%, фактично досягши межі тесту, який раніше вважався одним із найскладніших для штучного інтелекту.

Зараз Deep Think доступний підписникам Google AI Ultra, а API — для раннього доступу підприємствам.

Не лише тестування, а й виявлення людських помилок

Крім результатів, у повідомленні Google згадано один цікавий випадок: Deep Think під час рецензування математичної статті, що пройшла незалежне рецензування, виявив логічну помилку, яку раніше не помітили всі рецензенти. Статтю підтвердили математики з Університету Рутгерса.

Цей випадок важливий тим, що він демонструє здатність моделі працювати не лише у стандартних тестах, а й у реальних наукових сценаріях. Рецензування — це ключовий механізм контролю якості в науці, і якщо AI може стабільно допомагати у цьому процесі, це суттєво прискорить наукові дослідження, перевищуючи будь-які результати тестів.

Deep Think також досягнув рівня золотої медалі на Міжнародній фізичній олімпіаді 2025 року та Міжнародній хімічній олімпіаді, а у рейтингу Elo на Codeforces має 3455 балів, що відповідає рівню «легендарного майстра», і лише кілька людських програмістів у світі досягають такого рівня.

Ще один рекорд — у «останньому іспиті людства» (Humanity’s Last Exam), створеному експертами з різних галузей, щоб ускладнити завдання для AI, Deep Think отримав 48,4% без використання інструментів.

Зміни у ринкових долях

Конкуренція між трьома гігантами AI змінює розподіл ринку. Частка ChatGPT з пікових 87% знизилася до приблизно 68%, тоді як Gemini стрімко зросла з менш ніж 5% до понад 18%, а Claude від Anthropic поступово захоплює корпоративний сегмент.

Унікальна перевага Google — це можливість поширення. Gemini інтегрована у Android, Chrome, Google Workspace та пошукову систему, що дозволяє навіть при рівності можливостей з конкурентами залучати користувачів через канали.

Однак перевага у поширенні — двосічний меч. Якщо досвід користування Gemini буде незадовільним, вона може швидше за будь-який інший продукт втратити довіру користувачів, оскільки вони «пасивно контактують», а не «свідомо обирають». Користувачі OpenAI платять за послуги, тому мають вищу толерантність і лояльність.

Вплив на криптоіндустрію

Кожне оновлення у гонці озброєнь AI підвищує попит на обчислювальні ресурси. Вартість навчання передових моделей зросла з сотень мільйонів доларів у 2024 році до кількох мільярдів у 2026-му. Це безпосередньо впливає на два напрямки.

Перший — трансформація майнерів біткоїна. Коли прибутковість майнінгу знижується (згідно з оцінками JPMorgan, вартість виробництва BTC знизилася до 77 тисяч доларів, тоді як ціна коливається біля 66 тисяч), майнери з великими обчислювальними потужностями швидко переключаються на AI-обчислювальні послуги.

Замість «виходу з ринку» вони «перекваліфікуються», перетворюючись із майнерів біткоїна на постачальників AI-обчислень за контрактами.

Другий — нарратив навколо AI-токенів. Коли Google, OpenAI або Anthropic випускають значущі оновлення, на блокчейні з’являються короткострокові спекуляції навколо AI-активів (децентралізованих протоколів обчислень).

Однак фундаментальні проблеми цих токенів залишаються: децентралізовані обчислення ще далекі від потреб корпоративного рівня для тренування AI. Нарратив може швидко розвиватися, але інфраструктура — ні.

Науковий етап перемоги тільки починається

Оновлення Deep Think повернуло Google у лідери AI-гонки, принаймні у сфері логіки та науки. Але якщо уважно прочитати заяву Google, помітно тонкий зсув у позиціонуванні: тепер вони не акцентують увагу на «найрозумнішому універсальному AI», а знову і знову підкреслюють «створений для науки».

Коли стандарти універсального AI стають все більш насиченими та важко відрізнити один від одного, цінність «мій AI допомагає у наукових дослідженнях» стає переконливішою за «мій AI має найвищі бали у тестах». Якщо Deep Think зможе стабільно підтримувати рецензентів, прискорювати відкриття ліків або знаходити людські прогалини у фізичних моделях, це матиме значення більше за будь-який рейтинг.

Проблема у тому, що перехід від «може набрати високий бал у тесті» до «може надійно допомагати у реальній науці» може бути більш віддаленим, ніж натякає Google, адже тестові завдання мають стандартні відповіді, а наука — ні.

Переглянути оригінал
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

PayPal і TCS представляють мережу блокчейн для прискорення платежів за вантажі

PayPal і TCS Blockchain запустили мережу блокчейн-розрахунків для прискорення платежів у транспортній галузі. Використовуючи стабількоін PayPal USD, рахунки-фактури за вантажоперевезення можна оплачувати майже миттєво, покращуючи ліквідність для перевізників і знижуючи витрати до 90%. Система має на меті підвищити прозорість і ефективність у фінансуванні логістики.

CryptometerIo3хв. тому

Геополітична напруженість! Даліо гучно заявляє «Золото — єдине справжнє божество», але його захисні показники поступаються біткоїну

На тлі загострення геополітичної напруженості на Близькому Сході засновник Bridgewater Даліо поставив під сумнів біткоїн і знову підтвердив золото як головний актив для хеджування ризиків. Незважаючи на це, ціна золота впала, а біткоїн зазнав лише незначної корекції, що свідчить про послаблення зв'язку між ними. Даліо сумнівається у прозорості біткоїна та майбутніх ризиках, але все ж зберігає невелику кількість біткоїнів для диверсифікації активів.

区块客12хв. тому

ETH 15 хвилин різко знизився на 1.53%: короткострокове зменшення позицій великих гравців та відтік коштів з ETF спричинили обсягове падіння

2026-03-06 13:45 до 2026-03-06 14:00 (UTC), ціна ETH зазнала явних коливань, короткострокове зниження на 1.53%, ціна коливалася в межах від 2019.21 до 2051.26 USDT, з амплітудою до 1.56%. Високочастотні продажі зосереджувалися, увага ринку різко зросла, обсяг торгів збільшився, розбіжності між бичачими та ведмежими настроями посилилися, ринкова емоція стала обережною. Основною рушійною силою цього коливання стали великі гравці та акаунти китів, які після короткострокового відскоку зосереджено зменшували позиції, що спричинило швидке звільнення великих обсягів продажу та викликало короткостроковий тиск на ринок. На рівні ETF тримання

GateNews14хв. тому

BTC короткострокове зниження на 1.23%: витік коштів великих китів та ліквідація левериджних довгих позицій спричинили масовий продаж

2026-03-06 13:45 до 14:00 (UTC), ціна Bitcoin (BTC) за 15 хвилин показала дохідність -1.23%, діапазон цін становив від 69219.0 до 70086.3 USDT, амплітуда досягла 1.24%. Активність торгів за короткий час значно зросла, ринок зосереджений на різких коливаннях та зростанні ризикового настрою. Основною рушійною силою цієї аномалії є постійний відтік коштів від великих китів на блокчейні та масштабне ліквідування маржинальних довгих позицій на ринку деривативів. За даними блокчейну, обсяг зняття великих китів за один день досяг 16972 BTC, Whales O

GateNews14хв. тому

Попередження про зростання традиційних фінансів: VIX піднявся більш ніж на 7.5%

Бот новин Gate News повідомляє, що за останніми даними Gate TradFi, VIX короткостроково виріс на 7.5%, і нинішній рівень волатильності явно перевищує недавнє середнє значення, активність ринку зросла.

GateNews36хв. тому

Дані з американської зайнятості виявилися нижчими за очікування, спотове золото зросло більш ніж на 40 доларів, індекс долара знизився більш ніж на 20 пунктів

Gate News повідомляє, що 6 березня після оприлюднення даних з американського ринку праці, які виявилися гіршими за очікування, спотове золото короткостроково зросло більш ніж на 40 доларів, зараз становить 5112 доларів/унцію; спотове срібло короткостроково зросло на 1.6 долара, зараз становить 83.85 доларів/унцію; індекс долара DXY (індикатор сили долара щодо кошика валют) короткостроково знизився більш ніж на 20 пунктів, зараз становить 99.14.

GateNews43хв. тому
Прокоментувати
0/400
Немає коментарів