Результати пошуку для "GPT-4O"
Сьогодні
00:30

ZetaChain запускає Anuma — платформу для агрегування ШІ з фокусом на конфіденційність

Повідомлення Gate News, 28 квітня — команда ZetaChain офіційно запустила Anuma, платформу для агрегування ШІ з фокусом на конфіденційність, яка дає змогу користувачам отримувати доступ до кількох моделей ШІ—включно з GPT, Claude, Gemini, Grok, DeepSeek, Kimi та Qwen—через єдиний інтерфейс. Anuma має локальне сховище для конфіденційності,
Більше
05:17

GPT-5.5 повертається на передній край у кодуванні, але OpenAI змінює бенчмарки після поразки від Opus 4.7

Повідомлення Gate News, 27 квітня — SemiAnalysis, компанія з аналізу напівпровідників та ШІ, опублікувала порівняльний бенчмарк асистентів для кодування, зокрема GPT-5.5, Claude Opus 4.7 і DeepSeek V4. Ключовий висновок: GPT-5.5 означає перше повернення OpenAI на передній край у моделях для кодування за шість місяців, причому інженери SemiAnalysis тепер чергують між Codex і Claude Code після того, як раніше майже виключно покладалися на Claude. GPT-5.5 створено на основі нового підходу до попереднього навчання з кодовою назвою "Spud" і є першим розширенням масштабу попереднього навчання OpenAI з моменту GPT-4.5. У практичному тестуванні чітко проявився розподіл ролей. Claude береться за планування нових проєктів та початкове налаштування, тоді як Codex найкраще справляється з виправленнями багів, що потребують інтенсивного осмислення. Codex демонструє сильніше розуміння структур даних і логічного міркування, але має труднощі з тим, щоб вгадувати неоднозначні наміри користувача. В одній задачі на єдиній панелі керування Claude автоматично відтворив макет сторінки-зразка, але сфабрикував великі обсяги даних, тоді як Codex пропустив макет, зате видав значно точніші дані. Аналіз виявляє деталь маніпуляції бенчмарком: у лютневому блозі OpenAI закликав індустрію перейти на SWE-bench Pro як новий стандарт для бенчмарків кодування. Однак у повідомленні про GPT-5.5 перехід здійснили на новий бенчмарк під назвою "Expert-SWE." Причина, захована в дрібному шрифті, полягає в тому, що GPT-5.5 було випереджено Opus 4.7 на SWE-bench Pro і він суттєво відстав від неопублікованого Mythos 77.8% від Anthropic. Щодо Opus 4.7: Anthropic опублікувала постмортем-аналіз через тиждень після релізу, визнавши три баги в Claude Code, які зберігалися протягом кількох тижнів з березня по квітень, впливаючи майже на всіх користувачів. Раніше кілька інженерів повідомляли про погіршення продуктивності в версії 4.6, але їх відхилили, назвавши суб’єктивними спостереженнями. Крім того, новий токенізатор у Opus 4.7 збільшує використання токенів до 35%, що Anthropic прямо визнав — по суті, це приховане підвищення ціни. DeepSeek V4 оцінили як "дотримання темпу з переднім краєм, але без лідерства," позиціонуючи його як найдешевшу альтернативу серед моделей із закритим кодом. Аналіз також зазначив, що "Claude продовжує випереджати DeepSeek V4 Pro у завданнях із високою складністю китайського письма," коментуючи, що "Claude переміг китайську модель у її власній мові." У статті вводиться ключова ідея: ціноутворення моделей слід оцінювати за "вартістю за задачу" замість "вартості за токен." Ціна GPT-5.5 удвічі вища за ціну GPT-5.4 input $5, output per million tokens, але він виконує ті самі завдання, використовуючи менше токенів, тож фактична вартість не обов’язково вища. Початкові дані SemiAnalysis показують, що співвідношення вхідних і вихідних даних у Codex становить 80:1, що нижче, ніж у Claude Code — 100:1.
Більше
02:06

Telegram Запускає Інструмент для Створення AI-Ботів Без Коду

Повідомлення Gate News, 27 квітня — Telegram запустив інструмент для створення AI-ботів без коду, який дозволяє користувачам створювати та налаштовувати чат-ботів без знань програмування. Користувачі можуть взаємодіяти з ботом LobsterFather, щоб отримати ключ API, а потім інтегрувати його з такими платформами, як Telewer, GPTBots або Lazy AI, щоб налаштовувати поведінку та функції бота за допомогою варіантів «натисни й вибери». Інструмент підтримує кілька моделей ШІ, зокрема GPT і Llama. Користувачі можуть обрати бажану модель і налаштувати стиль розмови та функціональність бота. Платформа дає змогу створювати Master Bot, який може керувати та розподіляти завдання між субботами, що робить її придатною для роботи з кількома чат-групами або сценаріями запитів клієнтів. Функція інтегрується з Telegram Business, дозволяючи ботам бути автономними помічниками. Боти можуть вітати нових учасників 24/7, фільтрувати спам-повідомлення та відповідати на поширені запитання, допомагаючи спільнотам залишатися організованими та оперативними. Telegram наголосив, що користувачам слід усвідомлювати ризики безпеки даних третіх сторін під час використання цих інтеграцій, оскільки дані бота можуть оброблятися зовнішніми платформами.
Більше
03:33

OpenAI Об’єднує Codex з Основною Моделлю, Починаючи з GPT-5.4, Припиняє Окрему Лінійку Кодування

Новини Gate, 26 квітня — керівник відділу досвіду розробників OpenAI Ромен Юе (Romain Huet) у нещодавній заяві на X повідомив, що Codex, лінійка спеціалізованих моделей для кодування, яку компанія незалежно підтримувала, була об’єднана з основною моделлю, починаючи з GPT-5.4, і більше не отримуватиме окремих
Більше
12:31

DeepSeek випускає моделі V4-Pro і V4-Flash із 98% нижчою вартістю, ніж у GPT-5.5 Pro від OpenAI

Повідомлення Gate News, 25 квітня — DeepSeek випустила прев’ю-версії V4-Pro та V4-Flash 24 квітня; обидві — моделі з відкритими вагами з контекстними вікнами на один мільйон токенів. V4-Pro має 1,6 трильйона загальних параметрів, але активує лише 49 мільярдів за один прохід виведення, використовуючи архітектуру Mixture-of-Experts.
Більше
03:11

Nvidia розгортає AI-агента OpenAI Codex для всієї команди працівників на інфраструктурі Blackwell

Повідомлення Gate News, 25 квітня — Nvidia розгорнула Codex від OpenAI, AI-агента з підтримкою GPT-5.5, для всієї своєї команди працівників після успішного випробування приблизно з 10,000 співробітників, повідомляють внутрішні матеріали від CEO Дженсена Хуанга та CEO OpenAI Сема Альтмана. Codex розроблено для того, щоб допомагати з
Більше
01:21

OpenClaw v2026.4.23 додає підтримку прямого OAuth для gpt-image-2, вводить режим форкнутого контексту для підагентів

Повідомлення Gate News, 25 квітня — OpenClaw, фреймворк агентів ШІ із відкритим кодом, випустив v2026.4.23 23 квітня, представивши оновлення в генерації зображень, механізмах підагентів і посиленні безпеки. Удосконалення генерації зображень дозволяють викликати gpt-image-2 безпосередньо через Codex OAuth без
Більше
01:46

OpenAI запускає GPT-5.5, створену для агентних завдань і складних робочих процесів

Повідомлення Gate News, 24 квітня — OpenAI офіційно випустила GPT-5.5, AI-модель наступного покоління, призначену для роботи зі складними цілями, інтеграцією інструментів, самоперевіркою та виконанням багатокрокових завдань. Модель вирізняється в написанні коду та налагодженні, онлайн-дослідженнях, аналізі даних, створенні документів
Більше
04:54

Perplexity розкриває метод пост-тренування агента веб-пошуку; модель на базі Qwen3.5 перевершує GPT-5.4 за точністю та вартістю

Perplexity використовує SFT із подальшим RL із моделями Qwen3.5, застосовуючи багатокроковий набір даних для QA та перевірки за рубрикою, щоб підвищити точність і ефективність пошуку, досягаючи рівня FRAMES найвищого класу. Анотація: Робочий процес пост-тренування Perplexity для агентів веб-пошуку поєднує контрольоване донавчання (SFT) для забезпечення дотримання інструкцій і мовної узгодженості з онлайн підкріплювальним навчанням (RL) через алгоритм GRPO. Етап RL використовує власний багатоходовий верифікований датасет запитань-відповідей і розмовні дані на основі рубрики, щоб запобігти дрейфу SFT, із обмеженням винагород і штрафами за ефективність у межах групи. Оцінювання показує, що Qwen3.5-397B-SFT-RL досягає найвищих показників FRAMES: 57,3% точності за одного виклику інструмента та 73,9% за чотирьох викликів при $0,02 за запит, випереджаючи GPT-5.4 і Claude Sonnet 4.6 за цими метриками. Ціноутворення базується на API і не включає кешування.
Більше
12:05

Kimi K2.6 очолює програмний бенчмарк OpenRouter, випереджаючи Claude та серію GPT

Kimi K2.6 посідає перше місце в лідерборді OpenRouter, випереджаючи Claude, GPT та конкурентів із відкритим кодом, що свідчить про прогрес вітчизняного ШІ та звужує розрив із глобальними лідерами. Анотація: Kimi.ai повідомила, що її найновіша модель, Kimi K2.6, посіла перше місце в лідерборді OpenRouter за програмними здібностями, випередивши учасників під час оцінювання розробниками. Бенчмарки вказують, що K2.6 демонструє кращу продуктивність у різноманітних завданнях з програмування порівняно з Claude, серією GPT та іншими моделями з відкритим кодом, підкреслюючи покращення в генерації коду та обробці розробницьких завдань і сигналізуючи про рух вітчизняного ШІ до рівня міжнародних лідерів.
Більше