Повідомлення Gate News, 27 квітня — Логан Кілпатрік, старший менеджер з продуктів у Google DeepMind і керівник продукту для Google AI Studio, заявив у X, що кожна компанія, яка створює продукти на основі ШІ, має встановити власні кастомні бенчмарки для вимірювання продуктивності моделей ШІ. Він описав це як метод, щоб покращення моделі “незрівнянно вигідно для вашої компанії” та закликав фаундерів і керівників бізнесу “почати вже завтра.”

Наразі більшість компаній покладаються на публічні лідерборди, щоб обирати моделі ШІ, але вони вимірюють загальні можливості, які часто не відповідають конкретним сценаріям бізнесу. Кілпатрік навів приклад компанії з контрактних оглядів, яка найбільше переймається точністю вилучення пунктів — можливості, якої немає в публічних бенчмарках, через що неможливо оцінити продуктивність моделі на цьому завданні. Кастомні бенчмарки мають дві ключові переваги: по-перше, вони дають компаніям змогу оцінювати кожне оновлення кожної моделі порівняно зі своїми бізнес-завданнями та обирати ту модель, яка найкраще працює саме в їхньому реальному випадку використання, а не ту, що загалом займає найвищі місця; по-друге, вони дозволяють компаніям ділитися цими тестовими наборами з постачальниками моделей, що стимулює безперервну оптимізацію в напрямках, які важливі для їхнього бізнесу.

Кілпатрік зазначив, що такі компанії, як Zapier і Sierra, уже впроваджують цей підхід, заявивши, що “тут можна створити дуже багато альфи”.

Переглянути джерело

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Грег Брокман з OpenAI: ШІ переходить від чату до автономного виконання завдань

AI Agent Новини індустрії ШІ

Повідомлення Gate News, 27 квітня — Грег Брокман, президент і співзасновник OpenAI, каже, що наступна хвиля штучного інтелекту переведе користувачів від спілкування з ботами-ШІ до доручення їм реальних завдань. Цей зсув змушує підприємства переосмислити операційні робочі процеси та встановити нові протоколи для se

GateNews1хв. тому

B.AI Оновлює Інфраструктуру та Запускає Важливі Функції Навичок

Прогрес проєкту Партнерства та екосистема AI Agent Новини індустрії ШІ

Повідомлення Gate News, 27 квітня — B.AI оголосила цього тижня про численні досягнення в продуктах і екосистемі. Лендинг BAIclaw отримав повне візуальне та інтерактивне оновлення: підтримку багатомовності вебсайту розширено до 10 мов, що підсилює його глобальну зручність. Щодо інфраструктури

GateNews15хв. тому

Пекінська вимога про заборону торгів вимагає скасувати угоди! Meta зірвала покупку китайського AI-стартапу Manus на 2 мільярди доларів США

Новини індустрії ШІ

Китайська національна комісія з розвитку та реформ сьогодні (27 квітня) офіційно опублікувала оголошення, згідно з яким офіс робочого механізму з безпекового розгляду іноземних інвестицій «на підставі та в межах закону ухвалив заборонене інвестування для угоди з іноземним капіталом щодо придбання проєкту Manus» і «вимагає, щоб відповідна сторона скасувала цю угоду про придбання». Це є одним із небагатьох випадків, коли з часу набрання чинності китайськими «заходами з безпекового розгляду іноземних інвестицій» було застосовано найвищий рівень жорсткості для винесення «рішення про заборону інвестування» та вимогу скасувати вже здійснену угоду. Meta вклала 2 млрд доларів США, купивши найдешевший застосунок для AI Час повертається до 29 грудня 2025 року. Meta оголосила про придбання китайського стартапу з AI-агентами Manus, а ринок оцінював ціну в межах від 2 до 3 млрд доларів США. Manus — універсальний AI, розроблений Beijing Butterfly Effect Technology Development, і після виходу 6 березня 2025 року, завдяки яскравим результатам у GAIA benchmark, він за одну ніч

ChainNewsAbmedia29хв. тому

Акції IPO Xizhi Technology-P зростають більш ніж на 360% на сірих торгах, прибутки звужуються до 320%

Акції Новини індустрії ШІ

Повідомлення Gate News, 27 квітня — Xizhi Technology-P (01879.HK), компанія з AI-чилпами, котирувана в Гонконзі, побачила, як її акції зросли більш ніж на 360% на сірих торгах (dark market) раніше сьогодні, хоча згодом прибутки скоротилися до 320%. Акції торгуються напередодні офіційного лістингу IPO в Гонконзі

GateNews42хв. тому

Підвищувати продуктивність за допомогою ШІ чи знижувати витрати? Ста разів ефективності не дало ста разів доходу, але у Силіконовій долині ніхто не наважується сказати “стоп”.

Новини індустрії ШІ

Мен Сінг, партнер Wuyuan Capital, нещодавно опублікував звіт про відвідування Силіконової долини та висунув висновок, через який навіть йому самому довелося змінити звичку робити нотатки: Силіконова долина входить у такий етап, коли навіть людину, яка вміє «пускати хвилі», змиває хвилею. Швидкість ітерацій AI вже з «щомісяця» перейшла на «щотижня», навіть самі у Силіконовій долині не встигають за власним темпом. Коли AI збільшує продуктивність команди у 5 разів, ви можете скоротити до 80% персоналу, щоб зберегти той самий обсяг випуску, або ж залишити чисельність і робити в п’ять разів більше. Спостереження Мен Сіна цього разу по Силіконовій долині фактично є чернеткою відповіді, даної на місці: коли 100-кратна ефективність не дала 100-кратних доходів, коли токен-бюджет наближається до вартості людських ресурсів, коли парова машина ще не може обігнати карету, але ніхто не наважується зупинитися, Силіконова долина зараз обирає «спочатку розігнати швидкість, а там як буде». Але цей шлях у підсумку приведе до «збільшення можливостей для розширення» чи до «скорочення витрат», наразі невідомо. YC: з провідних індикаторів на відстаючі Мен Сінг цього року

ChainNewsAbmedia1год тому

Прокоментувати

0/400

Немає коментарів