Топовые AI-модели отстают в рутинных корпоративных задачах: Databricks говорит, что небольшие специализированные модели справляются лучше

Сообщение Gate News, 20 апреля — Топовые AI-модели отлично решают сложные задачи вроде олимпиады по математике, но испытывают трудности с рутинной корпоративной работой, согласно Дэвиду Мейеру из Databricks. Некоторые модели могут исправить неверный номер счета-фактуры вместо того, чтобы пометить его как ошибку, а инструменты для кодирования вроде Claude также могут хуже справляться с задачами по data engineering.

Разрыв связан с фундаментальными различиями между корпоративными данными и публичным текстом веба, который используют для обучения больших моделей. Корпоративные данные часто содержат расплывчатые названия колонок, множество пустых полей и коды, хранящиеся в виде обычного текста. В одном академическом исследовании показатель F1 AI-модели, который балансирует точность и полноту, упал с 0.94 на публичных данных до 0.07 на корпоративных данных для задачи по data engineering. Кроме того, большие модели часто по умолчанию опираются на знакомые шаблоны из обучения; некоторые по умолчанию подставляли Structured Query Language (SQL) даже после получения инструкций и документации для проприетарного языка запросов компании.

Небольшие модели с открытым исходным кодом, настроенные с помощью обучения с подкреплением, могут справляться с конкретными задачами более эффективно и при существенно более низких затратах на обучение, чем большие универсальные модели. Databricks разрабатывает меньшие AI-агенты для конкретных рабочих процессов, например KARL, который использует обучение с подкреплением для многошагового рассуждения с документами компании. Индустрия смещается от опоры на гигантские модели к гибридным архитектурам, где небольшие эффективные модели обрабатывают типовой объем, а затем эскалируют только неясные или сложные случаи в более крупные и дорогие системы.

Недавно Databricks приобрела Quotient AI, чтобы помочь крупным предприятиям запускать AI-агентов более надежно. Конкуренция в AI-бизнесе сейчас сосредоточена на том, чтобы пройти весь жизненный цикл AI, включая системы обратной связи для отслеживания ошибок и непрерывного улучшения моделей со временем, благодаря чему инструменты для оценки и настройки становятся все более ценными после внедрения.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Nvidia развертывает AI-агента OpenAI Codex по всей организации на инфраструктуре Blackwell

Новостное сообщение Gate News, 25 апреля — Nvidia развернула Codex от OpenAI, AI-агент, работающий на GPT-5.5, для всей своей команды сотрудников после успешного пилотного проекта примерно с 10 000 сотрудников, сообщают внутренние коммуникации от генерального директора Дженсена Хуанга и генерального директора OpenAI Сэма Альтмана. Codex предназначен для того, чтобы помогать с

GateNews1ч назад

Стартап по ИИ-разработке Cognition ведет переговоры о раунде финансирования при оценке в $25B

Сообщение Gate News, 25 апреля — По данным людей, знакомых с ситуацией, стартап по ИИ-разработке Cognition находится на ранней стадии переговоров о привлечении сотен миллионов долларов или более примерно при оценке в $25 миллиардов, сообщили источники. Интерес возрос после приобретения SpaceX конкурирующего стартапа по ИИ-разработке. Со

GateNews1ч назад

Платформа для торгового ИИ-агента Fere AI привлекла $1,3M во главе с Ethereal Ventures

Сообщение Gate News, 25 апреля — платформа для торговли цифровыми активами с ИИ-агентом Fere AI объявила о завершении раунда финансирования на $1,3 млн под руководством Ethereal Ventures при участии Galaxy Vision Hill и Kosmos Ventures. Платформа поддерживает кроссчейн-сети, включая Ethereum,

GateNews2ч назад

OpenClaw v2026.4.23 Добавляет поддержку прямого OAuth для gpt-image-2, представляет режим с форкнутым контекстом для субагентов

Сообщение Gate News, 25 апреля — OpenClaw, открытый фреймворк AI-агентов с открытым исходным кодом, выпустил v2026.4.23 23 апреля, представив обновления в генерации изображений, механизмах субагентов и усилении безопасности. Улучшения генерации изображений позволяют вызывать gpt-image-2 напрямую через Codex OAuth без

GateNews2ч назад

Fere AI завершает раунд финансирования на $1,3 млн под руководством Ethereal Ventures

Сообщение Gate News, 24 апреля — Fere AI, платформа для торговых агентов цифровыми активами с применением ИИ, объявила о завершении раунда финансирования на $1,3 млн, который возглавила Ethereal Ventures; в нем также участвовали Galaxy Vision Hill и Kosmos Ventures. Платформа поддерживает кроссчейн-сети, включая Ethereum,

GateNews13ч назад
комментарий
0/400
Нет комментариев