Les meilleurs modèles d’IA accusent du retard sur les tâches d’entreprise courantes, selon Databricks : des modèles spécialisés plus petits surpassent

Message de Gate News, 20 avril — Les principaux modèles d’IA excellent à résoudre des problèmes complexes comme les mathématiques de type Olympiade, mais peinent avec le travail d’entreprise de routine, selon David Meyer de Databricks. Certains modèles peuvent corriger un numéro de facture incorrect au lieu de le signaler comme une erreur, tandis que des outils de programmation comme Claude peuvent aussi être en dessous des attentes sur des tâches de data engineering.

L’écart s’explique par des différences fondamentales entre les données d’entreprise et le texte du web public utilisé pour entraîner les grands modèles. Les données d’entreprise présentent souvent des libellés de colonnes vagues, de nombreux champs vides et des codes stockés sous forme de texte brut. Dans une étude universitaire, le score F1 d’un modèle d’IA, qui équilibre précision et rappel, est passé de 0.94 sur des données publiques à 0.07 sur des données d’entreprise pour une tâche de data engineering. En outre, les grands modèles ont tendance à revenir par défaut à des schémas familiers issus de l’entraînement ; certains ont conservé (Structured Query Language )SQL par défaut même après avoir reçu des instructions et une documentation pour le langage de requêtes propriétaire d’une entreprise.

Des modèles open source plus petits, ajustés avec l’apprentissage par renforcement, peuvent traiter des tâches spécifiques de manière plus efficace à des coûts d’entraînement nettement inférieurs à ceux des grands modèles généralistes. Databricks construit des agents d’IA plus petits pour des flux de travail spécifiques, comme KARL, qui utilise l’apprentissage par renforcement pour un raisonnement en plusieurs étapes à partir de documents de l’entreprise. L’industrie s’oriente du recours à des modèles géants vers des architectures hybrides où des modèles petits et efficaces gèrent le volume de routine, puis n’escaladent que les cas ambigus ou complexes vers des systèmes plus grands et plus coûteux.

Databricks a récemment acquis Quotient AI pour aider les grandes entreprises à exécuter des agents d’IA de manière plus fiable. La concurrence dans le secteur de l’IA se concentre désormais sur l’exécution de l’ensemble du cycle de vie de l’IA, y compris des systèmes de feedback pour le suivi des erreurs et l’amélioration continue des modèles au fil du temps, ce qui rend les outils d’évaluation et de réglage de plus en plus précieux après le déploiement.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Une grande CEX lance Agentic Wallet pour les agents IA avec 0 frais pendant la période promotionnelle

Message d’actualité Gate News, 24 avril — Une grande plateforme d’échange de cryptomonnaies a lancé AgenticWallet, un portefeuille spécialisé sans clé conçu pour les agents IA. La plateforme permet aux utilisateurs d’autoriser des agents IA à exécuter de manière sécurisée des opérations de trading, de transferts et de gestion d’actifs au sein des paramètres configurés

GateNewsIl y a 18m

Infrastructure Web3 pour l’IA : AIW3 lève $2M en financement de démarrage, menée par Buffalo Capital

Message de Gate News, 24 avril — La plateforme d’infrastructure Web3 pour l’IA, AIW3, a annoncé l’achèvement d’un tour de financement de démarrage de $2 millions. Le tour a été mené par Buffalo Capital, avec GalaXin Capital et Three-stones Ventures participant en tant qu’investisseurs co-investisseurs. AIW3 passe vers un paradigme d’exécution on-chain Agent-as-a-Service

GateNewsIl y a 2h

Le gouvernement des Émirats arabes unis annonce le déploiement d’agents IA, avec la possibilité de finaliser d’ici 2028 au plus vite le fonctionnement de l’automatisation d’une partie des activités à hauteur de la moitié

Les Émirats arabes unis ont annoncé qu’en l’espace de deux ans, 50% des départements, des services et des opérations du gouvernement fédéral seront assurés par des agents IA autonomes, devenant ainsi le premier cas au monde. L’IA deviendra un partenaire d’exécution du gouvernement, aidant à la prise de décision, à améliorer les services et à s’optimiser de manière autonome. Tous les fonctionnaires publics doivent suivre une formation obligatoire ; la performance des ministres et l’efficacité de l’adoption de l’IA sont liées, et c’est un groupe de travail dédié piloté sous la supervision du président. Cette initiative découle d’une accumulation de politiques sur plus de dix ans et de la stratégie IA, dont le cœur est centré sur l’humain.

ChainNewsAbmediaIl y a 3h

OristaPay lance un système de paiement alimenté par l’IA sur Telegram, permet des règlements USDT instantanés sur TON

Message des Gate News, 24 avril — OristaPay, une marque opérant sous RD Technologies, a annoncé une voie de paiement complète permettant aux agents d’IA d’exécuter des transactions au sein de l’écosystème Telegram pendant le Hong Kong Web3 Festival. Le système permet aux utilisateurs de déclencher des transactions d’actifs numériques via des interactions en langage naturel sans quitter l’interface de discussion.

GateNewsIl y a 5h

Le projet Prometheus de Jeff Bezos lève $10B à une valorisation de $38B

Message d’actualité Gate News, 24 avril — Project Prometheus, un laboratoire d’IA fondé par Jeff Bezos, fondateur d’Amazon, et par l’ancien cadre de Google Vik Bajaj, a clôturé un tour de financement de $10 milliard(s) à une valorisation de $38 milliard(s). JPMorgan Chase et BlackRock sont

GateNewsIl y a 10h

OpenAI lance GPT-5.5, conçu pour les tâches d’agent et les flux de travail complexes

Message de Gate News, 24 avril — OpenAI a officiellement publié GPT-5.5, un modèle d’IA de nouvelle génération conçu pour gérer des objectifs complexes, l’intégration d’outils, l’auto-vérification et l’exécution de tâches en plusieurs étapes. Le modèle excelle dans l’écriture et le débogage de code, la recherche en ligne, l’analyse de données, la création de documents

GateNewsIl y a 11h
Commentaire
0/400
Aucun commentaire