Top-KI-Modelle hinken bei routinemäßigen Unternehmensaufgaben hinterher, sagt Databricks: Kleinere spezialisierte Modelle sind überlegen

Gate News-Mitteilung, 20. April — Top-KI-Modelle sind hervorragend darin, komplexe Probleme zu lösen, wie Olympiademathematik, aber sie haben Schwierigkeiten mit routinemäßiger Arbeit im Unternehmen, so David Meyer von Databricks. Einige Modelle korrigieren möglicherweise eine falsche Rechnungsnummer statt sie als Fehler zu markieren, während Codier-Tools wie Claude bei Aufgaben im Bereich Data Engineering ebenfalls unterdurchschnittlich abschneiden können.

Die Lücke rührt von grundlegenden Unterschieden zwischen Unternehmensdaten und dem öffentlichen Web-Text her, der zur Schulung großer Modelle verwendet wird. Unternehmensdaten weisen oft vage Spaltenbezeichnungen auf, zahlreiche leere Felder und Codes, die als Klartext gespeichert sind. In einer akademischen Studie sank der F1-Score eines KI-Modells, der Precision und Recall ausbalanciert, von 0,94 auf öffentlichen Daten auf 0,07 bei Unternehmensdaten für eine Aufgabe im Data Engineering. Außerdem neigen große Modelle dazu, auf vertraute Muster aus dem Training zurückzugreifen; einige defaulteten zu Structured Query Language (SQL), selbst nachdem sie Anweisungen und Dokumentation für eine firmeneigene Abfragesprache erhalten hatten.

Kleinere Open-Source-Modelle, die mit Reinforcement Learning feinabgestimmt wurden, können bestimmte Jobs effizienter bewältigen und verursachen dabei deutlich geringere Schulungskosten als große, allgemeine Modelle. Databricks baut kleinere KI-Agenten für spezifische Workflows, wie KARL, das Reinforcement Learning für mehrstufiges Reasoning mit Unternehmensdokumenten nutzt. Die Branche verlagert sich von der Abhängigkeit von riesigen Modellen hin zu hybriden Architekturen: kleine, effiziente Modelle übernehmen das routinemäßige Volumen und eskalieren nur unklare oder komplexe Fälle an größere, kostspieligere Systeme.

Databricks hat kürzlich Quotient AI übernommen, um großen Unternehmen dabei zu helfen, KI-Agenten zuverlässiger einzusetzen. Der Wettbewerb im KI-Geschäft konzentriert sich inzwischen darauf, den vollständigen KI-Lifecycle abzuwickeln, einschließlich Feedback-Systemen zur Fehlerverfolgung und einer kontinuierlichen Verbesserung der Modelle über Zeit hinweg. Dadurch werden Evaluierungs- und Tuning-Tools nach dem Deployment immer wertvoller.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

KI-Handelsagenten-Plattform Fere AI nimmt 1,3 Mio. US-Dollar ein, angeführt von Ethereal Ventures

Gate News-Meldung, 25. April — Die auf KI basierende Plattform für digitale Asset-Handelsagenten Fere AI hat die Fertigstellung einer Finanzierungsrunde in Höhe von 1,3 Millionen US-Dollar bekannt gegeben, die von Ethereal Ventures geleitet wird. An der Runde beteiligten sich Galaxy Vision Hill und Kosmos Ventures. Die Plattform unterstützt plattformübergreifende Netzwerke, darunter Ethereum,

GateNews1Std her

OpenClaw v2026.4.23 fügt direkte OAuth-Unterstützung für gpt-image-2 hinzu und führt den gegabelten Kontextmodus für Sub-Agenten ein

Gate News-Meldung, 25. April — OpenClaw, ein Open-Source-Framework für KI-Agenten, hat am 23. April v2026.4.23 veröffentlicht und bringt Updates in der Bildgenerierung, in Mechanismen für Sub-Agenten und bei der Sicherheits-Härtung. Verbesserungen bei der Bildgenerierung ermöglichen es, gpt-image-2 direkt über Codex OAuth aufzurufen, ohne

GateNews1Std her

Fere AI schließt eine 1,3-Millionen-US-Dollar-Finanzierungsrunde ab, angeführt von Ethereal Ventures

Gate News-Meldung, 24. April — Fere AI, eine KI-gestützte Plattform für digitale Asset-Handelsagenten, gab den Abschluss einer Finanzierungsrunde in Höhe von 1,3 Millionen US-Dollar bekannt, die von Ethereal Ventures angeführt wurde, mit Beteiligung von Galaxy Vision Hill und Kosmos Ventures. Die Plattform unterstützt plattformübergreifende Netzwerke einschließlich Ethereum,

GateNews12Std her

Großes CEX-Wallet-Launch: Agentic Wallet für KI-Agenten mit 0 Gebühren während der Werbeaktion

Gate News-Nachricht, 24. April — Eine große Kryptowährungsbörse-Wallet hat AgenticWallet eingeführt, eine spezialisierte keyless Wallet, die für KI-Agenten entwickelt wurde. Die Plattform ermöglicht es Nutzern, KI-Agenten zu autorisieren, um sicher Trades, Überweisungen und Asset-Management-Operationen innerhalb der konfigurierten

GateNews14Std her

Web3-KI-Infrastruktur AIW3 nimmt $2M in Seed-Finanzierung auf, angeführt von Buffalo Capital

Gate News-Mitteilung, 24. April — Die Web3-KI-Infrastrukturplattform AIW3 hat den Abschluss einer $2 Millionen Seed-Rundenfinanzierung bekannt gegeben. Die Runde wurde von Buffalo Capital geleitet, wobei GalaXin Capital und Three-stones Ventures als Co-Investoren teilnahmen. AIW3 wechselt hin zu einem Agent-as-a-Service

GateNews16Std her
Kommentieren
0/400
Keine Kommentare