Gate News Nachricht, 27. April — SemiAnalysis, ein Unternehmen für Halbleiter- und KI-Analysen, veröffentlichte einen vergleichenden Benchmark für Code-Assistenten, darunter GPT-5.5, Claude Opus 4.7 und DeepSeek V4. Die wichtigste Erkenntnis: GPT-5.5 markiert OpenAI’s erste Rückkehr an die Spitze der Coding-Modelle seit sechs Monaten, wobei SemiAnalysis-Ingenieure nun zwischen Codex und Claude Code wechseln, nachdem sie zuvor fast ausschließlich auf Claude gesetzt hatten. GPT-5.5 basiert auf einem neuen Vortrainingsansatz mit dem Codenamen “Spud” und stellt OpenAI’s erste Ausweitung der Vortraining-Skala seit GPT-4.5.

In praktischen Tests zeigte sich eine klare Arbeitsteilung. Claude übernimmt neues Projekt-Planning und die anfängliche Einrichtung, während Codex besonders bei fehlerbehebungen glänzt, die viel Denkaufwand erfordern. Codex zeigt ein stärkeres Verständnis für Datenstrukturen und logisches Denken, hat jedoch Schwierigkeiten, die mehrdeutige Nutzerabsicht abzuleiten. Bei einer einzelnen Dashboard-Aufgabe replizierte Claude automatisch die Layout-Referenzseite, fabrizierte jedoch große Mengen an Daten, während Codex das Layout übersprang, aber deutlich genauere Daten lieferte.

Die Analyse deckt einen Benchmark-Manipulationsaspekt auf: In seinem Februar-Blogbeitrag forderte OpenAI die Branche auf, SWE-bench Pro als neuen Standard für Coding-Benchmarks zu übernehmen. Allerdings wechselte die Ankündigung von GPT-5.5 zu einem neuen Benchmark namens “Expert-SWE.” Der Grund, in den Feinheiten versteckt, ist, dass GPT-5.5 von Opus 4.7 auf SWE-bench Pro übertroffen wurde und deutlich hinter Anthropic’s unveröffentlichtem Mythos (77.8%) zurückfiel.

Bezüglich Opus 4.7 veröffentlichte Anthropic eine Mortem-Analyse eine Woche nach dem Release und erkannte drei Bugs in Claude Code an, die mehrere Wochen lang von März bis April anhielten und nahezu alle Nutzer betrafen. Mehrere Ingenieure hatten zuvor eine Leistungsverschlechterung in Version 4.6 gemeldet, waren jedoch mit der Begründung abgetan worden, es handele sich um subjektive Beobachtungen. Zusätzlich erhöht der neue Tokenizer von Opus 4.7 die Token-Nutzung um bis zu 35%, was Anthropic offen zugab — effektiv eine versteckte Preiserhöhung.

DeepSeek V4 wurde als “mit der Spitze Schritt haltend, aber nicht führend” bewertet und positionierte sich als die kostengünstigste Alternative unter Closed-Source-Modellen. Die Analyse stellte außerdem fest, dass “Claude DeepSeek V4 Pro bei hochschwierigen chinesischen Schreibaufgaben weiterhin übertrifft,” und kommentierte: “Claude gewann gegen das chinesische Modell in dessen eigener Sprache.”

Der Artikel führt ein zentrales Konzept ein: Die Modellpreisgestaltung sollte anhand der “Kosten pro Aufgabe” statt der “Kosten pro Token” bewertet werden. Der Preis von GPT-5.5 ist doppelt so hoch wie der von GPT-5.4 (input $5, output $30 pro Million Tokens), aber es erledigt die gleichen Aufgaben mit weniger Tokens, wodurch die tatsächlichen Kosten nicht notwendigerweise höher sind. Erste SemiAnalysis-Daten zeigen, dass das Input-zu-Output-Verhältnis von Codex bei 80:1 liegt, niedriger als das von Claude Code mit 100:1.

View Source

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

Elon Musk nennt Sam Altman „Scam Altman“, während die Juryauswahl im OpenAI-Prozess beginnt

AI Industry News

Gate-News-Meldung, 27. April — Elon Musk hat am Montag seinen Streit mit OpenAI eskaliert, indem er den CEO Sam Altman auf X als „Scam Altman“ bezeichnete, während in Oakland, Kalifornien, die Juryauswahl für die Klage begann, die sich gegen OpenAIs Wechsel von einem gemeinnützigen Forschungs-Labor zu einem kommerziellen KI-Unternehmen richtet. OpenAI reagierte

GateNews1Std her

Fed Study Finds U.S. Programming Job Growth Dropped 50% After ChatGPT Launch

AI Industry News

Gate News Nachricht, 27. April — Eine Studie der Federal Reserve von den Ökonomen Leland D. Crane und Paul E. Soto fand, dass das Beschäftigungswachstum bei US-Programmierern nach dem Start von ChatGPT im November 2022 um etwa 50% zurückging. Vor der Veröffentlichung des KI-Modells wuchsen programmierlastige Jobs mit ungefähr 5% pro Jahr, deutlich über dem Niveau des gesamten Arbeitsmarkts. Seitdem ist das Wachstum in Bereichen wie IT-Dienstleistungen und Softwareentwicklung im Wesentlichen zum Stillstand gekommen. Die Forschenden schätzen, dass im Zeitraum von drei Jahren rund 500.000 Programmiererstellen, die andernfalls entstanden wären, nie besetzt wurden. Die Beschäftigungslücke zeigte sich erst Mitte 2024, etwa 18 Monate nach dem Start von ChatGPT, was darauf hindeutet, dass Unternehmen Zeit brauchten, um die Fähigkeiten der KI zu bewerten, bevor sie die Kopfzahl anpassten. Die Studie kontrollierte für andere Gegenwinde im Jahr 2022 — Zinserhöhungen, das Ende des digitalen Pandemie-Booms und den Krypto-Crash — und stellte dennoch fest, dass die Beschäftigung von Programmierern um ungefähr 3% pro Jahr weiter zurückging, selbst nachdem diese Effekte herausgerechnet wurden. Eine separate Harvard-Studie mit 62 Millionen Lohn- und Gehaltsarbeitern ergab, dass die Beschäftigung von Junior-Entwicklern bei der Einführung von generativer KI innerhalb von sechs Quartalen um etwa 9-10% sinkt, während die Beschäftigung von Senior-Entwicklern weitgehend unverändert bleibt. Anthropic-CEO Dario Amodei hat gewarnt, dass bis zu 50% der Einstiegspositionen innerhalb von fünf Jahren verschwinden könnten. „Wenn A.I. überproportional Junior-Positionen betrifft, könnte das nachhaltige Folgen für den College-Lohnaufschlag, die soziale Mobilität und Einkommensunterschiede haben“, so die Harvard-Forschenden. Die Programmierer-Löhne sind nicht gesunken; der Effekt hat sich eher in der Kopfzahl als in der Bezahlung gezeigt. Stellenanzeigen haben sich 2024 stabilisiert und sind seitdem leicht gestiegen. Die Fed-Forschenden stellen fest, dass günstigere KI-gestützte Programmierung neue Märkte erschließen und die Gesamtnachfrage nach Entwickler-Arbeitskräften langfristig erhöhen könnte. Die Studie wurde als vorläufige Einstufung veröffentlicht und ist die erste Analyse auf Ebene der Federal Reserve, die direkt den KI-Einsatz mit einem messbaren, berufsbezogenen Rückgang beim Recruiting verknüpft.

GateNews3Std her

Musk vs. OpenAI-CEO-Prozess startet heute vor Gericht! Elon Musk schimpft: Betrüger Altman

AI Industry News

Musk und der Rechtsstreit mit OpenAI wurden in Kalifornien verhandelt. Musk griff zunächst auf der X-Plattform in Serie an und bezeichnete Altman als „betrügerischen Altman“. Er beschuldigte Altman und Brockman, Wohltätigkeitsorganisationen gestohlen zu haben; der Rechtsstreit wird als Neid und als Unterdrückung des Wettbewerbs angesehen. OpenAI erklärte, dass man vor Gericht die Wahrheit offenlegen werde. Die Höhe der Klage beträgt 134 Milliarden US-Dollar; sie ist in zwei Phasen unterteilt – Verantwortlichkeit und Entschädigung. Die Geschworenen haben lediglich beratende Funktion, und letztlich entscheidet der Richter.

ChainNewsAbmedia6Std her

Gemini startet agentisches Trading für KI-gestütztes automatisiertes Trading

AI Agent AI Industry News

Die Krypto-Börse Gemini hat Agentic Trading eingeführt und markiert damit das erste Mal, dass eine regulierte US-Börse eine direkte KI-Agenten-Integration für automatisierten Handel angeboten hat. Die Plattform ermöglicht es Nutzern, Claude, ChatGPT und andere KI-Modelle zu verbinden, um Handelsstrategien zu automatisieren – von einfachen Orders bis hin zu

CryptoFrontier6Std her

Über 580 Google-Mitarbeitende fordern CEO dazu auf, Pentagon-AI-Verträge zu blockieren

AI Industry News

Gate News-Meldung, 27. April — Mehr als 580 Google-Mitarbeitende haben einen offenen Brief unterzeichnet, in dem sie den CEO Sundar Pichai dazu drängen, der Nutzung der künstlichen Intelligenztechnologie des Unternehmens durch das Pentagon für militärische Anwendungen einen Riegel vorzuschieben. Zu den Unterzeichnenden gehören mehr als 18 leitende Mitarbeitende, darunter von Principals und Direktoren bis hin zu Vizepräsidenten,

GateNews6Std her

Der Vater von AlphaGo sammelt 1,1 Milliarden US-Dollar in einer Seed-Runde: die größte Seed-Runde in Europa, Bewertung 5,1 Milliarden US-Dollar

AI Industry News

Gemäß der von der Anwaltskanzlei Cooley am 27. April veröffentlichten Pressemitteilung hat die Londoner KI-Forschungsfirma Ineffable Intelligence eine Seed-Runde über 1,1 Milliarden US-Dollar (1,1 Mrd. USD) abgeschlossen, mit einer Post-Money-Bewertung von 5,1 Milliarden US-Dollar (5,1 Mrd. USD). Die Runde wurde gemeinsam von Sequoia Capital und Lightspeed Venture Partners geleitet, mit weiteren Investitionen u. a. von Google, Nvidia und Index Ventures. Dies ist die bislang größte Seed-Runde in Europa in den letzten Jahren und steht zugleich für die Entstehung einer neuen Welle von Investitionen in den KI-Kapitalmärkten, bei der „nicht nur auf LLMs“ gesetzt wird. 1,1 Milliarden US-Dollar Seed-Runde: Größte Seed-Runde in der Geschichte Europas, Bewertung von 5,1 Milliarden US-Dollar Ineffable Intelligence überstieg bei dieser Finanzierung direkt das frühere

ChainNewsAbmedia7Std her

Kommentieren

0/400

Keine Kommentare