Gate News-Meldung, 23. April — Das Engineering-Team von Anthropic bestätigte, dass die von Nutzern über den vergangenen Monat gemeldete Qualitätsverschlechterung von Claude Code auf drei unabhängige Änderungen auf Produktebene zurückzuführen ist, nicht auf Probleme mit der API oder dem zugrunde liegenden Modell. Die drei Probleme wurden jeweils am 7. April, am 10. April und am 20. April behoben, wobei die finale Version jetzt v2.1.116 ist.
Die erste Änderung erfolgte am 4. März, als das Team die standardmäßige Stufe des Rechenaufwands für Claude Code von „high“ auf „medium“ reduzierte, um gelegentliche extreme Latenzspitzen in Opus 4.6 bei hoher Rechenintensität zu adressieren. Nach weitreichender Kritik von Nutzern an der verminderten Leistung setzte das Team die Änderung am 7. April zurück. Der aktuelle Standard ist nun „xhigh“ für Opus 4.7 und „high“ für andere Modelle.
Das zweite Problem war ein Bug, der am 26. März eingeführt wurde. Das System war so ausgelegt, alte Aufzeichnungen zum Rechenaufwand nach Konversationsinaktivität zu bereinigen, die eine Stunde überschritt, um die Kosten für die Sitzungswiederherstellung zu reduzieren. Ein Fehler in der Implementierung führte jedoch dazu, dass das Bereinigen bei jeder nachfolgenden Antwort wiederholt ausgeführt wurde, statt nur einmal, wodurch das Modell schrittweise den vorherigen Kontext zum Rechenaufwand verlor. Dies zeigte sich als zunehmende Vergesslichkeit, wiederholte Operationen und abnorme Tool-Aufrufe. Der Bug führte außerdem zu Cache-Misses bei jeder Anfrage, wodurch der Verbrauch von Nutzerkontingenten beschleunigt wurde. Zwei unbeteiligte interne Experimente verdeckten die Bedingungen für die Reproduktion und verlängerten den Debugging-Prozess auf über eine Woche. Nachdem der Bug am 10. April behoben worden war, überprüfte das Team problematischen Code mit Opus 4.7 und stellte fest, dass Opus 4.7 den Bug erkennen konnte, Opus 4.6 jedoch nicht.
Die dritte Änderung wurde am 16. April zusammen mit Opus 4.7 eingeführt. Das Team ergänzte Anweisungen in den System-Prompt, um redundante Ausgaben zu reduzieren. Interne Tests über mehrere Wochen zeigten keine Regression, aber nach dem Launch verschlechterte die Interaktion mit anderen Prompts die Codequalität. Eine erweiterte Evaluierung ergab einen 3%-Leistungsabfall in sowohl Opus 4.6 als auch 4.7, was zu einem Rollback am 20. April führte.
Diese drei Änderungen betrafen unterschiedliche Nutzergruppen zu unterschiedlichen Zeiten, und ihre kombinierte Wirkung führte zu einem weitverbreiteten und uneinheitlichen Qualitätsrückgang, was die Diagnose erschwerte. Anthropic erklärte, dass man nun mehr interne Mitarbeitende benötigen werde, um wie Nutzer dieselbe öffentliche Build-Version zu verwenden, vollständige Model-Evaluations-Suites für jede Änderung am System-Prompt auszuführen und gestufte Rollout-Zeiträume zu implementieren. Als Ausgleich hat Anthropic die Nutzungskontingente für alle Abonnenten zurückgesetzt.
Verwandte Artikel
Meta Platforms plant am 20. Mai eine Reduzierung der Belegschaft um 10%, betroffen sind etwa 8.000 Stellen
Das Trump-Regime hat einen Plan zur Bekämpfung der KI-Extraktion veröffentlicht und wirft chinesischen Unternehmen vor, systematisch die Modellfähigkeiten zu stehlen.
DeepSeek veröffentlicht V4 als Open-Source-Vorschauversion, Technikbewertung 3206 übertrifft GPT-5.4
Cambricon schließt die Day-0-Anpassung von DeepSeek-V4 ab und setzt einen Meilenstein für Chinas KI-Chip-Ökosystem
Tencent Open-Source Hy3 Vorschauversion, Code-Benchmark-Tests um 40% besser als die vorherige Version
FTX-Portfolioinvestitionen im Wert von 158 Billionen Won, wenn sie nicht bankrott gegangen wäre