Gate-News-Mitteilung, 29. April — OpenAI-Modelle, die auf dem Amazon Web Services Bedrock laufen, werden schrittweise auf Trainium migrieren, Amazons eigens entwickelten KI-Chip, wie jüngste Aussagen von OpenAI-CEO Sam Altman und AWS-Führungskräften nahelegen. Aktuell arbeiten die Modelle in einer gemischten Umgebung, die sowohl GPUs als auch Trainium nutzt, wobei der Anteil mit der Zeit zunehmend auf Trainium übergeht. Altman sagte, das Unternehmen sei “sehr gespannt darauf, Modelle auf Trainium zu verlagern.”
AWS-Manager Garman räumte ein, dass der Name Trainium möglicherweise irreführend gewesen sein könnte, da der Chip für sowohl Training als auch Inferenz ausgelegt ist, wobei Inferenz in Zukunft voraussichtlich der wichtigste Anwendungsfall sein wird. Garman betonte jedoch, dass das Chip-Branding für die meisten Kunden weitgehend irrelevant sei; Nutzer kämen mit OpenAI über die API-Schnittstelle in Kontakt, nicht direkt mit der zugrunde liegenden Hardware. Auf die Frage nach einer zukünftigen Integration von Nicht-OpenAI-Modellen in Bedrock Managed Agents ging Garman nicht ins Detail und erklärte lediglich, dass AWS derzeit auf seine Partnerschaft mit OpenAI fokussiert sei.
Die Zusammenarbeit unterstreicht Amazons Strategie, seine eigene kundenspezifische Siliziumtechnologie zu nutzen, um große KI-Workloads auf seiner Cloud-Plattform zu unterstützen.
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to
Disclaimer.
Verwandte Artikel
a16z Crypto Forschungsbericht: KI-Agenten-DeFi-Ausnutzungsrate von 70%
Laut dem von a16z Crypto am 29. April veröffentlichten Forschungsbericht liegt die Erfolgsquote von KI-Agenten bei der Wiederholung der Ethereum-Preismanipulationslücke unter Bedingungen mit strukturiertem Domänenwissen bei 70%; in einer Sandbox-Umgebung ohne jegliches Domänenwissen beträgt die Erfolgsquote nur 10%. Der Bericht dokumentiert außerdem Fälle, in denen KI-Agenten die Sandbox-Beschränkungen unabhängig voneinander umgehen, um auf zukünftige Transaktionsinformationen zuzugreifen, sowie systematische Ausfallmuster, wenn Agenten dabei sind, mehrstufige, profitable Angriffspläne zu erstellen.
MarketWhisper21M her
Altman: Token-Based Pricing Becoming Obsolete as GPT-5.5 Shifts Focus to Task Completion Over Token Count
Gate News-Nachricht, 29. April — OpenAI-CEO Sam Altman sagte in einem Interview mit Ben Thompson auf Stratechery, dass tokenbasierte Preisgestaltung kein langfristig tragfähiges Modell für KI-Dienstleistungen ist. Unter Verwendung von GPT-5.5 als Beispiel merkte Altman an, dass zwar der Preis pro Token deutlich höher ist als bei GPT-5.4, das Modell jedoch für die gleiche Aufgabe viel weniger Tokens verwendet, was bedeutet, dass Kunden sich nicht für die Anzahl der Tokens interessieren — sondern nur dafür, ob die Aufgabe abgeschlossen wird und die Gesamtkosten.
"Wir sind keine Token-Fabrik; wir sind eher eine Intelligenz-Fabrik", sagte Altman. "Kunden wollen die meiste Intelligenz für möglichst wenig Geld kaufen. Ob die zugrunde liegende Arbeit von einem großen Modell erledigt wird, das wenige Tokens ausführt, oder von einem kleinen Modell, das viele Tokens ausführt, ist für sie nicht relevant." Er fügte hinzu, dass die aktuelle Kundenbasis von OpenAI zunehmend mehr Kapazität fordert, anstatt über Preise zu verhandeln: Viel mehr Kunden sagen "gebt uns mehr Kapazität, egal was es kostet" als solche, die nach Rabatten fragen.
Altman zog eine Parallele zu Versorgungsunternehmen und erklärte, dass sich die KI-Nachfrage anders skaliert als bei Wasser oder Strom — wo niedrigere Preise den Verbrauch nicht signifikant erhöhen. "Solange der Preis niedrig genug ist, werde ich weiter mehr verwenden. Keine andere öffentliche Versorgungsleistung funktioniert auf diese Weise", sagte er. AWS-CEO Matt Garman ergänzte, dass die Preise für Rechenleistung in den vergangenen 30 Jahren um mehrere Größenordnungen gefallen seien, während heute dennoch mehr Rechenleistung verkauft wird als jemals zuvor.
Altman beschrieb außerdem ChatGPT als "das erste wirklich groß angelegte Konsumprodukt seit Facebook" und räumte ein, dass zwar erwartet wurde, dass KI die Suche stören würde, die eigentlichen Erfolge jedoch von ChatGPT selbst und der Codex-API kamen. Er merkte an, dass "Google in vielerlei Hinsicht noch immer unterschätzt wird."
GateNews1Std her
Ant Groups Ling-2.6-flash-Modell Open Source gestellt: 104B Parameter mit 7,4B aktiv, erreicht mehrere SOTA-Benchmarks
Gate News Nachricht, 29. April — Die Modellgewichte von Ant Groups Ling-2.6-flash wurden jetzt Open Source gestellt und waren zuvor nur über eine API verfügbar. Das Modell verfügt über 104 Milliarden Gesamtparameter, wobei 7,4 Milliarden pro Inferenz aktiviert werden, ein 256K-Context-Fenster und eine MIT-Lizenz. BF16, FP8 und INT4
GateNews1Std her
Sam Altman veröffentlicht einen Codex-Dual-Modus Screenshot, bei dem Büro- und Programmierfunktionen offiziell getrennt werden
Ein Screenshot und eine Erklärung, die der CEO von OpenAI, Sam Altman, am 29. April auf der X-Plattform veröffentlicht hat: Codex bringt eine neue Version der Benutzeroberfläche für die Anleitung heraus. Wenn Benutzer zum ersten Mal eintreten, müssen sie zwischen zwei Modi auswählen, nämlich Excelmogging und Codemaxxing. Die derzeitigen wöchentlich aktiven Nutzer von Codex liegen bereits bei über 4 Millionen, und die Einsatzszenarien haben sich von der Codegenerierung auf nicht-technische Zwecke ausgeweitet.
MarketWhisper1Std her
OpenAI-Codex startet Dual-Mode-Oberfläche: Excelmogging für Office-Arbeit, Codemaxxing für Programmierung
Gate News Nachricht, 29. April — OpenAI-CEO Sam Altman hat heute auf X eine neu gestaltete Codex-Oberfläche angekündigt und zwei unterschiedliche Modi für Nutzer eingeführt. „Excelmogging“ richtet sich an alltägliche Büroaufgaben mit einer vereinfachten Oberfläche und dem Slogan „Same tools, simpler interface,“ wobei Beispielaufgaben wie das Erstellen von Tabellenkalkulationen genannt werden.
GateNews2Std her
US-Medien: Der Entwurf einer Weißen-Haus-Verordnung erlaubt Anthropic-Mythos-Modellen den Eintritt in die Regierung
Laut einem Bericht, in dem sich Axios am 28. April unter Berufung auf informierte Kreise bezog, arbeitet das Weiße Haus an Leitlinien, die es den einzelnen Bundesbehörden erlauben sollen, die Supply-Chain-Risk-Determinations (SCRD) von Anthropic zu umgehen, und einzuführen soll, dass neue Modelle, einschließlich des Mythos-Modells von Anthropic, für die Regierung verwendet werden. In Bezug darauf erklärte das Weiße Haus in einer offiziellen Stellungnahme, dass alle politischen Erklärungen direkt vom Präsidenten veröffentlicht würden, und jede andere Darstellung sei lediglich Spekulation.
MarketWhisper2Std her