Gate News Mitteilung, 24. April — OpenAI-Ingenieur Clive Chan hat detaillierte Einwände gegen das Kapitel mit den Hardware-Empfehlungen im technischen V4-Bericht erhoben und es im Vergleich zur vielgepriesenen V3-Version als “überraschend mittelmäßig und fehleranfällig” bezeichnet. Die Hardware-Anleitung von V3, die Q&A-Sessions umfasste, die zum beliebtesten Diskussionsthema auf der ISCA-Fachkonferenz wurden, bot spezifische Empfehlungen, die mit den Industriestandards für Interconnects übereinstimmen. V4 hingegen ist weitaus unbestimmter.

Chan stellte systematisch drei zentrale Empfehlungen infrage. Zum Stromverbrauch schlägt der Bericht vor, dass Software-Optimierungen es ermöglichen, dass Chips Rechnen, Speicher und Kommunikation gleichzeitig in voller Kapazität betreiben, und empfiehlt, dass Chiphersteller zusätzlichen Strom-Headroom einplanen. Chan argumentiert, dass das kontraproduktiv ist: Die gesamte Chip-Leistung ist durch physikalische Prozessgrenzen begrenzt, sodass das Zurückhalten von mehr Leistungsreserve nur die Betriebsfrequenz verringert und letztlich die Rechenleistung senkt. In Bezug auf den GPU-zu-GPU-Datentransfer befürwortet der Bericht ein Pull-Modell — bei dem GPUs Daten aktiv abrufen — statt eines Push-Modells und verweist auf den hohen Benachrichtigungsaufwand bei Push-Operationen. Chan bestreitet dies und führt aus, dass Pull tatsächlich langsamer sei und dass verbesserte Fähigkeiten der Netzwerkadapter vorzuziehen wären. Allerdings könnten sich die beiden über unterschiedliche Ebenen des Problems unterhalten: Der Bericht behandelt den Overhead des Benachrichtigungsmechanismus, während Chan sich auf die Übertragungsverzögerung selbst bezieht.

Bei Aktivierungsfunktionen empfiehlt der Bericht, SwiGLU durch einfachere Funktionen zu ersetzen, um die Rechenlast zu reduzieren. Chan sieht darin keinen Nutzen und weist darauf hin, dass Sonic MoE bereits mit SwiGLU die optimale Leistung gezeigt hat. Chan vermutet, dass DeepSeek diesen Abschnitt “absichtlich abgeschwächt” haben könnte.

View Source

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

DeepSeek V4-Flash steigt auf Ollama Cloud, US-Server: Claude Code, OpenClaw mit Ein-Klick-Verbindung

AI Industry News AI Tools & Apps

Ollama Cloud hat DeepSeek V4-Flash veröffentlicht. Die Inferenz läuft auf Servern in den USA und bietet drei Sätze mit One-Click-Befehlen zur Anbindung von Claude Code, OpenClaw und Hermes. V4-Flash/V4-Pro verwenden eine MoE-Architektur, unterstützen nativen 1M-Kontext und senken die Kosten durch tokenweises Komprimieren + DSA-spärliche Attention. Im 1M-Szenario sinken die FLOPs pro Token um 27% und der KV-Cache um 10%. Die API ist kompatibel mit OpenAI ChatCompletions und Anthropic, sodass sich Workflows bequem zwischen verschiedenen Abläufen umschalten lassen, während Kosten und Risiken der Datenhoheit reduziert werden.

ChainNewsAbmedia1Std her

Web3-KI-Infrastruktur AIW3 nimmt $2M in Seed-Finanzierung auf, angeführt von Buffalo Capital

AI Agent AI Industry News

Gate News-Mitteilung, 24. April — Die Web3-KI-Infrastrukturplattform AIW3 hat den Abschluss einer $2 Millionen Seed-Rundenfinanzierung bekannt gegeben. Die Runde wurde von Buffalo Capital geleitet, wobei GalaXin Capital und Three-stones Ventures als Co-Investoren teilnahmen. AIW3 wechselt hin zu einem Agent-as-a-Service

GateNews1Std her

Cohere übernimmt deutsches KI-Unternehmen Aleph Alpha und sichert $600M Investment für die europäische Expansion

AI Industry News

Gate-News-Meldung, 24. April – Der kanadische KI-Konzern Cohere gab Pläne bekannt, das deutsche KI-Unternehmen Aleph Alpha zu übernehmen, um seine Präsenz in Europa zu stärken. Schwarz Group, ein Unterstützer von Aleph Alpha, plant, $600 Millionen in Cohere's Series-E-Finanzierungsrunde zu investieren. Die Finanzierungsrunde wird voraussichtlich bis 202

GateNews2Std her

Xpeng und Xiaomi führen den Vorstoß bei In-Car-KI auf der Beijing Auto Show an

AI Industry News

Gate-News-Meldung, 24. April — Chinesische Autohersteller präsentierten am 24. April auf der Beijing Auto Show fortschrittliche In-Car-KI-Systeme, während das Land seine AI-Plus-Strategie beschleunigt und eine größere Unabhängigkeit von ausländischen Halbleitern anstrebt. Xpeng zeigte sprachgesteuertes Parken, das es Fahrern ermöglicht, „

GateNews3Std her

Ehemaliger ByteDance-Seed-Ingenieur: ByteDance-AI-Iteration dauert sechs Monate, während es bei Google drei Monate sind

AI Industry News

Gate-News-Meldung, 24. April — Zhang Chi, ein ehemaliger Ingenieur im Seed-Team von ByteDance und derzeit Assistenzprofessor an der Peking-Universität, gab in dem Podcast „Into Asia“ bekannt, dass ByteDance ungefähr sechs Monate benötigt, um einen vollständigen Zyklus des Trainings großer Sprachmodelle (pretraining abzuschließen, plus Post-Training, während Google Berichten zufolge nur drei Monate braucht. Zhang führte den Geschwindigkeitsunterschied als einen zentralen Grund dafür an, warum chinesische Unternehmen bei der Entwicklung von KI nur schwer aufholen können.

GateNews3Std her

Naver startet AI-Tab-Beta, während Google Gemini in den Suchmarkt Südkoreas eintritt

AI Industry News

Gate-News-Meldung, 24. April — Naver gab den Start eines geschlossenen Betatests für AI Tab bekannt, seiner neuen konversationellen Suchfunktion, nachdem Google Gemini in Chrome in Südkorea eingeführt hat. AI Tab wird neben den bestehenden Such-Tabs von Naver erscheinen und Nutzern einen eigenen Bereich für konversationelle

GateNews4Std her

Kommentieren

0/400

Keine Kommentare