DeepSeek V4 erreicht perfekte Punktzahl bei Putnam-2025 und teilt den ersten Platz mit Axiom in formaler mathematischer Beweisführung

GateNews

2026-04-24 04:49:30

Gate News Nachricht, 24. April — DeepSeek V4 hat Ergebnisse aus formalen mathematischen Schlussfolgerungsbewertungen veröffentlicht und eine perfekte Punktzahl von 120/120 bei Putnam-2025 erreicht, womit es mit Axiom für den ersten Platz gleichzieht.

Im praktischen Regime, das LeanExplore und eingeschränktes Sampling nutzt, erzielte V4-Flash-Max 81,00 auf dem Putnam-200 Pass@8-Benchmark und übertraf damit Seed-2.0-Prover (35.50), Gemini 3 Pro (26.50) und Seed-1.5-Prover (26.50) deutlich. Die Ergebnisse aus dem Frontier-Regime zeigten, dass V4 Seed-1.5-Prover (110/120) und Aristotle (100/120) voraus ist.

V4 nutzt einen hybriden Ansatz aus formaler und informeller Schlussfolgerung: Informelles Reasoning erzeugt Kandidatenlösungen in natürlicher Sprache, die Selbstverifikation filtert die Ergebnisse, und ein formaler Agent vervollständigt die rigorosen Beweise in Lean. Die Ergebnisse aus dem Frontier-Regime nutzten eine groß angelegte rechnerische Skalierung, während die Scores im praktischen Regime die Fähigkeiten bei einer standardmäßigen Bereitstellung besser widerspiegeln.

View Source

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

Das kalifornische Gericht verhandelt Musks Klage gegen OpenAI, der CEO von Microsoft wird vor Gericht aussagen

AI Industry News

Elon Musk hat wegen einer von OpenAI angeblich gebrochenen gemeinnützigen Gründungszusage eine Klage eingereicht; am 27. April wurde in einem kalifornischen Gericht die Auswahl der Geschworenen eingeleitet, die Vorsitzende Richterin ist Yvonne Gonzalez Rogers. Laut Gerichtsunterlagen ist Satya Nadella, der CEO von Microsoft, als Zeuge eingetragen, der während des Verfahrens aussagen soll; bis Mitte Mai soll eine endgültige Entscheidung getroffen werden.

MarketWhisper5M her

Samsung SDS sichert sich die Rechte zum Verkauf von OpenAIs ChatGPT Edu in Südkorea

AI Industry News

Gate-News-Meldung, 27. April — Samsung SDS, die IT-Services-Sparte der Samsung Group, gab bekannt, dass sie die Rechte erworben hat, OpenAIs ChatGPT Edu zu verkaufen. Das Unternehmen führt einen Proof of Concept mit der National Korea Broadcasting and Communications University durch und umfasst dabei rund 90.000 Studierende,

GateNews10M her

Indien startet $650M -KI-Stadtprojekt in Bengaluru mit dem Ziel, bis 2030 25.000 Forschende zu erreichen

AI Agent AI Industry News

Gate News-Meldung, 27. April — Indien entwickelt eine $650 -Millionen-KI-Stadt in Bengaluru. Sie umfasst eine Anlage mit 500.000 Quadratfuß Fläche, die als weltweit erstes physisches Labor für agentische KI dienen soll. Das Projekt bietet 400 Gbps Konnektivität für vier große KI-Cloudanbieter und plant, zu unterstützen

GateNews20M her

Sam Altman skizziert die fünf Betriebsgrundsätze von OpenAI und signalisiert mögliche künftige Einschränkungen der Modellfähigkeiten für die Sicherheit

AI Industry News

Gate-News-Meldung, 27. April — OpenAI-CEO Sam Altman veröffentlichte fünf Betriebsgrundsätze für das Unternehmen unter seiner persönlichen Unterschrift und signalisierte damit, dass OpenAI den Zugang der Nutzer zu den Fähigkeiten des Modells in bestimmten Zeiträumen möglicherweise einschränken könnte, um die Sicherheit zu priorisieren. In der Erklärung beschrieb Altman ein potenzielles zukünftiges Szenario

GateNews1Std her

DeepSeek verzögert V4-Launch zur Optimierung für Huawei-Ascend-Chips

AI Industry News

Gate News Nachricht, 27. April — DeepSeek hat die Veröffentlichung seines V4-Modells verschoben, um seine Software-Stack für Huawei-Ascend-Chips zu optimieren, was Beijings breitere Initiative widerspiegelt, eine inländische KI-Lieferkette aufzubauen, da der Zugang zu fortschrittlichen ausländischen Halbleitern zunehmend eingeschränkt wird. DeepSe

GateNews2Std her

DeepSeek senkt die Input-Cache-Preise auf 1/10 des Startpreises; V4-Pro fällt auf 0,025 Yuan pro Million Tokens

AI Industry News

Gate News-Mitteilung, 26. April — DeepSeek hat die Preise für den Input-Cache über das gesamte Modellportfolio auf ein Zehntel der Startpreise reduziert, mit sofortiger Wirkung. Das V4-Pro-Modell ist für einen begrenzten Zeitraum mit einem 2,5-fachen Rabatt verfügbar, wobei die Aktion bis zum 5. Mai 2026, 23:59 Uhr UTC+8, läuft. Nach beiden

GateNews11Std her

Kommentieren

0/400

Keine Kommentare