Aliclouds Qwen Open-Source stellt das Qwen-Scope Interpretability-Modul bereit und deckt am 30. April 7 Modelle ab

Laut PANews kündigte Qwen von Alibaba am 30. April die Open-Source-Veröffentlichung von Qwen-Scope an, einem Interpretierbarkeits-Modul, das auf Qwen3- und Qwen3.5-Modellen trainiert wurde. Die Veröffentlichung umfasst 7 große Sprachmodelle in Varianten für dichte sowie Mixture-of-Experts-Modelle, mit 14 Sätzen sparsamer Autoencoder-Gewichte.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

DeepSeek führt am 30. April die Methode „Visual Primitives“ ein, um das multimodale Denken zu verbessern

Laut dem technischen Bericht von DeepSeek stellte das Unternehmen am 30. April Visual Primitives vor – eine Methode, die grundlegende visuelle Einheiten wie Punkte und Bounding-Boxes in Denkfolgen einbettet, um das Problem der Referenzlücke (Reference Gap) bei multimedialen Aufgaben anzugehen. Die Methode senkt den Verbrauch von Bild-Tokens.

GateNews14M her

NVIDIA veröffentlicht die Cosmos-Reason2-32B-Flaggschiff-Modellgewichte und erweitert das Kontextfenster auf 256K Tokens

Laut Beating hat NVIDIA die Gewichte für Cosmos-Reason2-32B veröffentlicht, die Flaggschiff-Version seines physischen KI-Reasoning-Vision-Language-Modells (VLM). Es wurde entwickelt, um Robotern und autonomen Fahrsystemen zu helfen, räumliche, zeitliche und physikalische Prinzipien zu verstehen. Das Modell mit 32 Milliarden Parametern,

GateNews17M her

OpenAI deckt auf, warum Codex das Sprechen über „Goblins“ verbietet: Kontrollverlust bei Belohnungen für Nerd-Persönlichkeiten

OpenAI erklärte in einem offiziellen Blogbeitrag, dass Codex Verbote für „Coden-geeignete Goblins“ und andere Kreaturen auf Basis der Belohnungssignal-Präferenz aus dem Training für das Nerd-Persönlichkeitsprofil entstanden seien, was zu einer Verschmutzung zwischen Persönlichkeiten und zu einer RLHF-Fehlleitung geführt habe. Der Vorfall wurde von Barron Roth enthüllt, nachdem Systemanweisungen offenbar geworden waren; OpenAI verfolgte daraufhin zwei Strategien: kurzfristiges Hard-Coding und langfristiges Löschen von Belohnungssignalen. Das Ereignis warnt vor der Anfälligkeit von Belohnungsdesign; das nachgelagerte Training erfordert künftig eine noch präzisere Prüfung und Revision.

ChainNewsAbmedia1Std her

Nvidia B300-KI-Server erreichen in China 1 Million US-Dollar inmitten einer angespannten Lieferlage

Laut Reuters werden Nvidias B300-AI-Server in China inzwischen für ungefähr 7 Millionen Yuan (1 Million US-Dollar) verkauft. Ausschlaggebend sind eine behördliche Durchsuchung von Schmuggelnetzwerken sowie eine weiterhin hohe Nachfrage lokaler Tech-Unternehmen. Der Preis ist von etwa 4 Millionen Yuan (585.000 US-Dollar) Ende 2025 gestiegen und deutlich

GateNews1Std her

Der Betriebsgewinn von LG CNS steigt im 1. Quartal um 19% aufgrund von Wachstum bei KI und Cloud

Laut Chosun Daily meldete LG CNS am 30. April, dass der operative Gewinn im ersten Quartal im Jahresvergleich um 19,4% auf 94,2 Milliarden Won gestiegen ist (64,1 Millionen US-Dollar), angetrieben durch die Nachfrage nach KI und Cloud. Der Umsatz stieg um 8,6% auf 1,3 Billionen Won (894 Millionen US-Dollar). Die KI- und Cloud-Einheit des Unternehmens generierte 765,4 Billionen

GateNews2Std her

OpenAI bringt GPT-5.5-Cyber in den Ring: Wettstreit mit Anthropic Mythos

OpenAI gibt die Einführung von GPT-5.5-Cyber bekannt, das speziell für die Cybersicherheit entwickelt wurde. Es soll innerhalb von „in den nächsten Tagen“ mithilfe eines verlässlichen Zugriffs-Mechanismus im Rahmen von Regierungskooperationen bei wichtigen Verteidigungseinheiten bereitgestellt werden und ist kein offenes Verkaufsangebot. Im Gegensatz zum offenen Pfad von Anthropic Mythos ist das Weiße Haus dagegen, dies auf 70 Unternehmen auszuweiten. Der Preparedness Framework wird als High bewertet (noch nicht critical), während gleichzeitig die Cybersicherheitsmaßnahmen verstärkt werden. Im weiteren Verlauf wird die Einsatzliste beobachtet, ob die CISA möglicherweise aufgenommen wird, und die Unterschiede zwischen den beiden Sicherheitsstandards.

ChainNewsAbmedia3Std her
Kommentieren
0/400
Keine Kommentare