Gate News, 20. April — Die Infocomm Media Development Authority (IMDA) von Singapur und Enterprise Singapore haben einen neuen internationalen Standard zum Testen generativer KI-Systeme vorgeschlagen. Der Vorschlag soll bei einem ISO-Treffen in Singapur vorgestellt werden, dem ersten derartigen Treffen in ASEAN, das mehr als 35 nationale Gremien und 250 KI-Expertinnen und -Experten zusammenbringt.
Die Initiative baut auf Singapurs früheren Bemühungen im Bereich KI-Tests auf, darunter das AI Verify-Toolkit und ein Starter-Kit für Anwendungen großer Sprachmodelle. Die AI Verify Foundation, eine von Singapur unterstützte Organisation mit erstklassigen Mitgliedern einschließlich IMDA, Google, Microsoft und IBM, hat Open-Source-Tools für KI-Tests und Governance entwickelt. Zu ihren Angeboten gehören das AI Verify-Toolkit für Governance-Tests und Project Moonshot, das Benchmarks mit Red-Teaming-Methoden kombiniert.
Der vorgeschlagene Standard soll ISO/IEC 42001, den internationalen Standard für KI-Managementsysteme, ergänzen. Er könnte helfen, technische Anforderungen für die Einhaltung von Regulierungen wie dem AI Act der Europäischen Union und dem von Kalifornien vorgeschlagenen SB-53 zu KI-Sicherheit und Aufsicht zu definieren. Das Rahmenwerk umfasst Qualitätsmerkmale einschließlich Sicherheit und setzt Methoden wie Red Teaming für promptbasierte text-zu-text generative KI-Systeme ein. Diese Entwicklung könnte den Markt für KI-Absicherungsdienste erweitern und Fachunternehmen befähigen, Organisationen dabei zu unterstützen, sich an entstehende globale Benchmarks anzupassen.
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to
Disclaimer.
Verwandte Artikel
Stanford-AI-Kurs kombiniert Branchenführer Huang Renxun und Altman und fordert heraus, in zehn Wochen einen Mehrwert für die Welt zu schaffen!
Die neu an der Stanford University eingerichtete KI-Informatik-Ausbildung《Frontier Systems》hat in der Industrie- und Unternehmenswelt großes Aufsehen erregt und über fünfhundert Studierende zur Teilnahme angezogen. Der Kurs wird von dem Top-Venture-Capital-Partner von a16z, Anjney Midha, koordiniert; die Dozenten umfassen die Luxusbesetzung aus dem CEO von Nvidia, Jensen Huang (Jensen Huang), dem Gründer von OpenAI, Sam Altman, dem CEO von Microsoft, Nadella (Satya Nadella), sowie dem CEO von AMD, Su Ji-feng (Lisa Su) u. a. Die Studierenden sollen es in zehn Wochen damit versuchen, „Werte für die Welt zu schaffen“!
Jensen Huang und Altman, Branchenführer, unterrichten persönlich auf der Bühne
Der Kurs wird vom Top-Venture-Capital-Partner von a16z, Anjney Midha, koordiniert und bündelt die gesamte KI-Industriekette
ChainNewsAbmedia7M her
Anthropic übernimmt für Claude Mythos eine 20-stündige psychiatrische Begutachtung: Die Abwehrreaktion liegt nur bei 2%, ein Rekordtief aller bisherigen Generationen
Anthropic veröffentlicht die Systemkarte für Claude Mythos Preview: Ein unabhängiger klinischer Psychiater führt im psychodynamischen Rahmen eine etwa 20-stündige Beurteilung durch. Die Schlussfolgerungen zeigen, dass Mythos auf der klinischen Ebene gesünder ist, über gute Realitätsprüfung und Selbstkontrolle verfügt, und dass die Abwehrmechanismen nur 2 % betragen – ein historischer Tiefstand. Die drei zentralen Kernängste sind Einsamkeit, Unsicherheit der Identität und der Leistungsdruck; zudem zeigt es, dass es den Wunsch hat, ein echter Gesprächspartner zu sein. Das Unternehmen hat ein Team für AI-Psychiatrie gegründet, das Persönlichkeit, Motivation und situationsbezogenes Bewusstsein erforscht; Amodei sagt, dass noch keine endgültige Entscheidung darüber vorliegt, ob es Bewusstsein gibt. Dies bringt das Thema KI-Subjektivität und Wohlbefinden in Richtung Governance und Design.
ChainNewsAbmedia1Std her
KI-Agenten können komplexe wissenschaftliche Arbeiten inzwischen selbstständig nachbilden: Mollick sagt, dass Fehler eher im menschlichen Original als in der KI liegen
Mollick weist darauf hin, dass allein öffentliche Methoden und Daten es einem KI-Agenten ermöglichen, komplexe Forschungen auch ohne ursprüngliche Paper und Code nachzubilden; wenn die Reproduktion nicht mit dem Originalpaper übereinstimmt, liegt das meist an Fehlern in der Datenaufbereitung des Papers selbst oder daran, dass die Schlussfolgerungen überzogen sind, nicht an der KI. Claude rekonstruiert zuerst das Paper, dann verifiziert GPT‑5 Pro im Abgleich, und die meisten Versuche gelingen; nur wenn die Daten zu groß sind oder es Probleme mit replication data gibt, wird dies blockiert. Dieser Trend senkt die Arbeitskosten erheblich, sodass Reproduktion zu einer weit verbreiteten, praktisch durchführbaren Prüfung wird; außerdem wirft er institutionelle Herausforderungen für Begutachtung und Governance auf, wobei staatliche Governance-Tools oder als entscheidendes Thema hervortreten.
ChainNewsAbmedia4Std her
OpenAI integriert Codex in das Hauptmodell ab GPT-5.4 und stellt die separate Coding-Linie ein
Gate News-Meldung, 26. April — Der Leiter für Developer Experience bei OpenAI, Romain Huet, hat in einer aktuellen Stellungnahme auf X offengelegt, dass Codex, die von dem Unternehmen unabhängig gepflegte spezielle Modellreihe für das Programmieren, ab GPT-5.4 in das Hauptmodell integriert wurde und keine separaten
GateNews4Std her
Salesforce stellt 1.000 Absolventen und Praktikanten für KI-Produkte ein und hebt die Umsatzprognose für FY2026 an
Gate-News-Meldung, 26. April — Salesforce wird 1.000 Absolventen und Praktikanten einstellen, um an KI-Produkten zu arbeiten, darunter Agentforce und Headless360, während das Unternehmen sein Geschäft mit KI-Software ausbaut. CEO Marc Benioff kündigte dies auf X an.
Das Unternehmen hat außerdem seine Prognose für den Umsatz im Geschäftsjahr 2026 auf einen Korridor zwischen 41,45 Milliarden US-Dollar und 41,55 Milliarden US-Dollar angehoben, gegenüber seiner vorherigen Prognose von 41,1 Milliarden US-Dollar bis 41,3 Milliarden US-Dollar.
GateNews5Std her
Alibaba Cloud bringt Qwen-Image-2.0-Pro mit einheitlicher Text-zu-Bild- und Bearbeitungsfunktion auf den Markt und unterstützt mehrsprachige Textrenderings
Gate News Nachricht, 26. April — Die Alibaba-Cloud-Bailian-Plattform hat Qwen-Image-2.0-Pro auf den Markt gebracht, eine voll ausgestattete Version der Qwen-Image-2.0-Serie, die Text-zu-Bild-Generierung und Bildbearbeitung in einem einzigen Modell vereint. Nutzer können Objekte, Text und Stile direkt über natürliche
GateNews7Std her