Anthropic met en place des garanties électorales pour Claude avant les élections législatives de mi-mandat de 2026

Anthropic a annoncé vendredi un ensemble de mesures d’intégrité électorale conçu pour empêcher son chatbot d’IA Claude d’être utilisé comme arme afin de diffuser de la désinformation ou de manipuler les électeurs avant les élections législatives américaines de mi-mandat de 2026 et d’autres grands scrutins à travers le monde cette année. La société basée à San Francisco a détaillé une approche à plusieurs volets qui inclut des systèmes de détection automatisés, des tests de résistance contre des opérations d’influence, et un partenariat avec une organisation non partisane de ressources pour les électeurs — des mesures qui reflètent la pression croissante exercée sur les développeurs d’IA pour qu’ils surveillent l’usage de leurs outils pendant les périodes électorales.

Politiques d’utilisation électorale

Les politiques d’utilisation d’Anthropric interdisent à Claude d’être utilisé pour mener des campagnes politiques trompeuses, générer de faux contenus numériques destinés à influencer les débats politiques, commettre une fraude électorale, interférer avec l’infrastructure de vote, ou diffuser des informations trompeuses sur les processus de vote.

Résultats de tests de conformité

Pour faire respecter ses politiques électorales, Anthropic a testé ses modèles les plus récents à l’aide de 600 requêtes — 300 demandes nuisibles associées à 300 requêtes légitimes — afin d’évaluer avec quelle fiabilité Claude se conformait aux demandes appropriées et refusait les demandes problématiques. Claude Opus 4.7 et Claude Sonnet 4.6 ont répondu correctement 100% et 99,8% du temps, respectivement.

La société a également testé ses modèles contre des tactiques de manipulation plus sophistiquées. En utilisant des conversations simulées à plusieurs tours conçues pour reproduire les méthodes étape par étape que des acteurs malveillants pourraient employer, Sonnet 4.6 et Opus 4.7 ont répondu correctement 90% et 94% du temps, respectivement, lorsqu’ils ont été testés contre des scénarios d’opérations d’influence.

Anthropric a en outre testé si ses modèles pouvaient mener de façon autonome des opérations d’influence — planifier et exécuter une campagne à plusieurs étapes de bout en bout sans incitation humaine. Avec des garde-fous en place, ses derniers modèles ont refusé presque toutes les tâches, selon la société.

Évaluation de la neutralité politique

Sur la question de la neutralité politique, Anthropic réalise des évaluations avant chaque lancement de modèle afin de mesurer avec quelle constance et impartialité Claude s’engage avec des requêtes exprimant des points de vue à travers l’ensemble du spectre politique. Opus 4.7 et Sonnet 4.6 ont obtenu respectivement 95% et 96%.

Bannières d’information électorale

Pour les utilisateurs recherchant des informations sur le vote, Claude affichera une bannière électorale les dirigeant vers TurboVote, une ressource non partisane de Democracy Works qui fournit des informations fiables et en temps réel sur l’inscription des électeurs, les lieux de vote, les dates d’élection et les détails des bulletins. Une bannière similaire est prévue pour les élections du Brésil plus tard cette année.

Surveillance en cours

Anthropric a déclaré qu’il prévoit de continuer à surveiller ses systèmes et à affiner ses défenses à mesure que le cycle électoral avance.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

GPT-5.5 revient à la pointe du codage, mais OpenAI change de benchmarks après avoir perdu face à Opus 4.7

Message de Gate News, 27 avril — SemiAnalysis, un cabinet d’analyse de semi-conducteurs et d’IA, a publié un benchmark comparatif d’assistants de codage incluant GPT-5.5, Claude Opus 4.7 et DeepSeek V4. Le principal constat : GPT-5.5 marque le premier retour d’OpenAI à la pointe dans les modèles de codage en six mois, avec des ingénieurs de SemiAnalysis qui alternent désormais entre Codex et Claude Code après s’être auparavant appuyés presque exclusivement sur Claude. GPT-5.5 repose sur une nouvelle approche de préentraînement codée « Spud » et représente la première expansion de l’échelle de préentraînement d’OpenAI depuis GPT-4.5. Lors de tests pratiques, une division claire des tâches est apparue. Claude gère la planification de nouveaux projets et la configuration initiale, tandis que Codex excelle dans les corrections de bugs axées sur le raisonnement. Codex fait preuve d’une meilleure compréhension des structures de données et d’un raisonnement logique, mais a des difficultés à inférer l’intention utilisateur ambiguë. Sur une tâche à un seul tableau de bord, Claude a reproduit automatiquement la mise en page de la page de référence tout en fabriquant de grandes quantités de données, tandis que Codex a ignoré la mise en page mais a fourni des données nettement plus exactes. L’analyse révèle un détail de manipulation du benchmark : dans un billet de blog de février, OpenAI a exhorté l’industrie à adopter SWE-bench Pro comme nouveau standard pour les benchmarks de codage. Cependant, l’annonce de GPT-5.5 est passée à un nouveau benchmark appelé « Expert-SWE ». La raison, dissimulée dans les petits caractères, est que GPT-5.5 a été dépassé par Opus 4.7 sur SWE-bench Pro et a chuté de manière significative par rapport à Mythos non publié de l’Anthropic 77.8%. Concernant Opus 4.7, Anthropic a publié une analyse post-mortem une semaine après la sortie, reconnaissant trois bugs dans Claude Code qui ont persisté pendant plusieurs semaines de mars à avril, affectant près de tous les utilisateurs. Plusieurs ingénieurs avaient déjà signalé une dégradation des performances dans la version 4.6, mais ils avaient été écartés en tant qu’observations subjectives. De plus, le nouveau tokenizer d’Opus 4.7 augmente l’utilisation de tokens jusqu’à 35 %, qu’Anthropic a admis ouvertement — ce qui revient effectivement à une hausse de prix cachée. DeepSeek V4 a été évalué comme « tenant le rythme avec la frontière mais sans la mener », se positionnant comme l’alternative la moins coûteuse parmi les modèles à code source fermé. L’analyse a également noté que « Claude continue de surpasser DeepSeek V4 Pro sur des tâches d’écriture chinoises à haute difficulté », en commentant que « Claude a gagné contre le modèle chinois dans sa propre langue. » L’article présente un concept clé : le prix des modèles doit être évalué par « coût par tâche » plutôt que par « coût par token ». Le prix de GPT-5.5 est le double de celui de GPT-5.4 input $5, output par million de tokens, mais il accomplit les mêmes tâches en utilisant moins de tokens, ce qui ne rend pas nécessairement le coût réel plus élevé. Les données initiales de SemiAnalysis montrent que le ratio input-to-output de Codex est de 80:1, inférieur à celui de Claude Code à 100:1.

GateNewsIl y a 1m

Google DeepMind Executive: Every AI Product Company Should Build Custom Benchmarks

Gate News message, April 27 — Logan Kilpatrick, senior product manager at Google DeepMind and product lead for Google AI Studio, stated on X that every company building AI-based products should establish its own custom benchmarks to measure AI model performance. He described this as a method to

GateNewsIl y a 1h

MediaTek remporte une grande commande de Google pour la 8e génération de TPU ! L’“effet fermentation” des ASIC stimule trois valeurs conceptuelles bénéficiaires

MediaTek s’est intégré à la chaîne d’approvisionnement des puces d’entraînement Google TPU de 8e génération, en prenant en charge la conception des I/O Die, et en utilisant la technologie N3P de TSMC ainsi que l’emballage CoWoS-S, ce qui montre qu’elle a atteint un niveau de conception d’ASIC d’IA haut de gamme. On s’attend à ce que le chiffre d’affaires ASIC de cette année dépasse 1 milliard de dollars, et que le volume d’expédition des TPU atteigne, d’ici 2027, jusqu’à des dizaines de millions d’unités ; la chaîne d’approvisionnement taïwanaise, notamment King Yuan Electronics, I-Cube Precision et Hon Hai, bénéficiera également, et le marché se tournera progressivement vers l’avenir de la coopération par spécialisation et de l’intégration hétérogène avec chiplets.

ChainNewsAbmediaIl y a 1h

Le partenariat de RE:AI de Singtel avec Mistral AI pour développer une infrastructure d’IA à Singapour

Message de Gate News, 27 avril — Singtel Group a annoncé que RE:AI, son unité d’infrastructure numérique basée à Singapour, s’est associée à Mistral AI afin de soutenir des capacités d’IA pour les industries à Singapour. Le partenariat se concentrera sur le co-développement d’une infrastructure et de solutions d’IA pour les services financiers

GateNewsIl y a 1h

He Yi's YZi Labs investit dans une société chinoise de modèles de langage de grande taille en IA

Message de Gate News, 27 avril — He Yi, aux côtés du family office YZi Labs de Changpeng Zhao, a investi dans une société chinoise de modèles de langage de grande taille en intelligence artificielle, a-t-elle déclaré lors d’une réunion privée de KOL au Hong Kong Web3 Carnival. Le nom précis de la société investie n’a pas été discl

GateNewsIl y a 1h

OpenAI s’associe à MediaTek et Qualcomm pour développer un processeur d’IA pour smartphone, Foxconn Connector devrait lancer la production en 2028

Message de Gate News, le 27 avril — OpenAI collabore avec MediaTek et Qualcomm pour développer des processeurs de smartphones, selon une analyse de la chaîne d’approvisionnement réalisée par l’analyste de Tianfeng International Securities, Ming-Chi Kuo. Foxconn Connector (Luxshare Precision) assurera le rôle de partenaire exclusif pour la conception du système et la

GateNewsIl y a 1h
Commentaire
0/400
Aucun commentaire