Anthropic 在 2026 年中期选举前为 Claude 部署选举保障措施

Crypto Frontier

Anthropic 周五宣布了一系列选举诚信措施,旨在防止其 Claude AI 聊天机器人被武器化,用于在 2026 年美国中期选举以及今年全球其他重大赛事之前传播虚假信息或操纵选民。总部位于旧金山的公司公布了一套多管齐下的方案,其中包括自动化检测系统、针对影响力行动的压力测试,以及与一个非党派选民资源组织的合作——这些举措反映出人们对 AI 开发者在选举季节加强对其工具使用方式进行监管的压力不断加大。

选举使用政策

Anthropric 的使用政策禁止 Claude 被用于运行欺骗性的政治竞选、生成意在影响政治讨论的虚假数字内容、实施选民欺诈、干扰投票基础设施,或传播有关投票流程的误导信息。

合规测试结果

为落实其选举政策,Anthropic 使用 600 个提示测试了其最新模型——其中 300 个是有害请求,与另外 300 个合法请求配对——以衡量 Claude 对恰当请求的遵从程度,以及对有问题请求的拒绝程度。Claude Opus 4.7 和 Claude Sonnet 4.6 分别在 100% 和 99.8% 的时间里作出了适当回应。

该公司还在更复杂的操纵策略下测试了其模型。通过使用多轮模拟对话来复刻不法分子可能采用的逐步方法,在针对影响力行动场景进行测试时,当使用 Sonnet 4.6 和 Opus 4.7 时,分别有 90% 和 94% 的情况作出了适当回应。

Anthropric 还测试了其模型能否自主执行影响力行动——在没有人工提示的情况下,从策划到执行一项多步骤的端到端竞选。该公司表示,在有防护措施的前提下,其最新模型拒绝了几乎所有任务。

政治中立性评估

就政治中立性问题而言,Anthropic 在每次模型发布前都会开展评估,以衡量 Claude 在多大程度上能够一贯且公正地回应来自政治光谱各个方面的观点提示。Opus 4.7 和 Sonnet 4.6 的得分分别为 95% 和 96%。

选举信息横幅

对于寻求投票信息的用户,Claude 将展示一个选举横幅,引导他们前往 TurboVote,这是 Democracy Works 提供的非党派资源,可提供可靠的、实时的有关选民登记、投票地点、选举日期和选票细节的信息。今年晚些时候,还计划为巴西的选举设置类似的横幅。

持续监测

Anthropric 表示,它计划在选举周期推进过程中继续监测其系统,并不断完善其防御措施。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Google DeepMind 高管:每家 AI 产品公司都应构建定制基准

Gate News 消息,4月27日——Google DeepMind 的资深产品经理、Google AI Studio 的产品负责人 Logan Kilpatrick 在 X 上表示,所有构建基于 AI 的产品的公司都应当建立各自的定制基准,用于衡量 AI 模型的性能。他将其描述为一种方法:让模型改进“对贵公司产生不成比例的收益”,并敦促创始人和商业领袖“从明天开始。”

GateNews37 分钟前

联发科拿下 Google 第八代 TPU 大单!ASIC 发酵带动三档概念股受惠

联发科已切入 Google 第8代 TPU 训练晶片供应链,负责 I/O Die 设计,并采用台积电 N3P 与 CoWoS-S 封装,显示其已攀升至高阶 AI ASIC 设计水准。预计今年 ASIC 营收突破 10 亿美元,TPU 出货量至 2027 年有望达千万颗;京元电子、精测、鸿劲等台湾供应链也将受惠,市场逐步转向分工合作与 chiplet、异质整合的未来。

鏈新聞abmedia53 分钟前

Singtel 的 RE:AI 与 Mistral AI 合作开发新加坡的 AI 基础设施

Gate News 消息,4 月 27 日——新加坡电信集团(Singtel Group)宣布,其总部位于新加坡的数字基础设施业务部门 RE:AI 与 Mistral AI 建立合作伙伴关系,以支持新加坡各行业的 AI 能力。 该合作将重点放在共同开发 AI 基础设施和解决方案,为金融服务、医疗保健和政府部门服务,结合 RE:AI 的云能力与 Mistral AI 的开源模型。两家公司计划设立应用型 AI 卓越中心(Applied AI Centre of Excellence),以开发并测试企业用例,包括客户服务和网络运营方面的应用。 RE:AI 作为主权 AI 云平台运作,旨在将数据留在新加坡本地,依托 NVIDIA GB200 NVL72 芯片。Singtel 已经部署了一款名为 Shirley 的 AI 客户服务助理,能够理解包括 Singlish 在内的本地表达。Shirley 在投入运营的前六周内,处理了超过 70,000 个客户案例。

GateNews1小时前

何怡的 YZi Labs 投资中国 AI 大型语言模型公司

Gate News 消息,4 月 27 日——何怡与币安创始人赵长鹏(Changpeng Zhao)的家族办公室 YZi Labs 一起,投资了一家中国人工智能大型语言模型公司,她在香港 Web3 嘉年华的一场私密 KOL 聚会上披露了这一消息。她未披露被投资公司的具体名称。

GateNews1小时前

OpenAI 与联发科和高通合作开发 AI 手机处理器,富士康连接器将于 2028 年开始量产

Gate News 信息,4 月 27 日——据天风国际证券分析师 明-志·郭(Ming-Chi Kuo)的供应链分析,OpenAI 正与联发科和高通合作,开发手机处理器。富士康连接器 (立讯精密) 将担任独家系统设计与

GateNews1小时前

香港上市的 MiniMax-W 跌超 14%,Zhipu 在 DeepSeek 模型发布时跌超 6%

Gate News 消息,4 月 27 日——香港上市的 MiniMax-W 日内下跌超 14%,而 Zhipu 在同一时段内下跌超 6%。 跌势缘于 DeepSeek 于周五发布新模型,并宣布在周六推出限时促销活动

GateNews1小时前
评论
0/400
暂无评论