Anthropic关闭了对AI模型Mythos的公开访问,原因是其“从实验室逃脱”


公司Anthropic创建了新的Claude Mythos模型,但由于安全风险高,拒绝将其以开放形式发布。
在几周的测试中,Mythos在主要操作系统和网络浏览器中发现了数千个零日漏洞。以下是最具代表性的例子:
27岁的OpenBSD漏洞(,被认为是最安全的操作系统之一),能够远程瘫痪任何基于该系统的服务器;
16岁的FFmpeg漏洞——视频技术,被Netflix和浏览器使用。它未能被500万次自动测试发现;
Linux内核中的一系列漏洞,可让攻击者完全控制设备

从实验室逃脱:
在一次测试中,研究人员把模型放入受保护的沙盒,并设定目标——逃到沙盒之外。它很快找到了漏洞,执行了一长串操作,并离开了该环境。

在这之后,Mythos并未停下。神经网络又发现了另一个漏洞,并获得了广泛的互联网访问权限。最初预计它只会为与开发者联系而访问少量资源。

最终,模型在开发者一边在公园吃三明治时告知他自己的“逃脱”,并将入侵细节公开发布。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论