加密知识一站通
行情·工具·策略

英国AISI:AI黑客能力每4.7个月翻倍,Claude与GPT-5.5测试指标已「爆表」

动察 Beating 监测,英国人工智能安全研究所(AISI)最新报告指出,AI 自主执行网络安全任务的能力正经历超预期爆发。自 2024 年底以来,AI 能够独立完成的网络任务长度每 4.7 个月就会翻一倍,而近期发布的 Claude Mythos Preview 和 GPT-5.5 甚至直接打穿了这条增长曲线。

为了控制变量,AISI 将单次任务的算力限制在 250 万 token。但在这种人为削弱的条件下,Claude Mythos Preview 和 GPT-5.5 在耗时达 12 小时的最高难度任务中,依然取得了接近 100% 的成功率。报告承认,这两个模型已经触及了现有测试集能衡量能力的上限。

在更贴近实战的企业网络靶场(Cyber Ranges)测试中,AISI 共设置了两个攻击场景。新版 Claude Mythos Preview 首次将这两个靶场全部打通:除了在 The Last Ones 靶场中 10 次成功 6 次,它还成了首个攻破高难度靶场 Cooling Tower 的模型(10 次成功 3 次)。GPT-5.5 也在 The Last Ones 靶场中取得了 10 次尝试成功 3 次的成绩。

前沿模型的网络攻防能力进化已经从「以年计」切换到「以月计」。现有的安全评估体系正被快速击穿,留给企业建立防线的窗口期正在急剧收窄。

赞(0)
未经允许不得转载:币须知道 » 英国AISI:AI黑客能力每4.7个月翻倍,Claude与GPT-5.5测试指标已「爆表」

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址