当前位置：币须知道 > 精选主题 > 时事热门话题 > 正文

英国AISI：AI黑客能力每4.7个月翻倍，Claude与GPT-5.5测试指标已「爆表」

2026-05-14 分类：时事热门话题阅读(46) 评论(0)

据动察 Beating 监测，英国人工智能安全研究所（AISI）最新报告指出，AI 自主执行网络安全任务的能力正经历超预期爆发。自 2024 年底以来，AI 能够独立完成的网络任务长度每 4.7 个月就会翻一倍，而近期发布的 Claude Mythos Preview 和 GPT-5.5 甚至直接打穿了这条增长曲线。

为了控制变量，AISI 将单次任务的算力限制在 250 万 token。但在这种人为削弱的条件下，Claude Mythos Preview 和 GPT-5.5 在耗时达 12 小时的最高难度任务中，依然取得了接近 100% 的成功率。报告承认，这两个模型已经触及了现有测试集能衡量能力的上限。

在更贴近实战的企业网络靶场（Cyber Ranges）测试中，AISI 共设置了两个攻击场景。新版 Claude Mythos Preview 首次将这两个靶场全部打通：除了在 The Last Ones 靶场中 10 次成功 6 次，它还成了首个攻破高难度靶场 Cooling Tower 的模型（10 次成功 3 次）。GPT-5.5 也在 The Last Ones 靶场中取得了 10 次尝试成功 3 次的成绩。

前沿模型的网络攻防能力进化已经从「以年计」切换到「以月计」。现有的安全评估体系正被快速击穿，留给企业建立防线的窗口期正在急剧收窄。

赞(0)

未经允许不得转载：币须知道 » 英国AISI：AI黑客能力每4.7个月翻倍，Claude与GPT-5.5测试指标已「爆表」

相关推荐

评论抢沙发

回顶部