据动察 Beating 监测,Anthropic 联合创始人杰克·克拉克 (Jack Clark) 在牛津大学演讲时警告,人工智能 (AI) 极有可能在 2028 年甚至更早实现「递归自我改进」 (recursive self-improvement)。这意味着大模型将具备无需人类干预、自主升级并制造出更强版本的能力。克拉克直言,当前全球多数人对技术自我进化的速度仍选择否认,甚至 Anthropic 自身也严重低估了技术演进的规模,在面对前沿模型的失控风险时准备不足。
在前沿模型能力方面,克拉克以 2026 年 4 月完成训练的内部模型 Mythos 为例,展现了失控的真实边界。Mythos 具备国家级网络攻防武器的破坏力,因杀伤力过大,公司决定无限期禁止向公众公开发布,仅给极少数机构授权用于软件漏洞修复。克拉克坦言,当 Mythos 完成训练并展示出破坏力时,团队内部极度震惊,惊觉全新模型的到来速度远超预期,前置安全响应工作存在严重漏洞。
在伦敦举办的开发者大会上,Anthropic 则展现出完全相反的商业底色。伴随着高达 9000 亿美元的估值融资传闻,Claude Code 创建者鲍里斯·切尔尼 (Boris Cherny) 在会上积极推广 AI 编程工具。当研究人员现场询问有多少人会在未经任何阅读校验的情况下,直接将 Claude 自动编写的代码部署上线时,会场中有大量开发者举手示意。
币须知道