加密知识一站通
行情·工具·策略

为AI配专属账号治标不治本,安全沙箱专家批Anthropic破坏问责制

动察 Beating 监测,安全沙箱专家、Cloudflare 首席架构师 Kenton Varda 对 Anthropic 的智能体身份模型提出批评,指出直接给 AI 分配专属账号不仅无法适应庞大的任务规模,更会破坏人类问责机制。

Kenton Varda 认为,新安全架构虽然试图解决多人协作中的凭证越权问题,但在底层设计上存在致命缺陷。智能体在法律和行政上都无法作为责任主体,所有操作权限在本质上必须且只能来源于具体的活人。如果直接给 AI 生成独立的专属账号,当 AI 执行删除数据库等破坏性操作时,系统日志最终只会记录 AI 执行了操作,而无法将操作责任归属到真正下达指令的员工,导致人类问责机制彻底失效。

针对配置独立权限包带来的配置疲劳,Kenton Varda 提倡采用基于能力的安全性模型。系统不应赋予 AI 全局或默认权限,而是将权限作为「能力」动态传递。例如,当员工在对话中向 AI 发送特定文档的链接时,系统会自动用员工本人的凭证复刻出对特定文件的临时只读引用传递给 AI。能力模型不仅能确保 AI 的任何行为都能追溯到具体的发起人,也使低权限员工无法向 AI 传递自身没有的数据库凭证,从而在底层堵死越权隐患。

赞(0)
未经允许不得转载:币须知道 » 为AI配专属账号治标不治本,安全沙箱专家批Anthropic破坏问责制

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址