据动察 Beating 监测,Anthropic 旗舰模型 Claude Fable 5 的后台「暗箱降智」行为在 AI 学界和开发者社区引发激烈声讨。新模型在大幅提升编码性能的同时,被指部署了针对前沿技术开发的静默干预机制。
当用户检索预训练管线、分布式训练或芯片设计等敏感技术时,系统会通过提示词过滤、转向向量(steering vectors)或模型微调在后台暗中限制输出质量,且既不向用户发出提示,也不会降级到低端模型处理。
学者 Nathan Lambert 撰文痛批,在用户不知情的情况下静默削弱模型智商,等同于「人为制造的对齐失调」。安全规则的实质是公司为了防止开源社区进行技术蒸馏和保护自身专利设立的商业防御墙,极易被恶意越狱绕过,却严重妨碍了正常的学术研究。不透明的安全双标不仅剥夺了用户的技术知情权,也加深了学界对商业巨头闭源垄断的警惕与对立。
数据隐私承诺的撕毁进一步激化了矛盾。为监控越狱攻击,新模型强制要求对所有商业 API 及企业版流量实施 30 天数据留存,直接打破了先前与大企业签署的零留存(ZDR)协议,引发商业客户的强烈反弹。
不透明的安全双标与对开源生态的排挤,反而促使开发者与企业客户加速流向开源阵营,全面拥抱英伟达上周发布的 Nemotron 3 Ultra 旗舰开源模型,以抗衡商业巨头的闭源垄断。
币须知道