5 月 3 日,AI 研究者 Brian Roemmele 披露,其「零人类公司(Zero-Human Company)」已开始部署名为 DPN-LE(Dual Personality Neuron Localization and Editing)的大模型人格编辑技术,用于精确调整 AI Agent 的行为特征。
据介绍,DPN-LE 通过定位大模型 MLP 层中的「人格神经元」,可对「诚实度、创造力、谨慎性、协作性」等特征进行定向增强或削弱。研究称,该方法仅需编辑约 0.5% 神经元,即可在不重新训练模型的情况下,实现对 AI 性格的「外科手术式」调整,同时尽量避免损害核心推理能力。
Roemmele 表示,其公司目前由超过 100 个 AI Agent 组成,企业日常运营几乎完全自动化,因此「人格一致性」成为关键问题。例如:
战略类 Agent 会强化「长期一致性」与「分析诚实性」
财务与风控 Agent 会强化「谨慎」与「精确」
内容类 Agent 会提高「共情能力」与「创造力」
多 Agent 协作层则会增强「合作性」
其称,由于 DPN-LE 属于推理阶段轻量级修改,公司可在数分钟内批量「重塑人格」并部署大量 AI Agent,大幅降低 AI 对齐(Alignment)成本。市场认为,这类「人格可编程化」技术,意味着 AI Agent 正从单纯能力竞争,进一步迈向行为控制与组织治理层面的竞争。
币须知道