据动察 Beating 监测,Redis 创始人 Salvatore Sanfilippo 反驳了中国大模型靠蒸馏美国模型变强的说法。他认为,普通 API 只能返回文字答案,拿不到模型生成答案时的概率分布和内部状态,无法靠少量外部调用复制一个前沿模型的核心能力。
大模型真正的逻辑推理和思考能力隐藏在极其复杂的神经网络内部。通过 API 接口,外部用户只能拿到最终的文字答案,却无法获取模型生成答案时的完整思考路径和概率计算过程。这就像是只看几道题的期末考试答案,根本无法倒推出老师脑海中庞大的知识体系。以 DeepSeek 为代表的中国大模型在崛起中依赖数据预训练和强化学习等底层工程的扎实积累,而不是靠走捷径。
学术界将大模型蒸馏细分为依赖概率分布的「软蒸馏」,以及仅依靠文本答案的「硬蒸馏」。软蒸馏本身是常规的后训练手段,而且不能通过 API 调用就轻易实现,当下的争论主要集中在「硬蒸馏」上。大厂极力防范的其实是规避服务条款的 API 滥用,即对手利用越狱和诱导提示,强迫模型外显输出本被产品隐藏的推导草稿、验证步骤与自我纠错过程。这些详细的步骤数据虽然仍是文字形式,并非模型底层的概率分布,但极易帮助竞争对手在强化学习中省去数亿美元的盲目探索成本。大厂难以完全防堵越狱,症结在于输出详细的推导过程是推理模型维持高智能的核心属性,一旦为了防盗而强行屏蔽,模型性能就会严重下降。
大厂急于将服务违约和 API 滥用行为界定为安全层面的「攻击」,深层动因在于版权法律的空白。在目前的法律框架下,AI 生成的文本并不享有版权,大厂无法阻止对手合理使用这些生成的文本作为语料。版权空白导致领跑者在商业上面临「自己承担高昂的强化学习探索成本,却无法阻止对手合法利用数据追赶」的硬伤。因此,大厂倾向于在公关和政策上将竞争行为包装成「蒸馏攻击」,以此寻求道德同情和立法保护,试图维护自身的先发壁垒。
币须知道