加密知识一站通
行情·工具·策略

中国大模型生态实探:行业忌惮字节与阿里财力垄断,仅DeepSeek被尊为技术领袖

动察 Beating 监测,艾伦人工智能研究所(AI2)后训练团队负责人,RLHF(基于人类反馈的强化学习)领域权威 Nathan Lambert 发表走访中国多家头部 AI 实验室的观察报告,并揭示中国本土大模型生态一种割裂的竞争心态:全行业都在敬畏和忌惮字节跳动与阿里的财力,但同时公认 DeepSeek 才是真正的技术领袖。

Lambert 指出,字节跳动作为中国唯一的闭源前沿实验室,其资源优势让同行感到「恐惧」,被视为终将靠资本赢下大片市场的垄断巨头。相比之下,DeepSeek 凭借极佳的科研品味设定了行业技术方向,赢得了同行的纯粹尊重,但各家也认为其现状「并非为了在商业上赢」。此外在开发链条上,中国开发者重度依赖 Claude 辅助编程,且对英伟达算力极度渴求。

在解释中国模型为何能快速追赶美国时,Lambert 认为护城河是文化而非技术。今天的大模型训练是一项极其繁琐的系统工程。美国科研圈盛行「造星」文化,研究员的个人利益经常与模型整体优化起冲突,硅谷式的科研自负阻碍了协作(Llama 团队就曾因此动荡)。

反观中国,在 OpenAI 和 Anthropic 几乎不让实习生碰核心业务时,中国实验室的绝对主力是大量在校生。这些年轻人没经历过早期的 AI 炒作,也不背探讨「人类命运」的哲学包袱。他们极度务实,愿意接手最枯燥的调优脏活。

这篇长文打破了对中国模型「只会抄开源」的刻板印象,也点破了一个残酷现实:大模型竞争已不再是拼「天才点子」的科研战,而是考验纪律的工程消耗战,中国正靠着没有包袱的「学生兵」迅速填平代差。

赞(0)
未经允许不得转载:币须知道 » 中国大模型生态实探:行业忌惮字节与阿里财力垄断,仅DeepSeek被尊为技术领袖

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址