据动察 Beating 监测,视频生成大模型公司 Sand.ai(成立于 2024 年 1 月)宣布完成两轮合计超亿美元的融资。投资方包括 Look Capital、Lollapalooza Capital(王慧文家办)、九坤创投、经纬创投、和玉资本(MSA Capital)、创新工场、源码资本、IDG、百度风投等多家一线机构。本轮融资由星涵资本担任财务顾问。
Sand.ai 创始人曹越在接受采访时表示,团队一直坚持被视作非共识的自回归(Autoregressive)视频生成路线,而非主流的 Diffusion 路线。其此前发布的 Magi-1 模型在 Google DeepMind 的 Physics-IQ 物理真实性测试榜单中保持第一。
为突破视频生成「成本、速度、效果」的不可能三角,Sand.ai 于去年转向探索 MoE(混合专家)架构,并计划在 2026 年 7 月(Q3)发布新一代采用 MoE 架构的视频生成模型,兼顾高效推理与目前开源领域最大的参数规模,并将该模型开源。
在商业化方面,Sand.ai 采取模型与产品双轮驱动策略。其今年 1 月上线的音乐 Agent 产品 VidMuse,仅用 2 个月已实现 1000 万美元 ARR。此外,其开源的 MagiAttention 算子库已被国内几乎所有多模态模型团队使用,并获得英伟达官方推荐。
针对行业热议的「世界模型」概念,曹越认为其目前仍处于前 GPT 时代(GPT-1 出现之前),数据与路线均未收敛。他指出,视频是走向世界模型最重要的数据模态,应当通过预测视频原始观测数据(Pixels/Frames)来让模型自主习得物理规律,而非引入人类先验去显式建模状态变量。
币须知道