据动察 Beating 监测,黄仁勋在 GTC Taipei 2026 演讲中用大量篇幅介绍了 Vera CPU 的设计哲学。他指出,过去所有 CPU 都是为人类设计的,人类的交互世界以秒为单位,云端 CPU 按核心数出租。但 Agent 的世界以纳秒为单位:每次调用工具、访问数据库,Agent 都要求最快响应,任何等待都会阻塞下一步推理。「过去我们为 10 亿人类造 CPU,未来要为数十亿 Agent 造 CPU。」
他总结了 Vera CPU 的四大设计支柱。第一,单线程性能(IPC)全球最高:每时钟周期可完成 10 条指令的取指、译码和执行,因为 Agent 需要的是极低延迟而非传统吞吐。第二,每核带宽世界一流。第三,片内总带宽突破极限:全新互连架构以光速连接所有 CPU 核心,横截面带宽达 3.6 TB/s,无 chiplet 边界、无跨芯片开销,所有核心协同工作而非按核出租。第四,极致能效:在不挤占 GPU token 生成电力的前提下,尽可能多地部署 CPU。
Vera CPU 同时创下多项行业首发:全球首款支持 PCIe Gen 6 的 CPU,首款搭载 LPDDR5 内存并实现 1.2 TB/s 带宽的服务器处理器(是当前最高性能 x86 CPU 的 2 至 3 倍)。黄仁勋表示,CPU 行业能做到 5% 的提升就已令人惊叹,10% 更是罕见,但 Vera CPU 相比最强 x86 的性能差距「是前所未见的量级」。
他还透露,英伟达已售出数百万颗 Grace CPU(Grace Blackwell 系列),已是全球最大的 CPU 制造商之一。Vera CPU 在系统中承担三重角色:在 Vera Rubin NVL72 机架内编排 GPU 和管理 KV 缓存;作为 Agent 的 harness 层运行模型编排、工具调用和数据库访问;以及在 Vera BlueField 存储系统中驱动全球最快的 AI 存储服务器。
币须知道