个人电脑迎来革命?

 2026年6月1日,英伟达在台北进行了新一场重要的GTC。

在这次GTC中,英伟达推出和更新了很多产品,透露了很多关键进度,比如包括为基础设施建设者提供创建AI工厂的完整方案的DSX平台,透露了Vera Rubin开始顺利量产,此外英伟达利用Omniverse + Cosmos + 合成数据管线来补现实数据,继续推进Isaac生态为机器人提供基础模型、仿真训练和整个边缘计算平台;英伟达的Alpamayo/DRIVE Hyperion为自动驾驶推理与车端平台,覆盖全球80%的新车。

但这次GTC最引人关注的产品是一块给PC用的SoC,一款名为RTX SPARK的芯片,过去英伟达只给个人电脑做显卡,现在则是完全以整个平台迈向PC领域,也宣告了端侧AI时代的到来。

一、端侧AI是什么
端侧AI指的就是在本地跑的AI,当你部署一个开源大模型后,哪怕不联网它都能持续为你工作。
现在越来越多开源大模型能力进步也很快,而且参数规模选项很多(例如Qwen和DeepSeek),用户可以将高难度高要求或是整体规划性的任务交给GPT或Claude,而更简单更具体但工作量较大的任务交给本地开源模型 - 这样可以节省大量的token成本,毕竟本地推理等于是买断了token,只需要用一点电而已。
现在我们获取AI算力的主要途径都是通过数据中心,无论是AWS、Azure、GCP还是其他neocloud,他们买来大量GPU组成数据中心,然后将算力出租给客户,这些客户包括OpenAI和Anthropic这样的前沿大模型巨头,也包括无数需要直接调用云上算力的中小型公司。

我们在往期主题就苹果在AI时代的优势谈过端侧(本地)AI算力 - 现在我们大多数人用的AI,都是基于云上的服务,例如使用ChatGPT、Claude、豆包等平台,这种用法的优势在于随时随地使用、模型强大,劣势在于如果需要有生产力级别的使用,那么以下三个典型的问题至少会遇到一个:


(1)算力不足 - 这是最常见的瓶颈,导致用户不得不付费或排队等候任务完成;


(2)延时过长 - 考虑到云上服务不在本地,有时候无法满足需要某些对延时要求特别高的工作;


(3)安全性隐患 - 所有交互和信息都与平台联网,万一出现安全漏洞,后果不堪设想,因此总有一些关系到资金和隐私的场景对于本地大模型部署存在强烈需求。


未来的token会来自于两个来源:一是庞大的数据中心,二是全球以十亿计的大量本地设备。
英伟达已经狠狠吃到了数据中心的红利,当然也不会放任端侧AI市场不管。

二、英伟达台北GTC的重点

这次GTC上,老黄说要和微软一起,用他们的AI PC,重构40年来个人电脑的生态....所以这次英伟达发布RTX SPARK芯片(也就是之前市场传闻的N1/N1X)。


这张SoC拥有6144 CUDA核以及20核Grace CPU;算力1 Petaflop,最多128GB统一内存、通过NVLink实现600GB/S带宽,支持本地运行120B参数大模型,上下文达100万token,适配Hermes Agent、OpenClaw,而且3A光追游戏1440p超100帧,支持DLSS 4.5。

当我看到英伟达这块SoC的时候,脑子里第一个想到的就是苹果的M系列芯片,真的太像了,参数(例如最大内存和带宽)和M5 MAX也差不多。它们会长得这么像,是因为它们都在往同一个高性能PC SoC方向收敛,即大GPU + Arm CPU + NPU/AI单元 + 大片共享内存 + 超宽片上互连。

这种设计的趋同是必然,因为大模型在本地推理时,权重必须全部常驻显存,推理时GPU每生成一个token,都要把整个模型的权重读一遍。所以显存的大小非常重要,决定了本地能跑多大参数的大模型。

当下最强的消费级显卡5090市场价在4000-5000美元,提供了32G GDDR7显存,还给到了1.79TB/s的超强带宽,但即使是5090也无法部署一千亿(100B)参数以上的大模型,因为显存只有32G。

作为对比在与5090差不多的开支下,我们可以拿下一台搭载M5 Max、128GB统一内存、2TB储存的14英寸Macbook Pro,它可以比5090部署要大很多的模型。

所以,英伟达也是意识到了苹果在端侧AI市场的竞争力,和苹果一样采取统一内存架构(显存共享内存),空前增加端侧AI能力,更重要的是发挥英伟达生态优势 - CUDA生态内的各种推理/训练优化工具都优先围绕 英伟达GPU打磨,对于模型开发、推理、微调有对手难以比拟的优势。

这次英伟达挑战了两方对手,一方是x86阵营的AMD和Intel,另一方是苹果,苹果在端侧AI能做的,英伟达做的更好了。

当然,PC和数据中心的逻辑还是有些不同,PC在高性能的同时比数据中心更加在意能效,苹果在这方面的能力是多年来扎扎实实积累和验证出来的,而且苹果将软硬结合的生态优势发挥和优化到了极致。搭载英伟达这个SoC的AI PC实际表现如何,还需要市场的验证,我们可以期待不久后真机的评测。


三、ARM与x86的对决
从6月1日的美股表现来看,市场是相信英伟达能够吃下相当一部分PC份额的,因为英特尔、AMD以及苹果下跌,同时英伟达、微软大涨,而ARM更是暴涨16%。
之所以ARM受益最大,要从ARM和x86的竞争说起。
x86和ARM是两种架构,最开始x86服务于电脑,ARM则服务于移动设备,因为各自的特点不同。

x86以性能优先,主要用于台式机、笔记本电脑、服务器。因为插电、散热空间大,所以可以用更复杂的核心、更高频率和更大功耗来获得足够性能。

而ARM功耗优先,因为它主要用于手机、平板等设备,它们普遍电池小、散热差,所以必须省电。 

但伴随手机市场十几年疯狂卷出来的芯片设计能力,逼出来了超高的每瓦性能,最终在2020年诞生了M1这样的性能强劲且能耗极低的恐怖选手。

而对于x86来说,要降到ARM那种同体验下的超低功耗难度比arm补性能更大,因为它背着更重的历史包袱,x86要兼容几十年的旧软件、旧指令、旧模式,CPU前端解码更复杂。

另外ARM架构也特别擅长把CPU、GPU、NPU、视频编解码、内存控制、电源管理一起做成高度集成的SoC,这样可以把能效做到非常高。

尽管ARM在性能上已经赶上甚至反超x86,同时又有明显的功耗优势,但真正做好ARM桌面设备的只有苹果一家。苹果做得再好,桌面生态早已被Windows牢牢占据,mac再强也还是因为生态的封闭性和Windows广阔的用户基础成为相对小众的选择。

如今英伟达基于ARM架构的芯片携手Windows以AI能力为卖点强势进场,有利于ARM在桌面市场大规模攻城略地。

四、对微软意味着什么

Windows一度是和x86紧密绑定的,直到2012年的Windows RT在ARM设备上推出,而能跑传统应用的Windows on Arm则是到了2017年的Windows 10 on ARM才开始成形。

从那时起,高通几乎是Windows on Arm的唯一SoC供应商,缺少竞争,性能和功耗也不够亮眼,联想、戴尔、惠普等OEM在这种基础上能做出来的差异化产品空间非常小,开发者也缺少一种Windows on ARM会成为大市场的信号。

但现在英伟达这样一个强势者入局,Windows on ARM不仅仅只是代表一种低功耗弱性能的选项,而是一个超强的端侧AI算力中心和Mac比,未来英伟达的Windows AI电脑最大的优势会是AI开发和GPU生态:CUDA、PyTorch/TensorRT、RTX图形和大量开发者工具更成熟,做本地模型微调、推理、3D生成、游戏AI会非常有优势。


早在2023年10月时就有报道称,英伟达悄悄开始设计能运行Windows、采用ARM技术的CPU,到如今正式亮相,双方合作打磨了近三年,下一步微软也将推出支持本地AI agent任务的软件,非常值得期待。

在强劲的端侧AI需求的推动下,结合英伟达优异的芯片,无论是微软、各家OEM以及各大软件开发公司,都会开始非常认真地对待Windows on ARM这个生态。在GTC上我们看到多个全球主流OEM厂商已经加入英伟达,我们很快就会看到英伟达电脑的面世,Windows on ARM也很有希望成为真正好用的甚至是生产力级别的生态。


说到微软,最近美国软件行业终于爆发了,我始终相信有相当一部分软件是可以得到AI加持的,再结合它们已经被打压后的低估值,这里是有非常大的机会的。我很高兴在两周多以前就分享了微软和ServiceNow的机会,图为发布于5月16日的部分星球订阅内容↓ 


另外,近期仍有无数读者对港卡、海外投资等话题的疑惑和焦虑感非常强,我也在星球从头到尾分享了观点和应对措施,感兴趣的朋友,欢迎扫文末二维码加入↓






评论