博文

目前显示的是 六月, 2026的博文

个人电脑迎来革命?

图片
  2026年6月1日,英伟达在台北进行了新一场重要的GTC。 在这次GTC中,英伟达推出和更新了很多产品,透露了很多关键进度,比如包括 为基础设施建设者提供创建 AI 工厂的完整方案的DSX 平台,透露了Vera Rubin 开始顺利量产,此外英伟达利用Omniverse + Cosmos +  合成数据管线来补现实数据,继续推进 Isaac 生态为机器人提供基础模型、仿真训练和整个边缘计算平台;英伟达的 Alpamayo/DRIVE Hyperion 为自动驾驶推理与车端平台,覆盖全球 80% 的新车。 但这次GTC最引人关注的产品是一块给PC用的SoC,一款名为 RTX SPARK的芯片 ,过去英伟达只给个人电脑做显卡,现在则是完全以整个平台 迈向PC领域,也宣告了端侧AI时代的到来。 一、端侧AI是什么 端侧AI指的就是在本地跑的AI,当你部署一个开源大模型后,哪怕不联网它都能持续为你工作。 现在越来越多开源大模型能力进步也很快,而且参数规模选项很多(例如Qwen和DeepSeek),用户可以将高难度高要求或是整体规划性的任务交给GPT或Claude,而更简单更具体但工作量较大的任务交给本地开源模型 - 这样可以节省大量的token成本,毕竟本地推理等于是买断了token,只需要用一点电而已。 现在我们获取AI算力的主要途径都是通过数据中心,无论是AWS、Azure、GCP还是其他neocloud,他们买来大量GPU组成数据中心,然后将算力出租给客户,这些客户包括OpenAI和Anthropic这样的前沿大模型巨头,也包括无数需要直接调用云上算力的中小型公司。 我们在往期主题就苹果在AI时代的优势谈过端侧(本地)AI算力 - 现在我们大多数人用的AI,都是基于云上的服务,例如使用ChatGPT、Claude、豆包等平台,这种用法的优势在于随时随地使用、模型强大,劣势在于如果需要有生产力级别的使用,那么以下三个典型的问题至少会遇到一个: (1)算力不足  - 这是最常见的瓶颈,导致用户不得不付费或排队等候任务完成; (2)延时过长  - 考虑到云上服务不在本地, 有时候无法满足需要某些对延时要求特别高的工作; (3)安全性隐患  - 所有交互和信息都与平台联网,万一出现安全漏洞,后果不堪设想,因此总有一些关系到资...