博文

目前显示的是 十一月, 2025的博文

英伟达护城河,出现危机?

图片
  最近Gemini 3 Pro火遍全球,这个大模型在各方面的评分已经超越ChatGPT5.1,更重要的是根据谷歌的官方文档显示,Genimi3是在谷歌自家的TPU上进行训练和推理的(而不是英伟达GPU),这是Gemini3最引人注目的一大亮点,那么这对于现在的AI训练/推理而言,TPU是否对英伟达构成了颠覆呢?  今天的主题就会从简单易懂的技术层面以及投资者视角讨论这个问题。 一、谷歌TPU是什么 谷歌的TPU的全称是 Tensor Processing Unit(张量处理单元),是一种典型的 ASIC(Application-Specific Integrated Circuit 专用集成电路)。 作为谷歌自己设计的一种AI专用芯片,TPU主要特点就是只干一件事: 深度学习(尤其是矩阵乘法),它通常配合谷歌自家的软件栈工作。 除了谷歌到底TPU外,其他大厂也研发了自己的ASIC,例如亚马逊的 Trainium和 Inferentia、微软的Maia、Meta的MTIA、特斯拉的Dojo。 这些ASIC的功能与谷歌TPU类似,之所以谷歌TPU火了,主要是因为产品相对更加成熟,T PU v1在2015年就在谷歌内部跑推理,2017年TPU v2 就在谷歌云上公开出租算力了,到现在已经迭代到第七代。 二、为何无法取代GPU 谷歌的自研芯片成功,短期内反而会加剧各家大厂的大模型竞争,而长期确实给具有足够实力的超级大厂提供了另一种可行性,在特定的算力需求下削弱英伟达GPU独一无二的特性。 不过由于谷歌自己的TPU是针对自己的产品和软件栈优化的,在其他场景和生态的大模型训练/推理上并不擅长,加之谷歌本身同微软、亚马逊、Meta构成更加直接的竞争关系,因此TPU难以颠覆英伟达的地位。  如果要做一个预测,我认为无论有没有谷歌TPU, 英伟达在可见的未来都会从当下掌握90%的AI加速器市场转而下降至70-80%,剩余部分是TPU(ASIC)和其他GPU的空间 。 之所以ASIC的总规模上限有限,是因为他的通用性较低,比如英伟达GPU因为其通用性,可以适配不断出现的新模型结构 (各种变体、MoE、Diffusion、RNN、图神经网络等),CUDA生态、Pytorch/TensorFlow/XLA等都围绕它优化,任何新算子和新模型很快就能在GPU上跑起...

比特币,地动山摇?

图片
  今年以来,比特币一度达到12万美元的价格,但之后持续下跌,最多时候跌掉了三分之一,表现远远弱于绝大多数主流资产。 比特币见顶下跌的时间点就是今年10月初,到了11月后开始加速下跌, 这两个时间点是非常巧的,在今年的10月和11月正好就发生了两件和比特币相关的大事。 一、电诈老板资产被没收 第一件事,在2025年10月, 美国司法部宣布查扣约12.7万枚BTC(当时价值相当于150亿美元),指控嫌疑人陈志为首,在柬埔寨等地经营太子集团旗下的庞大网络诈骗/杀猪盘园区。 第二件事,在 2025年11月,伦敦法院判决中国籍女子钱志敏 11年8个月监禁, 她在2014–2017年间运营一个诈骗公司,骗了约12.8万名投资者,金额约400亿元人民币,此后 大量资金被兑换成比特币。 英国警方在行动中查获了超过6.1万枚枚 BTC,这是目前英国历史上最大规模的加密货币查扣案之一。 以陈志案为例,美国执法机构大致过程如下: FBI针对USDT的交易水纹( 一种追踪和标记比特币或加密货币资金来源和历史的方法 )进行锁定。这一步利用区块链分析工具,识别出与诈骗活动相关的USDT转账路径,包括时间、金额和地址关联等特征。 在锁定USDT交易模式后,FBI用AI手段对几百万个区块链地址进行聚类分析。将分散的地址归类为属于同一犯罪组织的网络,从而追溯到陈志的冷钱包。这一步结合了区块链数据和交易所的KYC(Know Your Customer)信息,要求交易所提供接收账户的所有者细节。最终 成功锁定了陈志的巨额比特币分散在25个非托管钱包地址中。 由于这些是非托管钱包,获取资金的关键在于取得私钥,这是最大的难点,而美国政府也没有公开到底是用了什么方法。 传统的方法包括提前掌握了他或同伙的设备、冷钱包、备份助记词(U 盘、纸条、密码本、云备份等),或者通过同伙、内鬼拿到了钥匙。但几乎不可能是暴力破解,因为 要暴力破解一个标准的比特币私钥,需要尝试2的256次方种可能,这在当前计算能力下是不可行的。 这两个案子树立了非常有代表性的先例,以后任何类似的案子,任何主权国家的执法机构,都可以采用这个方式进行追溯冻结甚至没收,潜在影响非常巨大,比特币过去那种无懈可击的去中心化和隐匿能力出现了明显的削弱。 二、去中心化受威胁? 美国和英国执法部门在处理这两个案子时,获取密码的手段可能有所不同,但不...

AI鬼故事,你信哪一个?

图片
  最近市场对AI泡沫的恐惧持续不断,也有数不清的AI鬼故事出现,先有 电影《大空头》原型迈克尔·伯里被传出做空英伟达和Palantir、又有软银清仓英伟达、还有独立研究员 佩雷拉质疑AI泡沫,引用英伟达财报数据中的库存增加和应收款项作为论据。 我们今天会从这些鬼故事说起,看看这些鬼故事是否都站得住脚,然后聊聊AI最近的发展情况,争取利用当下的波动和恐慌作为长期的机会。 一、鬼故事的背后 我们首先逐一聊聊这些鬼故事。 第一个鬼故事,是迈克尔·伯里大举做空英伟达和Palantir的事,后来他又宣称,媒体报道的“9.12亿美元做空英伟达和Palantir”严重夸大,真实投入仅920万美元——相差一百倍。Burry指出,媒体误将SEC披露的名义敞口当作资金规模。 另外,从历史看他的判断准确度并不高,只是他在2008年金融危机一战成名,之后鲜有漂亮战绩,特别是2023年初时,他公开发推表示卖出,之后美国市场开启了一轮轰轰烈烈的科技牛市。 伯里还在向各大科技公司开炮,指责这些公司拉长英伟达GPU的折旧时间至六年,而实际上这些芯片折旧期限只有两三年。但这一指控与事实不符, 各大云服务平台上五年多以前的A100算力目前仍在满负荷运行,想多租都租不到。 第二个鬼故事,是软银清仓英伟达套现58亿美元。但 软银的决策对AI的趋势观察毫无影响,因为软银卖出英伟达的目的是筹钱以更大力度追加投资OpenAI,而任何对AI的投入,最终都绕不开底层算力。 另外OpenAI目前没有上市,软银可以在一级市场以当前的估值买入,OpenAI一旦IPO,二级市场对其定价大概率会有一波上涨,可能会接近一万亿。所以对软银这种能够吃到一级市场红利的机构来说,调整投资也不奇怪。 从历史看,软银曾在2017年以40亿美元买入英伟达近5%的股份,成为其大股东之一,但在2019年,出于资金流动性需求以及当时对英伟达股价涨幅的判断,软银以70亿美元清空全部持股,如果持有至今,70亿美元将变成2800亿美元。 第三个鬼故事,是网红研究员佩雷拉公开指责 英伟达是“6100亿美元的庞氏骗局”,他引用英伟达大幅增长的应收款项和库存作为支持性论据。 但是,库存大幅增加的主要原因是公司正在为未来的显著增长做准备,英伟达为了保证供货,把整条 AI 服务器供应链往前推了一大截。因为 从晶圆到封装,到HBM内存,再到整机/机柜,这...