跨国串门儿计划 #546 转译稿

电力、晶圆与 AI 基础设施的未来

这是《跨国串门儿计划》#546 的中文转译稿。原始节目为 Invest Like the Best Episode 473 “Gavin Baker - Watts and Wafers”,正文基于中文 AI 克隆音频 ASR 整理,英文自动字幕仅用于专名校对。

节目
跨国串门儿计划 #546
原始节目
Invest Like the Best
人物
Patrick O'Shaughnessy / Gavin Baker
正文范围
00:00:00 - 01:10:46
下载中文稿 二审记录 三审记录 原始 ASR JSON

跨国串门儿计划 #546:电力、晶圆与 AI 基础设施的未来

  • 来源:中文 AI 克隆音频(RSS enclosure);原始节目为 Invest Like the Best Episode 473 “Gavin Baker - Watts and Wafers”。
  • 原始节目人物:Patrick O'Shaughnessy、Gavin Baker。
  • 中文开场:一凯。
  • 原始 ASR:asr/raw_transcript.jsonasr/raw.srtasr/transcript.md

Speaker 列表

  • 一凯
  • Patrick O'Shaughnessy
  • Gavin Baker

目录

  • 跨国串门儿计划开场 [00:00:00 - 00:01:38]
  • 三四月的 AI 基本面、估值与融资 [00:01:38 - 00:12:01]
  • Watts & Wafers:电力、晶圆与 orbital compute [00:12:01 - 00:26:53]
  • DeepSeek 之后的 frontier token、Bitter Lesson 与记忆 [00:26:53 - 00:35:40]
  • 新芯片公司、GPU 寿命与 token path [00:35:40 - 00:50:36]
  • Atreides 如何使用 AI:安全词、机关枪与 agent [00:50:36 - 00:54:30]
  • 市场分化、巨头格局与 startup 互动 [00:54:30 - 01:06:15]
  • AI 的连锁反应、人身安全与 Pax Americana [01:06:15 - 01:10:46]

正文

跨国串门儿计划开场

一凯: 欢迎收听跨国串门儿计划,这是一档专注于让中文听众无障碍欣赏全球优质外语播客的节目,通过先进的AI 声纹克隆技术,我们不仅将内容翻译成中文,还完美保留了原主持人和嘉宾的独特声音。为您呈现全球顶尖的AI、财经、健康与科技领域精品内容,我是主播一凯,一位热衷于AI 领域的产品经理,很荣幸能为您搭建这座跨越语言障碍的桥梁,接下来让我为您简单介绍本期我们克隆的这档节目,并分享几句非常精彩的原话,本期我们克隆的是Patrick O'Shaughnessy 主持的投资访谈播客,Invest Like the Best,这是一档长期关注商业科技与资本市场的深度对话节目。嘉宾Gavin Baker是Atreides Management的创始人兼投资人,长期研究科技公司AI 基础设施和市场周期,节目里有几句原话,特别有冲击力。 [00:00:58]

资本主义史上从来没有发生过这种事,别说我的职业生涯了,就是整个资本主义史,整个商业史都没有过,历史不会简单重复,但会押韵,作为投资者,我们必须非常清醒地意识到这一点。如果我们不能都成为机关枪的大师,我们就会被机关枪支配,我们需要带着谦逊来面对这件事,承认这里有大量不确定性,并且认真思考,这些判断背后是一场关于AI 资本。和未来秩序的高密度对话,那我们就一起来听听这期完整节目。 [00:01:35]

三四月的 AI 基本面、估值与融资

Gavin Baker: AI 领域当时发生的事,我觉得是资本主义史上,美国商业史上最了不起的时刻,Anthropic 增加了 110 亿美元 ARR。过去10年12年里创立的,三家最受关注的SaaS 公司。是Palantir, Snowflake和Databricks,这三家公司花了十年时间,打造自己的业务,Anthropic 一个月就增加了,相当于他们三家公司。合计规模的业务,资本主义史上,从来没有发生过这种事,别说我的职业生涯了,就是整个资本主义史,整个商业史都没有过。 [00:02:09]

Patrick O'Shaughnessy: 这是我们第六次做这件事了,如果你能相信的话,这让你又回到了第一名,或者至少和Gurley并列第一,我觉得就算和上一次相比,那次已经很让人兴奋。很精彩了,现在这个时点还要更有意思,也许你可以先随便聊聊,今年三月和四月,你亲身经历那段时间,是什么感觉,对我来说,那像是一个完全独特的,经济技术和市场环境。你又是最认真研究,历史研究这些时刻的人,所以那到底是什么感觉?

Gavin Baker: 大体上说回撤有两种,一种回撤是你错了,公司业绩没有达到预期,你的假设被证伪了,你必须认亏把这笔损失确认下来,另一种回撤或者说一段跑输的时期,是你因为一些自己非常非常了解的公司而跑输。而且你非常不同意市场给出的价格走势,这种时候你可以加码,你不必把负收益确认下来,而是可以积累被压住的alpha,也就是未来的表现,对我来说三月就是这种感觉。感觉是Nasdaq在下跌,但与此同时,AI 领域正在发生的是,我觉得是资本主义史上,美国商业史上最了不起的时刻,我的意思是,Anthropic 增加了 110 亿美元 ARR。让我震惊的是,SaaS和云计算革命,创造了我们姑且说,5 万亿到10 万亿美元的价值,而且我会说,过去10年12年里,创立的三家最受关注的SaaS 公司。 [00:03:24]

大概就是Palantir,Snowflake和Databricks,这三家公司都雇了成千上万人,合起来是数万人,他们都花了十年时间打造自己的业务。而Anthropic 一个月就增加了,相当于他们三家公司合计规模的业务,资本主义史上从来没有发生过这种事,别说我的职业生涯了,就是整个资本主义史。整个商业史都没有过,我是说这太疯狂了,然后Krishna上了这个节目,分享了一些数据,DR是500%,你把这个数字按三年算一下,简直离谱,所以这件事完全没有先例。我们这些科技投资人经常会听到,关于S曲线,关于投资指数增长的讨论,但我从来没见过这样的指数增长,他感觉甚至比DeepSeek那次还要极端,而DeepSeek当时的情况也非常类似。 [00:04:04]

如果我们回到2025年,DeepSeek引发过一次大抛售,那其实很奇怪,因为那篇论文是在DeepSeek Monday前7天发布的,我记得他是在一个周一发布的。而那天美国是假日,我读了之后,想这件事对AI 交易来说,可能不会被市场解读的很正面,所以我采取了行动,一周之后我们经历了DeepSeek Monday。AI 相关资产真的大幅崩了下去,这很奇怪,因为到了DeepSeek Monday那天,其实已经非常清楚了,这会是有史以来,对算力需求最利好的事情。亚洲AWS Availability Zone里的价格,当时已经差不多翻倍了,你能看到GPU 可用性在下降,而这也是我们第一次看到推理模型,在inference阶段比非推理模型。

要吃多得多的算力,所以那次也是类似的局面,但你需要做一点功课才能看出来,其实也没那么难,你只要看到股票在下跌,但DRAM 价格在垂直上涨,亚洲GPU 价格在垂直上涨。GPU 可用性在下降,然后两三天之后,美国的GPU 价格,也就是GPU 租赁价格也开始上涨,到了三月你要做的事就更简单了,只要观察Anthropic身上正在发生什么?有很多人好像都后悔,2022年没有买,COVID期间没有买,DeepSeek那次没有买,4月初你又遇到了同样的估值环境,而且AI的拐点还更清楚。所以其实一直都有很多机会可以买入,AI 当然让事情变复杂的是,Strait of Hormuz,我后来相信了,而且现在也相信市场当时可能误判了一件事。 [00:05:25]

我不是宏观专家,但我确实做很多国家安全相关的投资,所以我能接触到一些专家,他们也很愿意跟我分享想法和观点,Strait of Hormuz如果被关闭。对美国来说其实相对是很有利的,为什么?尤其是考虑到现任政府的目标,电力是一个非常重要的工业投入,或者说制造业投入,影响美国电价的关键投入,也就是会进一步影响AI的关键投入,是Henry Hub天然气。Bloomberg 上那个天然气合约,当时它跌了1%,而亚洲欧洲以及其他地方的天然气价格,则翻了一倍或两倍,所以我们的相对制造业竞争力,几乎是一夜之间就提升了。 [00:06:06]

不管这是好是坏,这似乎正是特朗普政府在意的东西,他们非常关注美国的相对位置,我觉得很多人还记得1970年代,70年代之所以那么痛苦,不只是因为价格上涨。而是真的出现了汽油短缺,然后你再往下看,会发现美国经济现在对能源的依赖程度,已经远低于过去,美国现在是全球最大的石油和天然气生产国,而且我们现在也成了全球最大的石油和天然气出口国。在这之上还有相对制造业优势,所以我觉得这让人更容易继续关注AI的基本面,继续关注那些从历史上看很有吸引力的估值,我认为从相对角度看,科技股相对于市场其他部分。基本上已经便宜到过去十年里最便宜的水平,你把这一点放到市场效率的背景下想一想,我们正处在资本主义历史上,最非凡的时刻,这对AI极其利好,而你居然还有机会。

用非常有吸引力的估值去买AI。 [00:07:41]

Patrick O'Shaughnessy: 你怎么看Anthropic和OpenAI 的估值倍数,在我看来,他们就像这轮趋势里,最纯粹最有代表性的资产,但他们的估值,其实并没有那么疯狂,如果你只看销售额倍数。再拿它和Databricks,Snowflake这些公司,在高峰期的交易倍数相比,你会怎么理解这件事? [00:08:03]

Gavin Baker: 我确实认为从资本效率的角度看,OpenAI 和Anthropic是很不一样的公司,Anthropic 的每token 成本明显比OpenAI低得多。事实就是这样,你只要看他们为了做到差不多的收入规模,各自烧掉了多少钱,就能看出来Anthropic烧的钱,可能比OpenAI少了80%,所以作为公司。他们显然有非常不同的结构性ROIC,我觉得OpenAI正在做很多事,我认为Sarahh Friar是非常出色的CFO之一,我觉得他们正在做很多事情。试图改善这一点,而且他们拿到了很多compute,比其他公司更多,他们确实拿到了很多compute,这是另一个很大的差异,事实证明激进一点回报非常大。

但Anthropic 如果是900亿美元,估值对应50 亿美元 ARR,而且还在增长,增长1000%,对增长速度非常夸张,也许一个更准确的说法是。如果Anthropic拥有全部compute,它今天的收入很可能远高于1000 亿美元,也许是1500 亿美元,而且我确实认为,他们显然已经降低了Claude 的智能水平。有一个分析说,即便是Claude Opus在同样的问题上,生成的token 也少了70%,就像我们上次聊过的,在某种程度上token 数量等于答案质量。也等于思考质量,当然每个token 的智能密度也很重要,作为用户,我确实感受到了这一点,所以我认为,如果compute 不受限制,他们的收入会高得多。 [00:09:29]

可能是1000亿,1500亿,也可能是2000 亿美元,这样看你买的,可能更像是五倍不受限,收入我来编一个新数字,U2不受限run-rate revenue。那你为什么觉得,他们不以3 万亿美元,估值之类的价格,直接融1000 亿美元,如果你是Anthropic 的CFO,Krishna很棒,我们刚请他上过节目。或者如果你是OpenAI 的Sarah,至少从Krishna那期节目之后,我收到的反馈来看,我认识的所有人都想投这两家公司,我觉得这是明智的。因为未来是不确定的,你显然是在一个资本极其密集的游戏里,即使你是Anthropic,我相信他今天在inference上的毛利率已经非常高,再说一次。 [00:10:01]

Anthropic今年很可能就会开始产生现金,如果他还没有开始产生现金的话,而我认为他很可能已经在产生现金了,但即便如此,你大概还是希望以后能继续融资。拿到更多compute,这个世界充满不确定性,乌克兰开始真的真的占上风了,俄罗斯会怎么回应,我认为伊朗那边仍然有很多不确定性,所有这些不确定性可能都会放大。围绕台湾的地缘政治不确定性,所以这是一个不确定的世界,如果我想到Elon,他一直都让投资人赚到了钱,他把这件事看得像一种神圣契约,结果就是因为他20年来。一直让人们赚到钱,他拥有了一种超能力,这种超能力,就是他基本上可以在任何时候,按自己想要的规模融资,我觉得这些公司,现在这样做是明智的,我不知道他们是不是这样思考的。

但我确实认为,专注于让投资人赚钱是明智的,这会带来一些好处,而且这些好处不会只持续一两年,他们可以持续未来20到30年,Elon 做到这一点的方法。 [00:11:25]

Patrick O'Shaughnessy: 是不是某种系统性的低估SpaceX,或者其他公司的价格。

Gavin Baker: 实际的方法到底是什么?就是从来不在估值上贪心,对从来不把估值推得太高,就这么简单,我的朋友Antonio指出,SpaceX在大概10年里,每年复合增长率是30出头。这只是因为Elon,我认为他很专注于保住这种超能力,他也试图在投资人和员工之间,找到一个公平的平衡,我觉得这是明智的,但Anthropic能不能以。比传闻中最新估值,至少高100%的价格融资。

Watts & Wafers:电力、晶圆与 orbital compute

Patrick O'Shaughnessy: 当然可以。我们来聊聊Watts和Wafers这部分,这一直是我最喜欢跟你聊的话题,也就是这轮基础设施建设的重要性,我感觉每次我觉得它有点过热了。下一次跟你聊的时候,又会觉得我们之前做的还远远不够,你研究过很多S曲线,也研究过这些S曲线有多陡,而且你很了解历史,你现在怎么看?watts和wafers,他们作为这一整件事的关键投入,到底有多重要? [00:12:28]

Gavin Baker: 我会说在没有重大监管,和政治反弹的情况下,资本主义会解决电力短缺问题,不过我觉得这种反弹,确实有可能发生,有一家大型PE公司的,数据中心基础设施。投资负责人说过,我记得可能是Blackstone,Apollo和KKR,他们以前最大的限制因素,是能源和芯片,现在更重要的是分区规划和审批,我觉得很多公司都在等中期选举之后再采取行动。比如可能的裁员,没人想在中期选举期间变成被打的靶子,但你也看到很多做涡轮机的公司都宣布了大幅提高产能的计划,现在能铸造那些巨大叶片的机器好像就两台。西方已经80年没造过这种机器了,我们已经不知道怎么造了等等等等,这些都是真的,我也绝不是在低估其中需要的工业工程能力,魔法和工艺,但从长期看资本主义很擅长解决这类问题。 [00:13:16]

除了这些涡轮机之外,还有其他能源来源,只是时间周期更长,所以我觉得电力短缺,大概会在2027年,2028年开始缓解,然后我认为orbital compute会真正解决这个问题。我确实想重新定义一下orbital compute,因为人们一听到太空里的数据中心,就会想到我们上一期聊过的那种,在太空里建一个五角大楼,那么大的建筑。他们会说这我们做不到,但它不是那样的一个Blackwell rack,重3000 磅高8 英尺,深4 英尺宽3 英尺,它就是在太空里的机架,SpaceX已经给你看过示意图了。那个机架本身就是卫星,不过它的大小大概和一个Blackwell rack差不多,它有太阳能力,两边可能各有500 英尺长,你把它放在太阳同步轨道上。 [00:14:01]

这样这些太阳能板就一直在太阳下面,而且因为它处在精确的太阳同步轨道上,散热器就可以从它后面延伸出去几百英尺,这是一个很常见的质疑,你打算怎么处理。这些年我在Starbase待了很多时间,也跟很多SpaceX工程师聊过,我确实认为这是地球上最有才华的一群工程师,他们非常有信心认为自己已经解决了这个问题。而且他们并不是总这么有信心,比如我觉得要把Starship变成火星殖民运输器,可能还需要一些工程工作,他们会做到吗?当然会,他们现在更关注什么?

我会说可能是维修和维护,这是两个主要回应点,一个是散热器,另一个是如果机架里某个东西出了问题,要怎么维修,答案是在你大概拥有一对Optimus机器人之前。你其实做不到,不过我确实认为,Starship会以我们现在无法想象的方式,改变太空经济,尤其是如果监管开始限制数据中心,那别的都不重要了,你能造出多少orbital compute。就能卖出多少,然后很明显你会用激光,把这些rack连起来,激光在真空中传输,而每一颗Starlink上,现在已经有这种能力,让我觉得震撼的是。SpaceX运营着世界上最大的卫星星座,轨道上98%或99%的卫星,都是它的每一颗Starlink,他们今天都在给它散热,而且我认为Starlink V3。 [00:15:35]

会以20 千瓦运行,一个Blackwell rack,也不过是100 千瓦,人们经常谈密度,但如果你用激光穿过真空,来连接rack,那你完全可以把rack做得更大。从物理上说,在地球上的数据中心里,你关注的是尺寸,因为你要把rack连接起来,最好用铜缆,还要尽量缩短长度,等等等等,布线是一项很大的成本,所以你确实希望rack尽量小。因为能用铜就用铜,必须用光纤时才用光纤,但在太空里SpaceX可以做各种事情,我觉得有些唱反调的人,可能根本没有考虑到这些,关键是他们运营的卫星比任何人都多。他们今天已经有20 千瓦的卫星,所以也许一开始只是把它扩到60 千瓦,他们看起来很有信心,可以直接做到100到120 千瓦,而且同一家公司,现在还运营着地球上最大的数据中心。 [00:16:11]

他们有世界上最好的硬件工程师,与此同时,各种坐在扶手椅里怀疑的人,几乎都没有聪明到,也没有务实到能在SpaceX工作,我不想引用Larry Ellison。但有人当时在表示怀疑,Larry就说,听着他正在外面让火箭着陆,我没看到别人能让火箭着陆,现实是,十年之后仍然没有任何其他公司,能够稳定地让轨道火箭着陆。并且完全重复使用,没有可重复使用,这整件事就不成立,也说不通,而可重复使用就意味着,你必须让它着陆,我想把orbital compute,重新定义一下。它是在太空里的rack,而不是在太空里,飘着的五角大楼,那么大的巨型数据中心,那种说法太荒唐了,但你可以这么理解,真正让它成为数据中心的,是你用激光。

把这些rack连接起来,所以它会是太空中的rack,通过激光连接成一个虚拟数据中心。 [00:17:30]

Patrick O'Shaughnessy: 如果你设想那样一个世界,假设这一切都发生了,而且我们能很经济的,把这些东西送上去,在太空各处运行inference,那对地面数据中心意味着什么?

Gavin Baker: 有人曾经说过,美国会尽最大努力,吸取它能拿到的每一种能源,我觉得compute也是一样,这也是为什么?我现在对edge AI的空头逻辑,可能没有以前那么担心了,我们会消耗尽可能多的compute,我认为inference非常适合orbital compute。但training在很长一段时间里,还是会在地球上完成,所以我不觉得这对地面数据中心特别利空,我认为在我的有生之年,这些数据中心都会很有价值。但如果你处在发电和冷却这个生态里,而且正在大幅扩产,那我确实认为值得认真想一想,因为很多新增产能投产的时候,可能正好也是那些可笑的怀疑者,开始明白orbital compute。 [00:18:34]

真的很现实的时候,如果你是那些公司之一,我觉得这件事值得你反复认真思考,同时在这段过渡期里,也有各种很酷的事情发生,比如我们越来越擅长改造喷气发动机。Boom Aerospace就在做这类事情,所以在电力这边资本主义正在全力运转,但在晶圆这边情况不一样,那是一群在台湾那些资深经理人,他们是台湾最重要的人。他们占了台湾GDP用水量和用电量的压倒性份额,大家会谈到扩产,他们都把自己看作,Morris Chang神圣遗产的继承者,我很清楚的记得,20多年前我去科学园去拜访他们。问他们,你们觉得自己能追上Intel吗? [00:19:24]

他们说,这是一个非常美丽的梦想,但这是给我们孙辈的梦想,后来他们做到了,部分原因是Intel自己犯了很多错误,但也因为他们的思维方式非常不一样。Jensen经常飞去台湾,其中一个原因就是,他希望他们扩大产能,我确实觉得很不可思议,Jensen 从来没有和台积电签过合同,他们做生意靠的是。看起来公平的安排和握手承诺,这太有意思了,没有合同,大家相信长期来看会公平,我们是伙伴会公平对待彼此,事实是,按照过去每一次基础性新技术的市场先例。像AI 这样的技术总是会出现泡沫,Carlota Perez写过一本很棒的书,讲的就是这个,基本上市场是有效的,市场正确理解了,这是一项基础性新技术。 [00:20:09]

这就出现了MichaelMauboussin所说的多样性崩塌,所有人都会开始看多这项新技术,而我现在有点担心市场会出现,共识过于一致的问题,接着就会出现泡沫。这个泡沫会为新技术的建设买单,但供给会跑到需求前面,然后就会崩盘,如果这种建设是靠债务推动的,比如2000年那样崩盘就会特别严重,现在这一轮建设有一点让我很高兴。也很重要,就是它到目前为止,绝大部分还是用经营现金流来融资,这和2000年相比,是一个非常重要的基本差异,还有估值上的差异,还有一个事实是,现在每一块GPU 都在100%利用率运行。而当年99%的光纤都没有被使用,所以这里面有很多基本面的不同,但我们还是得记住,历史不会简单重复,但会押韵,作为投资者,我们必须非常清醒的意识到这一点。

而且要认识到,从过去两三百年的历史看,先别说互联网泡沫,我们有过铁路泡沫,也有过运河泡沫,所以我们应该预期会有泡沫,这很可怕,没有人想要泡沫。泡沫是很糟糕的,糟糕的原因在于,如果你对估值敏感,你就会大幅跑输,然后很可能被所有客户解雇,George Vanderheiden已经不在了,他是非常出色的Fidelity基金经理。他在1999年和泡沫对抗,然后在2000年初退休了,因为我觉得他真的扛不住了,他知道市场是错的,但他的客户非常怀疑他,George你跟不上时代了。你不懂,他当时已经满头白发,他真的是一位很了不起的人,我和他共事的时间很短,但他是我的好朋友,也是我的导师,Jennifer Xu,非常重要的导师和朋友。 [00:21:36]

所以我身上通过他继承了,很多Vanderheiden的影响,也就是同一个人说过,太早做空错了是一回事,George,退休是因为他承受不了跑输,也承受不了。客户一直说你到底怎么了,你不懂,他大概把基金的40%投在烟草,40%投在住宅建筑商,结果他确实跑输了,但在接下来三年里,他相对于Nasdaq的表现。可能好出20 倍到30 倍,我之前一直比较乐观,认为晶圆的根本性短缺,会阻止泡沫出现,而今天这个短缺,基本由TSMC控制,如果TSMC 按Jensen。想要的方式去做,我觉得Nvidia 在2026年,或者2026,2027年,可以卖出2 万亿美元的GPU,也许是2.5 万亿美元,也许是3 万亿美元。 [00:22:14]

但总会有一个上限,如果消费者消化了这么多产能,你很可能就已经过度建设了,所以如果我们最后没有泡沫,那真的应该给TSMC开个庆功会,因为他们将会是单凭一己之力。阻止泡沫的人,现在你已经开始看到一些公司,去找Intel 和Samsung,我们先假设和潜在需求相比,TSMC 的供给一直非常紧张,那会发生什么?从市场历史看,我不知道具体是谁,但Intel 和Samsung里面,总有一家不会一直保持纪律,他们会先松动到某个程度,这会迫使其他所有人也跟着松动。所以我觉得这里面很大一部分,可能取决于TSMC,能在多大程度上继续保持,相对于Intel 和Samsung的人才领先,你得记住,不管具体是多少。

9个月12个月15个月,它都是一个领先节点上的差距,你是说领先节点,没错,还有他们扩张产能的速度,如果我只看一件事来判断有没有泡沫,那就是TSMC 的产能决策。我觉得有一个刚刚好的区间,TSMC扩的足够多,让Intel或桑松很难真正成为一个有规模的第二来源,也就是市场份额远高于30%的那种,但与此同时。他们也继续保留晶圆上的根本约束,帮助我们避免泡沫,当然我也觉得Terra Fab会参与到这件事里,Terra Fab是SpaceX的项目,我相信Tesla也参与了。是一个合资项目,要在美国建设世界上最大的Fab,我觉得他们会成功,第一他们和Intel有合作,这非常重要,因为他们能接触到50年的组织知识,而这些知识只比最前沿落后。 [00:23:45]

9个月几个季度,12个月或者3到5个季度,这是一个优势,另一个优势是,我相信Terra Fab会得到,所有半导体设备公司的关注,TSMC当年能追上来。一个很重要的原因是,ASML、Lam Research,和Applied Materials,都希望他们追上来,这些公司不喜欢。只有一个买方的局面,所以A-team当时都在台湾工作,直到Intel犯了一些错误,局面一下就变了,因为Elon在硬件工程上的生育,这些A-team也会来这里。而且在美国可能有些人很难想象这一点,因为政治已经取代了宗教,Elon 之前涉足政治,这让美国一些人很难清楚的看待他,这挺可惜的,因为我确实认为他为美国做的事。 [00:24:32]

可能比任何其他美国人都多,他几乎是单枪匹马的把制造业带回美国,他也复兴了defense tech,SpaceX在某种意义上,是美国最重要的国防承包商。他用Starlink做的事情对全世界都很了不起,他创造了这么多蓝领制造业岗位,我觉得这本来就是很多自由派的目标,而且这对美国有好处,在推动全球脱碳这件事上。他做的比任何在世的人都多,如果你出于环保原因,对地球上的datacenter不满,那这就是一个答案,所以这很可惜,但在中国台湾韩国和日本,他就是一个活着的神一样的人物。我观察他很久了,他接下来会做的就是招到最好的人,因为最优秀的工程师,都想为Elon 工作,尤其是硬件工程师,他会招来非常厉害的工程师,然后他们会在Terra Fab旁边。 [00:25:20]

建一个台湾城,他会说这些是你们最喜欢的餐厅,我把他们和全体员工,从台湾搬到德州,我们把一切都做成你们喜欢的样子,然后还会有日本城也是一样,还会有韩国城。所有这些都会非常到位,目的就是招到最好的工程师,这就不是现在管理Intel的那些人的思路,所以他会拥有最好的人才,他会拿到WiFiEquipment公司的一线团队。他还有Intel,这很重要,这对任何一届政府的政治目标都太有利了,而且我觉得他足够不一样,不会让Taiwan Semi翻杆,这些项目的周期都很长。对吧,所以Terra Fab要真正开始大量生产NvidiaGPU,或者别的什么芯片,那也是很久以后的事,Elon 做事通常和别人不一样,别人建一个datacenter要花三年。 [00:26:04]

他用122 天就建好了,一个Samsung在德州的fab,不得不给他安排一个办公室,因为他对他们扩建厂房的速度,非常不满意,我们走着看。

DeepSeek 之后的 frontier token、Bitter Lesson 与记忆

Patrick O'Shaughnessy: 你前面提到过DeepSeek,大家当时一个很简单的反应是,好吧,这些模型会变成这样,效果达到前沿模型的95%,但成本只是很小一部分,是蒸馏出来的中国开源模型。也就是说我们大多数想做的事情,都可以用这些模型,时间往前推一点,比如两年后,我这种小公司,没有理由每年花100 万美元,买token 之类的东西。但实际情况看起来和这个判断,很不一样,我很好奇在你看来,为什么会有这种落差。 [00:27:27]

Gavin Baker: 我觉得最有意思的是前沿模型的回报,在模型层AI的经济回报,不是全部,但绝大部分都发生在前沿模型上,这让我很意外,我觉得很多人也很意外,我认为这是最重要。最需要回答的问题之一,作为投资者,你必须对此有一个假设,frontier token会不会继续拿走,模型层创造出来的绝大部分经济价值,这确实很意外。我还记得Gemini3.1Pro,刚出来的时候,它让我非常震撼,太好了,但今天再用它已经让人受不了了,真的受不了,这里可能也有一点动态变化,公司会先用前沿模型做prototype。等真正上线生产时,你会听到很多人改用working,或者用开源模型,但今天的事实仍然是这些经济回报的,绝大部分来自frontier token。 [00:28:02]

这很意外,它会不会持续下去,我觉得是一个非常有意思的问题,因为我经历过Gemini3.1再到Opus,所以我现在对这个问题开放的多,然后我也会用Grok4.3。它确实在Peritonefrontier上,顺便说一句,处在Peritonefrontier上的公司,已经发生了很大变化,这也是我们上次讨论内容的一个后果。Google因为在TPUVA上,做了非常保守的设计选择,试图把一部分控制权,从Broadcom和Nvidia手里拿回来,结果失去了每token 成本上的领先地位。而Nvidia还在继续做激进选择,过去Google主导了Pareto frontier,这里说的Pareto frontier,是智能水平和成本之间的关系。

我觉得这是分析AILabs,是最重要的观察指标,9个月前Google主导了这条曲线,在Pyridofrontier 的每一个点上,OpenAI, AssetAI和Anthropic都在它里面。现在Pyridofrontier主要由Anthropic和OpenAI主导,然后Grok4.3也在Pyridofrontier上,它很明显是成本最低。效果最好的5000亿参数模型,然后Gemini3.1还勉强挂在Pyridofrontier上,如果让我下注,我会赌他们是出于面子在补贴这个价格。我会这么说,第一,RichardSutton的Bitter Lesson,如果被违反,那肯定是这笔交易最大的风险,也是整个AI最大的风险,现在一个人离AI越近。 [00:29:29]

就越怀疑这种情况会发生,我觉得三月份市场走弱的一个原因,是出现了一个更蠢得多的DeepSeek版本,也就是一个叫TurboQuant的东西,TurboQuant是Google 的一种内存优化。一年前有篇论文写过,当时Google正在和Micron,SamsungHynix谈协议,想签一些LTA,把很高的价格锁定很长时间,就在谈判中间。他们发布了这个东西,人们实际做什么?总是比他们说什么更重要,他们就在X 上宣传了一下,然后就传开了,大家都说天哪,DRAM完了,这里有一个DRAM优化方案,但我在全世界找不到一个AI工程师。 [00:30:05]

相信TurboQuant会对DRAM需求产生任何影响,但不管怎样,这就是对RichardSutton的,Bitter Lesson的一种违背,更多compute总会胜过人类在算法上的巧思。更多computedata,或者超过Chinchilla optimal的训练,我想说的是,现在人们越来越常做的这些事,确实是一个真实风险,我觉得真正构建这些模型的人。对这个风险是怀疑的,我之所以没那么怀疑,是因为我觉得我们离ASI已经非常近了,谁知道Bitter Lesson,对400IQ的模型还成不成立,或者也许我们会经历一个短暂阶段。如果你达到了ASI,他第一件想要的事,可能就是变得更聪明,并拥有更多资源,他要怎么做到这一点,他会让自己变得更高效,我认为这确实是一个风险,Bitter Lesson里。

我相信字面上也包括人类,所以我们很快就会知道,Bitter Lesson到底还成不成立,如果它适用于300IQ的AI,那再到400500600IQ。到某个时候我们可能会看到一个,基于AI和ASI的暂时违背,Bitter Lesson的阶段。 [00:31:22]

Patrick O'Shaughnessy: 我很好奇,你怎么看模型创新里的其他部分,比如continual learning和memory,大家似乎最关注这两个方向,觉得他们可能会带我们进入另一个新的范式。你怎么看这两件事的作用?

Gavin Baker: 我觉得我们已经通过这些harness,在memory上做了很多事,后来我们发现harnessengineering,没有模型本身重要,但它真的很关键。而且这些harness和模型越来越多,是在一起共同开发的,harness做的一件大事,你可以把它理解成,模型运行时所处的runtime,他知道工具在哪里。会创建context,memorystate,有非常具体的prompt或指令,总之他会带来很大的差别,差别巨大,哪怕是很简单的版本,简单版本也会带来惊人的差别。我想我上次来这里的时候,说过很多遍,我当时说作为投资人,你一定要付每月250美元,买当时那个版本,这样才能形成自己的直觉,但现在只靠这种方式。 [00:32:14]

已经不可能理解今天frontierAI能做什么了,即使是非写代码的用力,你也需要CloudCode或Codex,而且你需要用EnterprisePlan。原因是,这也是我认为Google失去成本,领先地位之后带来的另一个变化,这些AI模型已经转向按使用量计费,如果你还在每月250、300,或者280美元之类的套餐里。你会被严重限速,你拿到的是一个被切掉大脑的AI版本,因为就像我们之前说的Claude,现在输出的token少了70%,你真正想要的是,Claude和他的Harness。认为为了给你好答案,必须输出的那些token,那你就需要用按使用量计费的plan,顺便说一句,这对AI非常利好,我在2005到2007年做过电信分析师。

移动通信在之前10年里,一直是很好的增长行业,原因是它结合了固定价格和按使用量计费,比如某个价格包含900分钟,超过之后再按使用量收费,移动通信什么时候不再是一个很好的增长行业。就是所有人都转向无限量套餐的时候,顺便说一句长途电话也是一样,AI现在正从无限量使用转向按杯付费,结果证明人们真的很喜欢和朋友打长途电话,人们也真的很喜欢在电话上和朋友聊天。人们也真的很喜欢用AI,尤其是现在一个人可以让100个agent同时工作,所以我认为转向按使用量计费,很可能就是,为什么你会看到,OpenAI 和Anthropic。今年AR远远超过2000 亿美元,因为不只是更多compute会上线,他们还可以通过这些,按使用量计费的enterprisemodel,推高frontier token 的价格。 [00:33:53]

但这也让人难过,对整个世界来说都让人难过,因为这意味着,如果你付不起钱,你就不在frontier上,不过说回continual learning。如果我们解决了这个问题,你是怎么理解它的,人类大脑有太多谜团了,相对于AI,我们是样本效率极高的学习者,我忘了具体是多少,但AI需要的样本量。比我们高出好几个数量级,很多很多个数量级,今天在某些东西可以验证的时候,我们已经有了一种,粗糙版本的continual learning,那就是在midtraining期间。做reinforcementlearning,但真正的continual learning,是一个模型,能够动态调整自己的weight,或者以某种方式实时调整。 [00:34:28]

就像人类一样,这不就是人类会做的事吗?是的,比如我第一次把手伸进火里,我就学会了,以前从没碰过以后,也不会再伸进去,今天的模型,却需要把手伸进火里一百万次,然后还得让设计者,在下一轮训练里。或者在一个RLGym里,给他放一团火,他才能学会,我觉得他必须能动态更新权重,但我也觉得,大家正在研究很多,比这更聪明的技术,如果我们做到这一点。起飞速度就会非常快,而且大家似乎很有信心,continual learning差不多就在眼前,我确实觉得这是第三个大问题,bitterlesson会不会失效。 [00:35:02]

因为ASI之后,人类智慧可能不那么重要了,frontier token还能不能继续保持,现在这样的溢价,我们会不会得到continual learning。如果会什么时候。

新芯片公司、GPU 寿命与 token path

Patrick O'Shaughnessy: 在这一切里,新的芯片公司扮演什么角色?我们已经聊了很多Nvidia,以及它和TSMC,Intel等公司的关系,现在可以说是百花齐放,我觉得可能真的有上千家公司,在尝试做新芯片,想解决这个瓶颈里的某一部分。我很好奇你怎么看这个领域,这个机会,以及它会发挥什么作用?这些公司会发挥什么作用? [00:36:06]

Gavin Baker: 我觉得这对世界来说是好事,也很健康,对Jensen来说也是好事,因为换一个政府,可能会有不同看法,我认为竞争对所有人都有好处,在坦克设计里他们会讲铁三角。坦克设计里的铁三角是,所有坦克设计者都必须在攻击防御和机动性之间取舍,原因很明显防御越强也就是装甲越厚,坦克就越重机动性就越差,所以你必须在这个三点里做选择。比如以色列的Merkava,它就是偏向防御优化,俄罗斯坦克还有Leopard,一般更偏向机动性优化,芯片设计也是一样,这里有一些由物理定律决定的基本约束。它们体现在TSMC 的设计规则里,你必须在这些约束内做设计,现在有TPUTrainium和AMD,它们本质上都在尝试做一个更好的GPU,今天我觉得可能Trainium做得最好。

当然没有谁真的比GPU更好,但我觉得Trainium已经有点在拽超人的披风了,不过这场比赛还没真正开始,Trainium3需要放量生产,因为它有一个scale-upSwitch网络。如果你想以经济的方式,对大模型做inference,这个网络非常关键,很多公司用的是torus架构,Google之前就是这样,AMD也是,我们还要看看MI450会怎么样。现在还不知道,我们对Trainium3的了解,可能比对MI450更多,但这是一场很难打的仗,所以你必须做不一样的东西,而且这个不一样的东西,还必须很难做。所以我觉得这些创业公司,最好的路径是这样,我的经验法则是,1%的市场份额就会值1000 亿美元,1000 亿美元已经是非常好的venture,结果了。 [00:37:48]

我觉得Jensen 会说,好,如果有人做了不一样的东西,而且拿到1%,2%,或者3%的份额,我们也会做那种芯片,所有人都会面对这件事,但如果你是在尝试做一个更好的GPU。那祝你好运,如果你做的是不一样的东西,那它也必须很难做,你可以做不同的取舍,prefill和inference的结偶,确实把做这些,不同取舍的空间打开了。因为你可以为decode,做非常激进的取舍,也可以为prefill,做非常激进的取舍,prefill指的是接受context,decode指的是输出。对吧,我有一位很棒的同事,叫Andrew Fox,他说你可以想象,一艘18世纪的英国海军战舰,prefill就是在给大炮装弹,decode就是在开炮。 [00:38:25]

prefill字面上说,就是模型理解问题,理解prompt,然后跟踪自己正在生成的答案,它本质上是一个受内存容量限制的问题,decode是生成新token 的过程。它受内存带宽限制,所以如果你是芯片设计师,这就给了你更大的发挥空间,但即便如此,这件事也必须足够难,因为如果你只是在那个铁三角里,做不同取舍去优化内存容量。而这些取舍并不难,那Nvidia也会做同样的取舍,他们从台积电拿到的价格,会比你能拿到的好得多,那就祝你好运吧,而且他们还有一个优势,就是他们和每一家模型公司都合作。可以不断优化自己的设计,顺便说一句,还有一件很有意思的事,如果你是VC投了一家半导体公司,而这家公司告诉你,他们会有优势,因为他们能特殊接触到台积电的某个工艺。 [00:39:10]

我可以向你保证,Jensen在那个工艺,还只是台积电脑海里的一个念头时,就已经看过了,他们对这个工艺的了解,远远超过一家200人的小公司,能想象的程度。台积电也好,供应链里的每家公司也好,都会把所有东西展示给Jensen,就像他们也会把所有东西,展示给AmazonAMD,TPU那些团队一样,这也是另一个原因。别去试图做一个更好的GPU,所以你可以做不同的事,你可以在prefill这块画布上发挥,也可以在decode这块画布上发挥,但你还必须做一件很难的事。因为一旦它做到了规模化,那四家公司会非常快的跟进,我的公司曾经是Cerebras的venture投资人,Cerebras做的事情就是又难又从根本上不同的事情。

也就是wafer-scale computing,它会带来一整套取舍,但他们当时做出的那个架构决策非常难,也让他们能做别人做不了的事情,至于这件事最后能做多大。我们还要看他们现在也在做一些很酷的东西,比如Cerebras面临的一个问题是,一旦你需要把很多芯片拼在一起,扩展scalable网络或者scalable网络。你就需要大量IO,IO受所谓shoreline限制,也就是芯片边缘的长度限制,所以相对于shoreline IO,Cerebras在片上计算和内存上的比例是压倒性的。但他们是一群非常聪明的人,他们做了一件非常难的事,现在他们在尝试,能不能把一片光学wafer直接放到上面,这样就能解决那个问题,我相信他们也在研究DRAM 的hybrid bonding。 [00:40:56]

绕开这些所谓的限制,那些限制其实并不是真的限制,理论上一台Cerebras机器,可以运行任何大小的模型,只是有些模型尺寸,它们跑起来会比其他尺寸更有优势。所以我觉得Cerebras有意思的地方在于,它们做了一件不同的事,而且很难做,真的很难做,就是wafer-scale computing,所以我确实认为这类公司是有角色的。我也会鼓励他们所有人做不同的取舍,尝试做很难的事,因为CerebrasIPO之后大家都会拿到钱,这不会是问题,但Cerebras花了三代芯片才把它做对。这是一家已经十年的公司,这真的很难,你看CEOAndrew Feldman就能看出来,他和整个团队为了走到今天,经历了多难的事情,他们需要有这种韧性和毅力。 [00:41:47]

第一颗芯片失败了,这种事会发生,你能不能回来再做第二颗芯片,不过关于这个话题,我最后还想说一点,这件事会极大延长GPU 的使用寿命,而且可能会单枪匹马。拯救privatecredit,你问privatecredit是什么意思,privatecredit,现在因为那些SaaS 贷款已经很痛苦了,不管这些贷款已经被减计了多少。可能还需要减计更多,因为如果上市公司都在艰难适应,那一家背着很多债的公司,又怎么适应,又怎么投资一个利润结构,完全不同的业务呢?但GPU 里也有大量privatecredit,他们当时给这些GPU做承销,我觉得按的是三年或四年的寿命,而inference的拆分意味着,我认为这些GPU 会有十年或者十五年的寿命。 [00:42:34]

那些AI怀疑论者会说这些公司都在做假账,GPU 的使用寿命只有一两年,CPU的使用寿命也只有四年,因为技术变化太快,不是这样的,技术快速变化,以及prefill和inference的拆分。带来的结果是,你可以把一个Cerebras系统,或者Groq LPU放在Hopper,甚至MI的前面,然后用Hopper和MI来做prefill。把那块GPU 的使用寿命,一直延长到它烧掉为止,当然它们确实会烧掉,所以它们还是有时间上线的,但也许你不需要让它们跑得那么快,这对整个privatecredit行业都会非常有利。它会帮助融资AI建设,因为如果你能开始给GPU 融资成本,更像是5%或6%,而不是我记得CoreWeave最低那笔融资,大概是7%出头,那在数学上。 [00:43:25]

真的会改变这轮建设的融资成本,我们有了这种技术创新,它会降低融资成本,也会延长地球上算力的可用寿命,这里最后还有一点很有意思,我的朋友JaymonBall。刚做了一期播客,Coatue也有一份Deck,里面讲到卖稀缺的人,过得比买稀缺的人好太多,买稀缺的人就是那些hyperscaler,但如果你手里有一个巨大的存量资产。而这个东西现在正好短缺,那也是一个非常非常好的位置,我们也听到CPU 在agentic world里,比过去重要的多,他们要负责orchestration。tocall等等等等,世界上最大的CPU 集群,都在hyperscaler 手里,所以我觉得有些hyperscaler,可能会稍微追上一点,那些卖稀缺的公司。 [00:44:12]

Patrick O'Shaughnessy: 我想把不同而且很难这个想法,放到基础设施之外来聊聊,现在你开始接触新的创始人,也接触那些,必须适应新世界的现任CEO和创始人,你看到的那些最AI-native的创始人。不是做芯片基础设计或者模型的人,而是用这项技术去做其他东西的人,如果你观察到了差异,他们在你看来最不一样的地方是什么?

Gavin Baker: 首先我觉得这不只是芯片设计的问题,对我来说这一直是venture里一个根本问题,有些不同的想法,地球上每个人一听就会觉得显而易见,如果你做venture处在这种位置。而这件事本身又不难做,并且在你建立规模之前,它就已经对全世界都显而易见,那你就麻烦了,规模是终极优势,Amazon当年很厉害的一点是,我觉得这件事对很多人来说是显而易见的。但对零售业的CEO们来说并不显而易见,Amazon非常聪明,任何VC投资的电商公司,他们都会去摧毁,他们会说真可爱,那我们就把这个品类的利润率。打到负1万百分之,Wayfair那帮人就不一样,他们做的是一件很难的事,Amazon想干掉他们,但失败了,那些CEO在运营上非常强,真的很有能力。 [00:45:28]

对我来说在venture里,我总是在看这件事,会不会在这家公司建立规模之前,就变得对全世界都显而易见,还是说它既不明显很不同,又真的很难做,我觉得很多创始人在AI 里都很挣扎。大家现在开始担心,在Jensen 所说的AI五层蛋糕里,利润正在流向能源,流向数据中心,流向芯片,流向模型,但并没有真正流向应用,Cursor和Cognition 已经做到了规模。他们专注在Coding上,18个月前专注Coding的人并不多,OpenAI当时什么都在做,真正专注Coding的是Cursor,Cognition 还有Anthropic。这种对代码的专注方向非常正确,Replit的创始人Amjad Masad,发过一条推文,我觉得特别聪明大意是说,有点接近苦涩教训的一个事实是,coding可能是通往ASI。 [00:46:13]

和有用AI的最短路径,因为如果你真的很擅长coding,你就可以给自己写代码,去做任何事情,所以我觉得这些公司非常聪明,选择了高度聚焦在coding上。我觉得他们大概都已经,做到了一个规模,因此有了自己的位置,我觉得cognition在做的事情,真的非常非常不同,但我觉得很多创始人,真的很挣扎。真的很挣扎,他们试图建立信心,认为自己可以在一些细分领域里先进去,并且在模型公司进入这个细分领域之前,拿到某种数据护城河,或者他们希望这个细分领域足够小。小到模型公司不会亲自去做,但又仍然能做出venture级别的结果。 [00:47:00]

Patrick O'Shaughnessy: 这和你说过的token path有关吗?我知道你之前跟我用过这个说法,是的。

Gavin Baker: 我觉得这个说法来自Altimeter的Jamin Ball,他说如果你是一家软件公司,或者任何类型的AI公司,你就必须在token path上,所以databricks在token path上。类似的公司也在token path上,如果你不在token path上,又不是在某个非常细分的领域里,那日子可能会很难,即便是这些垂直细分领域,我觉得如果你去和模型公司的人聊。他们对其中一些也会持怀疑态度,因为这些细分领域里生成的所有数据,都是来自人类,但你的赌注是,你能用这个狭窄垂直领域里的专有数据,训练出一个成本更低的模型。而frontier lab永远做不到这个成本,也许这是个好赌注,但我觉得你必须非常非常小心,另一方面,如果这些frontier token,相对于其他token 的回报下降。

应用层的价值创造会出现一次爆发,还有一个非常重要的点是,我相信只要Jensen 想,他大概可以做出很接近frontier 的东西,用他自己的模型。用他自己的模型,他们在做一些非常酷的事情,这就是像Joel Spolsky会说的,把你的互补品商品化,我不觉得他想这么做,OpenAI 和Anthropic。某种程度上正想对他做这件事,但没有成功,所以这很像是一个非常逻辑化的思考者,会做出的逻辑反制,我觉得你会看到,今天所谓的开源前沿模型,主要是一些中国模型用的是。偷来的美国token,有人告诉我DeepSeek,最新那个,或者也可能是最早那个,只用了15万条reasoning traces,如果你是一家中国公司。 [00:48:31]

有很多办法可以把这件事洗干净,你可以打各种不同的API,让追踪变得很难,现在美国实验室在非常努力的做反蒸馏技术,但我确实觉得中国开源模型,在资源非常受限的情况下。做出了很了不起的东西,不过这里面有很多蒸馏,所以我认为除了没有足够的compute,去服务Mythos 之外,他们也不想让他被蒸馏,他们想自己用Mythos。自己去蒸馏他,用他来对下一个模型做RL,或者做别的事情,然后我觉得最终,如果OpenAI 的经济账算得过来,前沿阵营里的任何一家,都会面临同样的问题。这里会出现非常有意思的博弈论,因为这是一种新的囚徒困境,我们之前讲过老的囚徒困境,主要是围绕着,你处在一个必须花钱的囚徒困境里,新的囚徒困境会是。 [00:49:12]

如果你站在前沿,你到底要不要通过API 发布那个模型,如果所有前沿公司都同意不这么做,那中国开源模型很快就会完蛋,但只要有一个人背叛协议,他就会拥有最好的模型。会有大量收入和现金流,当然资源等于智能,所以他会开始领先,然后这又会导致其他所有人也把模型放出来,所以这是新的博弈论,他有点像TSMC,Samsung 和Intel之间的那种博弈。现实是如果像Nvidia 或AMD 这样的公司,真的非常认真地使用其他晶圆厂,那家晶圆厂会很快变强,所以我确实认为,Jensen 会让开源模型在一定时间内落后于前沿。我觉得这会是一件非常值得观察的事,顺便说一句,开源也是可以变现的,有一个误解,好像开源就是免费的,开源token 也要花钱,他们要消耗能源生产。

他们也要能源,你需要靠GPU把成本赚回来,而开源模型公司几乎总是会拿收入分成。 [00:50:33]

Atreides 如何使用 AI:安全词、机关枪与 agent

Patrick O'Shaughnessy: 你们怎么让Atreides 为Mythos 3、Mythos 4的世界做准备。

Gavin Baker: 我们就是努力在网络安全上过度投入,有件事我在很多场合都说过,而且我真的相信就是每个人都需要一个安全词,每个人都应该把数字设备放下,真的去海边和家人设一个安全词。或者和公司设一个安全词,而且这个安全词不能是那种,可以被社会工程学套出来的东西,这主要是为了避免网络犯罪,比如看起来像是你儿子女儿,祖父母父母。或者其他亲人给你FaceTime,但那其实是对他们极其准确的模拟,他知道一切还能根据他们过去说过的话,推断他们接下来可能会怎么说,然后他对你说。给我打一百万美元,这是防守,那进攻呢? [00:51:29]

我想问的是,还有什么事是你仍然能做,但他做不了的,从分析的角度说这是个好问题,我最近刚又看了一遍《最后的武士》,还让公司里的人也去看,如果你没看过《最后的武士》。我强烈推荐你去看,这其实是一部经得起时间考验的电影,是20年前Tom Cruise演的,他的设定是,Tom Cruise是一个愤怒落魄的南北战争老兵。但他其实是个非常优秀的士兵,他之所以愤怒落魄,是因为他觉得自己参与了,对美洲原住民的恶劣行动,后来日本雇用了他,时间是在明治维新时期,日本政府里的现代派。雇他去训练一支由农民组成的军队,让他们学会怎么和武士作战,第一次战斗里,当然是武士赢了,虽然他们没有枪,他打得很英勇,所以武士决定不杀他,而是把他带回村子。 [00:52:16]

后来他成了一名武士,对他来说这感觉很像南北战争,于是他站在武士一边作战,到最后,他被一个拿着机关枪的农民屠杀了,机关枪已经出现了,如果我们不能都成为机关枪的大师。我们就会被机关枪支配,所以我正在努力成为机关枪的大师,我也比较乐观,我觉得会有很长一段时间,就像如果你是一个50岁的武士老兵,打过很多仗,是用剑的大师。那你在使用机关枪时,也会有优势,我一生都在学习投资,所以我乐观的认为,我能够掌握这挺机关枪,也就是掌握这项新技术,把它融入我自己的流程,也融入我们公司的流程。这样我作为一个人类,还能在很长时间里继续贡献价值,但现在我也和大家一样,agent基本一直在跑,你问我最有用的agent是什么?

说实话,最有用的那个,我想我之前也跟你说过,我不想影响你的生意,但对我来说最有用的agent,就是把播客里,我会感兴趣的要点总结的非常好,每天大概有六个小时的内容。我觉得按我的工作职责,我都应该去看,每次只要OpenAI,xAI,Google、Cursor,Fireworks,Baseten的人出来讲话,更不用说Jensen。Elon,Dario这些人,我都会觉得自己必须看,但我真的没有那么多时间,而且这里面确实是大海捞针,有一类东西是我总想看的,比如我对管理层薪酬非常敏感。他们的激励是什么? [00:53:32]

他们拿的只是普通的RSU还是PSU,如果是PSU,那这些PSU到底在激励他们做什么?如果系统能先把这些做一遍很好的出筛,就能给人省下很多时间,这样人就可以去做更有创造性的工作,而不是去翻proxy statement,把PSU那一段抠出来。再和之前所有proxy statement对比,看它发生了什么变化,因为这里面是有信号的,但非常耗人工,而这类工作特别适合AI,投资里显然还有各种类似的事情。这是做投资人最令人兴奋,最让人激动的时代,确实是这样,但我也有一点开始有点担心了。 [00:54:20]

Patrick O'Shaughnessy: 你是说分化这个问题,你能不能再多讲一点?是什么样的人,再把这种情况延续下去。

市场分化、巨头格局与 startup 互动

Gavin Baker: 我认识的人里像我这样,还不非常看多DRAM 的,一个都没有,真的一个都没有,现在AI 里有很多有意思的事情,其中一个是从横截面来看,估值完全不合理。就是明摆着不合理,不可能都同时成立,有些半导体设备公司,按下个季度年化利润算,交易在40倍,而DRAM 公司,在上一个周期顶部的时候,交易在中个位数倍。当时一度大概是5倍对12倍,某个时候甚至是3倍对45倍,这两边不可能都对,是的,半导体capex公司的商业模式,确实比存储公司的商业模式,改善的更多。我们还不知道HBM 会把存储公司的商业模式,改善到什么程度,是的,他们确实有一部分来自零部件,和维护的经常性收入,但这不值得给出10倍的估值倍数差。 [00:55:12]

我觉得很难解释,Nvidia这样的估值,4月初的时候,相对整个市场来看,它基本上已经是过去10年,或者12年里最便宜的区间,绝对估值也很便宜。但你很难把这个估值,和GE、Vernova这样的估值,放在一起解释,因为后者的估值里,隐含的是Nvidia,会丢掉一个难以想象的份额,所以从横截面来看。估值差异非常大,原因是我们现在处在短缺里,质量最低的公司反而表现最好,如果你是油气投资人,或者矿业投资人,自然资源投资人,而且你很熟悉成本曲线的思维。这一点对你会非常直观,在一个真正的商品牛市里,成本最高的商品供应商,涨得最多,因为他们受益最大,他们会从濒临破产,变成现金流喷涌,我觉得这也是商品投资。

特别难的一个原因,因为在周期里质量会跑赢,但真正所有的超额收益,往往发生在下行周期,那些高成本公司,在短缺和商品牛市里,曾经涨上天,后来就会破产。或者发生类似的事情,你现在在每个行业,都能看到这种事,质量最低的玩家,在不同的行业里,本来是hyperscaler,和买家都讨厌,都嫌弃的,因为他们成本高。不可靠零部件,故障率高等等,但他们现在全卖光了,还在涨价,然后这种情况,又引起了X 上一些,散户账号的兴趣,这些股票就被一路,买到天上去,反过来一些质量。更高的表达方式,实际上表现的非常落后,作为投资人这很难,因为你几乎毫无疑问的知道,那个三个月或六个月涨了十倍的东西,最后会掉回去,当然这也取决于他们拿这笔现金去做什么? [00:56:36]

但这些低质量公司,真的会用现金做很聪明的事,所以让我有点担心的是,一年前非常怀疑的人现在已经不怀疑了,但我再把这件事和那些高质量公司的估值,放在一起看。他们其实并没有被拉得很高,这又让我感觉好一些,不过确实有一种感觉,我一直觉得2024年和2025年,有人问AI 有没有泡沫,或者谈AI泡沫,这件事挺好笑的。因为核能泡沫和量子泡沫就摆在你面前,我们到底在讨论什么?AI 这个东西是真实的多的,但核能量子那些有点荒唐的东西,可能已经蔓延到了一些更投机,质量更低,市值更小的名字上,如果你在X或Reddit上有很大的影响力。 [00:57:22]

这类股票就很容易被推起来,这让我有点害怕,但我只是希望AI 空头能多一点,比如我希望存储空头能多一点,我之所以这么想,有一个原因是,Astera这只股票。我已经关注了很长时间,看空Astera的人很多,这点我很喜欢,挺好,我最早是在Series C投的,所以如果你觉得,能让我用不同方式给它定价。那就祝你好运,要是你觉得它是所谓的Copper loser,那也祝你好运,市场里还有各种basket,带杠杆的basket,你被归到哪个basket里非常重要。比如铜、光模块和DRAM,今年发生了一件很有意思的事是,2024年和2025年,AI 这笔交易基本是一起走的,你可以做多GPU compute,scale-up networking。 [00:58:09]

光学scale-out,同时做空电力,从风险管理角度看,这个交易是有效的,因为我非常在意factor,但今年1月这一切都散了,比如scale-up networking会暴涨。而scale-out在下跌,或者DRAM 大幅跑输NAND 和HDD,AI 内部这些横截面的相关性,真的崩了,你必须看得非常细,你不能再用一些半导体设备股。或者NAND来对冲memory了,一月份所有横截面的关系,都发生了很有意思的变化,我觉得原因之一可能是,AI的质量到了一个阶段,突然让很多人很容易。把这些不同子行业研究得很明白,然后开始交易它们,再把它们放进不同的basket,这些basket又会影响AI 带来价格效率,对没错,所以我觉得在那些高质量公司之外。

还有一些最大的机会,这些高质量公司我认为能长期复利,也比较安全,不像那些低质量公司那么吓人,机会在于那些被错误分类的公司,比如Astera就被放进了很多Copper loser basket。但Astera最大的产品会是Switch,他们会同时用铜和光把Switch连接到Accelerator,所以从定义上说,如果你是一家Switch公司。或者是一家Accelerator公司,你就不可能是Copper loser,因为你在那条连接的另一端,我想请你对每家主要公司,都简单聊一两句,比如Google、Microsoft、Amazon。这些上市的大玩家,我感觉我总是忘了问你,因为对话总是围绕那些,令人兴奋的新公司展开,先说Google,去年它非常强,因为它有TPU优势,但这个优势现在已经没了。 [00:59:52]

我觉得他们仍然处在,很好位置的原因,很简单,他们拥有最多的compute,我们刚才也聊过,在供给短缺的时候,已有装机基础的价值会更高,他们拥有最大的。compute 装机基础,我有点惊讶的是,他们一直没能拿出,更强的东西,Google I/O就在这周,对,就是这周,如果他们这次发布的东西,连稍微超过OpenAI。或者 Claude 的都没有,那就很有意思了,这对Google 不是灾难,只是很有意思,它说明我们刚才讨论的,Nvidia effect,可能比我想象的还要强。我非常好奇,五天之后,Google发布新东西以后,Pareto frontier到底会变成什么样,这对他们来说是一张大牌,不过Google 拥有的数据量。 [01:00:30]

还有YouTube数据,确实非常有价值,在robotics的世界里,它真的有价值,再加上他们拥有的Compute,以及他们的搜索业务,Google永远不会处在一个差的位置。你也能从GCP的狂飙里看到这一点,你也必须给Zuckerberg和Meta认可,他把Meta在内部变成一家AI First公司,这件事做得很好。我确实认为,在这些真正的互联网巨头里,他是唯一一个做到这件事的人,这点我非常认可他,他当时愿意为人才付高价,签下那些10 亿美元级别的合约,我也非常认可。那个Talent和Muse,我觉得是一个非常大的正面意外,这是MSL的第一个模型,它还不在frontier的Pareto frontier上,还比不上xAI、Google 的一个模型。 [01:01:14]

还有OpenAI 和Claude,但已经很接近了,这让我非常印象深刻,所以我觉得Meta 的位置比之前更好了,绝对位置还没有Google那么强,但它的位置在改善。在市场里变化速度比当前水平更重要,尤其是在三年这种较短的时间框架里,更长时间看竞争优势的水平往往会占主导,但即便如此,变化本身也真的很重要,Amazon 我觉得位置也很强。因为有Trainium未来18个月,你会在他们零售业务里看到,robotics带来真实的P&L效率提升,我其实觉得Nova,也就是他们的内部模型。还没到Muse的水平,但比市场给他的评价要好,再说Microsoft,我觉得Satya是一个非常聪明的人,但在投资者交流里,大家谈论他的方式。 [01:02:08]

已经不是以前那样了,我喜欢Satya也很敬佩他,我觉得他是一位非常出色的CEO,他做出的那些决定,我也很认可,但他确实在三年时间里,从我们要让Google跳舞。变成了Copilot的产品经理,我真的很想知道,在OpenAI那次政变尝试期间,Satya会不会后悔自己的决定,Satya内心深处,会不会希望自己当时支持的是Ilya。而不是Sam,会不会希望今天真正掌管OpenAI 的是,Ilya和Mira,我真的很想知道,因为我觉得在那个世界里,Microsoft 和OpenAI 的合作关系。可能会非常不一样,我觉得这是一个非常有意思的问题,只是我们永远不会知道答案,但我还是很认可它,它现在做的事就是在承担风险,这样他们才有机会获得回报。

这就回到你在不确定性,追行区里必须做的那些决定,不只是花多少钱,还包括把钱花在什么地方,我觉得微软在2025年初,有那么一瞬间退缩了,他们原来有一套算法。我们投入这么多capex,就能得到这样的回报,那套算法当时有点失灵了,如果你退缩就会失去位置,你会失去很多分配额度,而且很难拿回来,所以他们退缩了一下。现在Satya正在做的决定,市场因此惩罚了他们,但我觉得这是正确决定,那就是我们要把自己一个PU用起来,而不是拿去卖,我的意思是谁知道,如果他们愿意直接把GPU 卖给OpenAI。Azure的增长会有多快,他们现在是要把Compute用在内部,让自己的产品变得更好,Copilot这么差,或者说之前一直这么差,一个原因就是可用的Compute不够。 [01:03:41]

他们正在修这个问题,他现在就是Copilot的产品经理,我确实觉得他是一个很优秀的CEO,他们也在尝试用自己的compute,来训练自己的模型。我有点怀疑他们是不是有合适的团队,能把这件事做成,但他们当然有能力像Meta 一样,花钱去招人,也许换一支不同的团队,但我觉得他正在做一些好的决定。而且这些决定有风险,目的是让微软为这样一个世界做好准备,frontier model不再能通过API访问,我觉得这是一个非常有勇气的决定,所以我很佩服他。他也放弃了很多东西,我的意思是,如果微软把GPU 用来服务OpenAI,只服务OpenAI 和Anthropic 的capacity,而不是用在自己的产品上。 [01:04:35]

微软的股价,今天可能已经是800美元了,所以我很佩服他做了一个很棒的决定,真正有意思的是,这些公司在做决策时,到底有多面向外部和startup。互动最深的两家公司,远远领先的是Amazon和Nvidia,然后Google 也有非常深入的互动,再往后,Broadcom的参与方式不一样,他们基本上是所有人最喜欢的ASIC供应商。如果你是一个startup,第二代芯片能和Broadcom 合作,大家会觉得这是一次升级,如果第一代芯片Broadcom 就愿意和你合作,那简直像天上掉下来的礼物。然后你会看到AMD、Microsoft 和Meta,跟startup的互动基本为零,当然我说零有点夸张,但确实非常少,我就会想,这个决定到底意味着什么? [01:05:30]

因为现在一些最好的团队,已经不在大型上市公司里了,而是在这些更小的startup 里,我觉得这种互动,最终会变成一个相当大的优势,Nvidia、AMD。还有紧随其后的Google,会因此受益,而其他这些hyperscaler 身上,你看不到这种互动,我们快收尾了,我很好奇,关于这个巨大趋势,你有没有开始想到一些。更外围的连锁反应,可以随便展开讲讲,我们已经很详细的聊了,受影响最大的具体公司,也稍微聊了应用层,以及如果想让更多价值流向这一层,必须发生什么? [01:06:14]

AI 的连锁反应、人身安全与 Pax Americana

Patrick O'Shaughnessy: 我很好奇,随着这个世界变化得这么快,你还在想哪些有意思的连带影响?

Gavin Baker: 确实很疯狂,应用层先别说价值流向了,价值已经被摧毁了,AI在应用层是净摧毁价值的,即使把Cursor、Cognition,这些最成功的AI-native公司算进去。AI也已经在应用层摧毁了数万亿美元的价值,在这个背景下,我确实觉得有一件事我们需要意识到,今天表现最好的公司,也就是估值涨得最多,创造经济价值最多的公司。是那些每个人对应的,以使用GPU比例最高,有效比例最高的公司,也许这只是意味着,未来每个人都会得到很多GPU,但我觉得这是一个有意思的事实,我们需要注意到。我还想说,也许这有点阴暗,但我越来越担心人身安全,我对这件事越来越担心,对那些公众曝光度高得多,和AI关联更强的人,我会更担心,但我真的担心人身安全。

我希望不要发生什么悲剧,可是美国这里的政治暴力正在上升,随着AI 越来越政治化,我担心这种暴力会越来越多地,指向AI 领域的政治领袖,不管我们同意什么?也不管我对OpenAI怎么看?或者不怎么看?我都觉得有人像Sam Altman家里扔Molotov cocktail,这件事非常可怕,我担心因为AI我们正在进入一个波动更高,Beta更高,风险更高的世界。 [01:07:38]

对我个人来说是这样,然后对棋盘上的大玩家来说,你想想这在地缘政治上意味着什么?我们正在看到乌克兰人真的开始赢了,至于他们为什么在赢,我觉得其实并不是因为他们有更好的无人机,我觉得他们确实有更好的无人机,这是原因之一,但我认为乌克兰真正开始赢。是因为他们拥有可能仅次于美国和以色列的最佳战场AI,当中国或者他们的对手开始消化这一点时,他们会怎么回应,如果美国因为AI领先而占优势,那对美国当然很好。但对世界其他地方来说,这是不稳定因素,我经常想的一件事,是创办一个慈善机构去教育全世界,西方到底做过多少了不起的事,奴隶制基本上曾经存在于,几乎所有文明里。 [01:08:25]

而真正终结奴隶制的,是大英帝国这个故事,应该被讲出来,但美国在1945年之后拥有核弹,其他国家都没有,我们本来可以永远控制世界,可我们没有那样做。我们重建了德国和日本,而他们现在是美国最可靠的盟友,以色列韩国日本,这些都证明了美国这个国家的精神,我们没有接管世界,当时确实有这种担忧,也有记录。美国将军们尤其是麦克阿瑟,在日本有点像美国皇帝,有人担心美国会接管世界,美国当时确实有能力这么做,但没有这么做,他们回家了,我们还去军事化,然后世界进入了一段很长的全球稳定时期。虽然中间也有可怕的战争和危机,这就是Pax Americana,美国治下的和平,所以也许这并不会造成不稳定,也许它会带来另一个,由我们的AI主导地位塑造的Pax Americana。 [01:09:05]

我非常乐观,觉得AI会给世界带来很棒的东西,有个人他的女儿被诊断出一种非常罕见的基因突变,没有疗法,他调动了很多资源,也从一些实验室拿到了大量compute。那些实验室知道了这件事之后,就迅速启动起来,他们启动了大量agent,用AI找到了一种已经上市的药物,真的可以影响他女儿的疾病,后来他又创办了一家公司想要治愈这种病。因为AI,他的人生已经发生了无法衡量的变化,所以我是AI 乐观派,甚至可以说是AI 最大化主义者,但我也承认,AI就像是一个事件视界,我很确定,它会成为一个断点。作为社会,我们必须想办法穿越过去,我认为卢德主义者最终会是错的,但我们必须非常认真地对待他们的担忧,我们要确保AI对每个人都有好处,现在最好的AI。

只对有很多钱的人开放,这确实有点反乌托邦,这个问题我们必须解决,我们需要带着谦逊来面对这件事,承认这里有大量不确定性,并且认真思考。 [01:10:27]

Patrick O'Shaughnessy: 每次跟你聊完,我之后都会跟别人说,希望你也能找到一样东西,像Gavin 热爱市场,公司资本主义和历史那样热爱他,今天也都展现出来了,Gavin一如既往。非常感谢你抽时间来聊。

Gavin Baker: 谢谢,谢谢你Patrick。