跨国串门儿计划 #546：电力、晶圆与 AI 基础设施的未来

来源：中文 AI 克隆音频（RSS enclosure）；原始节目为 Invest Like the Best Episode 473 “Gavin Baker - Watts and Wafers”。
原始节目人物：Patrick O'Shaughnessy、Gavin Baker。
中文开场：一凯。
原始 ASR：asr/raw_transcript.json、asr/raw.srt、asr/transcript.md。

Speaker 列表

一凯
Patrick O'Shaughnessy
Gavin Baker

跨国串门儿计划开场 [00:00:00 - 00:01:38]
三四月的 AI 基本面、估值与融资 [00:01:38 - 00:12:01]
Watts & Wafers：电力、晶圆与 orbital compute [00:12:01 - 00:26:53]
DeepSeek 之后的 frontier token、Bitter Lesson 与记忆 [00:26:53 - 00:35:40]
新芯片公司、GPU 寿命与 token path [00:35:40 - 00:50:36]
Atreides 如何使用 AI：安全词、机关枪与 agent [00:50:36 - 00:54:30]
市场分化、巨头格局与 startup 互动 [00:54:30 - 01:06:15]
AI 的连锁反应、人身安全与 Pax Americana [01:06:15 - 01:10:46]

正文

跨国串门儿计划开场

一凯： 欢迎收听跨国串门儿计划，这是一档专注于让中文听众无障碍欣赏全球优质外语播客的节目，通过先进的AI 声纹克隆技术，我们不仅将内容翻译成中文，还完美保留了原主持人和嘉宾的独特声音。为您呈现全球顶尖的AI、财经、健康与科技领域精品内容，我是主播一凯，一位热衷于AI 领域的产品经理，很荣幸能为您搭建这座跨越语言障碍的桥梁，接下来让我为您简单介绍本期我们克隆的这档节目，并分享几句非常精彩的原话，本期我们克隆的是Patrick O'Shaughnessy 主持的投资访谈播客，Invest Like the Best，这是一档长期关注商业科技与资本市场的深度对话节目。嘉宾Gavin Baker是Atreides Management的创始人兼投资人，长期研究科技公司AI 基础设施和市场周期，节目里有几句原话，特别有冲击力。 [00:00:58]

资本主义史上从来没有发生过这种事，别说我的职业生涯了，就是整个资本主义史，整个商业史都没有过，历史不会简单重复，但会押韵，作为投资者，我们必须非常清醒地意识到这一点。如果我们不能都成为机关枪的大师，我们就会被机关枪支配，我们需要带着谦逊来面对这件事，承认这里有大量不确定性，并且认真思考，这些判断背后是一场关于AI 资本。和未来秩序的高密度对话，那我们就一起来听听这期完整节目。 [00:01:35]

三四月的 AI 基本面、估值与融资

Gavin Baker： AI 领域当时发生的事，我觉得是资本主义史上，美国商业史上最了不起的时刻，Anthropic 增加了 110 亿美元 ARR。过去10年12年里创立的，三家最受关注的SaaS 公司。是Palantir, Snowflake和Databricks，这三家公司花了十年时间，打造自己的业务，Anthropic 一个月就增加了，相当于他们三家公司。合计规模的业务，资本主义史上，从来没有发生过这种事，别说我的职业生涯了，就是整个资本主义史，整个商业史都没有过。 [00:02:09]

Patrick O'Shaughnessy： 这是我们第六次做这件事了，如果你能相信的话，这让你又回到了第一名，或者至少和Gurley并列第一，我觉得就算和上一次相比，那次已经很让人兴奋。很精彩了，现在这个时点还要更有意思，也许你可以先随便聊聊，今年三月和四月，你亲身经历那段时间，是什么感觉，对我来说，那像是一个完全独特的，经济技术和市场环境。你又是最认真研究，历史研究这些时刻的人，所以那到底是什么感觉？

Gavin Baker： 大体上说回撤有两种，一种回撤是你错了，公司业绩没有达到预期，你的假设被证伪了，你必须认亏把这笔损失确认下来，另一种回撤或者说一段跑输的时期，是你因为一些自己非常非常了解的公司而跑输。而且你非常不同意市场给出的价格走势，这种时候你可以加码，你不必把负收益确认下来，而是可以积累被压住的alpha，也就是未来的表现，对我来说三月就是这种感觉。感觉是Nasdaq在下跌，但与此同时，AI 领域正在发生的是，我觉得是资本主义史上，美国商业史上最了不起的时刻，我的意思是，Anthropic 增加了 110 亿美元 ARR。让我震惊的是，SaaS和云计算革命，创造了我们姑且说，5 万亿到10 万亿美元的价值，而且我会说，过去10年12年里，创立的三家最受关注的SaaS 公司。 [00:03:24]

大概就是Palantir，Snowflake和Databricks，这三家公司都雇了成千上万人，合起来是数万人，他们都花了十年时间打造自己的业务。而Anthropic 一个月就增加了，相当于他们三家公司合计规模的业务，资本主义史上从来没有发生过这种事，别说我的职业生涯了，就是整个资本主义史。整个商业史都没有过，我是说这太疯狂了，然后Krishna上了这个节目，分享了一些数据，DR是500%，你把这个数字按三年算一下，简直离谱，所以这件事完全没有先例。我们这些科技投资人经常会听到，关于S曲线，关于投资指数增长的讨论，但我从来没见过这样的指数增长，他感觉甚至比DeepSeek那次还要极端，而DeepSeek当时的情况也非常类似。 [00:04:04]

如果我们回到2025年，DeepSeek引发过一次大抛售，那其实很奇怪，因为那篇论文是在DeepSeek Monday前7天发布的，我记得他是在一个周一发布的。而那天美国是假日，我读了之后，想这件事对AI 交易来说，可能不会被市场解读的很正面，所以我采取了行动，一周之后我们经历了DeepSeek Monday。AI 相关资产真的大幅崩了下去，这很奇怪，因为到了DeepSeek Monday那天，其实已经非常清楚了，这会是有史以来，对算力需求最利好的事情。亚洲AWS Availability Zone里的价格，当时已经差不多翻倍了，你能看到GPU 可用性在下降，而这也是我们第一次看到推理模型，在inference阶段比非推理模型。

要吃多得多的算力，所以那次也是类似的局面，但你需要做一点功课才能看出来，其实也没那么难，你只要看到股票在下跌，但DRAM 价格在垂直上涨，亚洲GPU 价格在垂直上涨。GPU 可用性在下降，然后两三天之后，美国的GPU 价格，也就是GPU 租赁价格也开始上涨，到了三月你要做的事就更简单了，只要观察Anthropic身上正在发生什么？有很多人好像都后悔，2022年没有买，COVID期间没有买，DeepSeek那次没有买，4月初你又遇到了同样的估值环境，而且AI的拐点还更清楚。所以其实一直都有很多机会可以买入，AI 当然让事情变复杂的是，Strait of Hormuz，我后来相信了，而且现在也相信市场当时可能误判了一件事。 [00:05:25]

我不是宏观专家，但我确实做很多国家安全相关的投资，所以我能接触到一些专家，他们也很愿意跟我分享想法和观点，Strait of Hormuz如果被关闭。对美国来说其实相对是很有利的，为什么？尤其是考虑到现任政府的目标，电力是一个非常重要的工业投入，或者说制造业投入，影响美国电价的关键投入，也就是会进一步影响AI的关键投入，是Henry Hub天然气。Bloomberg 上那个天然气合约，当时它跌了1%，而亚洲欧洲以及其他地方的天然气价格，则翻了一倍或两倍，所以我们的相对制造业竞争力，几乎是一夜之间就提升了。 [00:06:06]

不管这是好是坏，这似乎正是特朗普政府在意的东西，他们非常关注美国的相对位置，我觉得很多人还记得1970年代，70年代之所以那么痛苦，不只是因为价格上涨。而是真的出现了汽油短缺，然后你再往下看，会发现美国经济现在对能源的依赖程度，已经远低于过去，美国现在是全球最大的石油和天然气生产国，而且我们现在也成了全球最大的石油和天然气出口国。在这之上还有相对制造业优势，所以我觉得这让人更容易继续关注AI的基本面，继续关注那些从历史上看很有吸引力的估值，我认为从相对角度看，科技股相对于市场其他部分。基本上已经便宜到过去十年里最便宜的水平，你把这一点放到市场效率的背景下想一想，我们正处在资本主义历史上，最非凡的时刻，这对AI极其利好，而你居然还有机会。

用非常有吸引力的估值去买AI。 [00:07:41]

Patrick O'Shaughnessy： 你怎么看Anthropic和OpenAI 的估值倍数，在我看来，他们就像这轮趋势里，最纯粹最有代表性的资产，但他们的估值，其实并没有那么疯狂，如果你只看销售额倍数。再拿它和Databricks，Snowflake这些公司，在高峰期的交易倍数相比，你会怎么理解这件事？ [00:08:03]

Gavin Baker： 我确实认为从资本效率的角度看，OpenAI 和Anthropic是很不一样的公司，Anthropic 的每token 成本明显比OpenAI低得多。事实就是这样，你只要看他们为了做到差不多的收入规模，各自烧掉了多少钱，就能看出来Anthropic烧的钱，可能比OpenAI少了80%，所以作为公司。他们显然有非常不同的结构性ROIC，我觉得OpenAI正在做很多事，我认为Sarahh Friar是非常出色的CFO之一，我觉得他们正在做很多事情。试图改善这一点，而且他们拿到了很多compute，比其他公司更多，他们确实拿到了很多compute，这是另一个很大的差异，事实证明激进一点回报非常大。

但Anthropic 如果是900亿美元，估值对应50 亿美元 ARR，而且还在增长，增长1000%，对增长速度非常夸张，也许一个更准确的说法是。如果Anthropic拥有全部compute，它今天的收入很可能远高于1000 亿美元，也许是1500 亿美元，而且我确实认为，他们显然已经降低了Claude 的智能水平。有一个分析说，即便是Claude Opus在同样的问题上，生成的token 也少了70%，就像我们上次聊过的，在某种程度上token 数量等于答案质量。也等于思考质量，当然每个token 的智能密度也很重要，作为用户，我确实感受到了这一点，所以我认为，如果compute 不受限制，他们的收入会高得多。 [00:09:29]

可能是1000亿，1500亿，也可能是2000 亿美元，这样看你买的，可能更像是五倍不受限，收入我来编一个新数字，U2不受限run-rate revenue。那你为什么觉得，他们不以3 万亿美元，估值之类的价格，直接融1000 亿美元，如果你是Anthropic 的CFO，Krishna很棒，我们刚请他上过节目。或者如果你是OpenAI 的Sarah，至少从Krishna那期节目之后，我收到的反馈来看，我认识的所有人都想投这两家公司，我觉得这是明智的。因为未来是不确定的，你显然是在一个资本极其密集的游戏里，即使你是Anthropic，我相信他今天在inference上的毛利率已经非常高，再说一次。 [00:10:01]

Anthropic今年很可能就会开始产生现金，如果他还没有开始产生现金的话，而我认为他很可能已经在产生现金了，但即便如此，你大概还是希望以后能继续融资。拿到更多compute，这个世界充满不确定性，乌克兰开始真的真的占上风了，俄罗斯会怎么回应，我认为伊朗那边仍然有很多不确定性，所有这些不确定性可能都会放大。围绕台湾的地缘政治不确定性，所以这是一个不确定的世界，如果我想到Elon，他一直都让投资人赚到了钱，他把这件事看得像一种神圣契约，结果就是因为他20年来。一直让人们赚到钱，他拥有了一种超能力，这种超能力，就是他基本上可以在任何时候，按自己想要的规模融资，我觉得这些公司，现在这样做是明智的，我不知道他们是不是这样思考的。

但我确实认为，专注于让投资人赚钱是明智的，这会带来一些好处，而且这些好处不会只持续一两年，他们可以持续未来20到30年，Elon 做到这一点的方法。 [00:11:25]

Patrick O'Shaughnessy： 是不是某种系统性的低估SpaceX，或者其他公司的价格。

Gavin Baker： 实际的方法到底是什么？就是从来不在估值上贪心，对从来不把估值推得太高，就这么简单，我的朋友Antonio指出，SpaceX在大概10年里，每年复合增长率是30出头。这只是因为Elon，我认为他很专注于保住这种超能力，他也试图在投资人和员工之间，找到一个公平的平衡，我觉得这是明智的，但Anthropic能不能以。比传闻中最新估值，至少高100%的价格融资。

Watts & Wafers：电力、晶圆与 orbital compute

Patrick O'Shaughnessy： 当然可以。我们来聊聊Watts和Wafers这部分，这一直是我最喜欢跟你聊的话题，也就是这轮基础设施建设的重要性，我感觉每次我觉得它有点过热了。下一次跟你聊的时候，又会觉得我们之前做的还远远不够，你研究过很多S曲线，也研究过这些S曲线有多陡，而且你很了解历史，你现在怎么看？watts和wafers，他们作为这一整件事的关键投入，到底有多重要？ [00:12:28]

Gavin Baker： 我会说在没有重大监管，和政治反弹的情况下，资本主义会解决电力短缺问题，不过我觉得这种反弹，确实有可能发生，有一家大型PE公司的，数据中心基础设施。投资负责人说过，我记得可能是Blackstone，Apollo和KKR，他们以前最大的限制因素，是能源和芯片，现在更重要的是分区规划和审批，我觉得很多公司都在等中期选举之后再采取行动。比如可能的裁员，没人想在中期选举期间变成被打的靶子，但你也看到很多做涡轮机的公司都宣布了大幅提高产能的计划，现在能铸造那些巨大叶片的机器好像就两台。西方已经80年没造过这种机器了，我们已经不知道怎么造了等等等等，这些都是真的，我也绝不是在低估其中需要的工业工程能力，魔法和工艺，但从长期看资本主义很擅长解决这类问题。 [00:13:16]

除了这些涡轮机之外，还有其他能源来源，只是时间周期更长，所以我觉得电力短缺，大概会在2027年，2028年开始缓解，然后我认为orbital compute会真正解决这个问题。我确实想重新定义一下orbital compute，因为人们一听到太空里的数据中心，就会想到我们上一期聊过的那种，在太空里建一个五角大楼，那么大的建筑。他们会说这我们做不到，但它不是那样的一个Blackwell rack，重3000 磅高8 英尺，深4 英尺宽3 英尺，它就是在太空里的机架，SpaceX已经给你看过示意图了。那个机架本身就是卫星，不过它的大小大概和一个Blackwell rack差不多，它有太阳能力，两边可能各有500 英尺长，你把它放在太阳同步轨道上。 [00:14:01]

这样这些太阳能板就一直在太阳下面，而且因为它处在精确的太阳同步轨道上，散热器就可以从它后面延伸出去几百英尺，这是一个很常见的质疑，你打算怎么处理。这些年我在Starbase待了很多时间，也跟很多SpaceX工程师聊过，我确实认为这是地球上最有才华的一群工程师，他们非常有信心认为自己已经解决了这个问题。而且他们并不是总这么有信心，比如我觉得要把Starship变成火星殖民运输器，可能还需要一些工程工作，他们会做到吗？当然会，他们现在更关注什么？

我会说可能是维修和维护，这是两个主要回应点，一个是散热器，另一个是如果机架里某个东西出了问题，要怎么维修，答案是在你大概拥有一对Optimus机器人之前。你其实做不到，不过我确实认为，Starship会以我们现在无法想象的方式，改变太空经济，尤其是如果监管开始限制数据中心，那别的都不重要了，你能造出多少orbital compute。就能卖出多少，然后很明显你会用激光，把这些rack连起来，激光在真空中传输，而每一颗Starlink上，现在已经有这种能力，让我觉得震撼的是。SpaceX运营着世界上最大的卫星星座，轨道上98%或99%的卫星，都是它的每一颗Starlink，他们今天都在给它散热，而且我认为Starlink V3。 [00:15:35]

会以20 千瓦运行，一个Blackwell rack，也不过是100 千瓦，人们经常谈密度，但如果你用激光穿过真空，来连接rack，那你完全可以把rack做得更大。从物理上说，在地球上的数据中心里，你关注的是尺寸，因为你要把rack连接起来，最好用铜缆，还要尽量缩短长度，等等等等，布线是一项很大的成本，所以你确实希望rack尽量小。因为能用铜就用铜，必须用光纤时才用光纤，但在太空里SpaceX可以做各种事情，我觉得有些唱反调的人，可能根本没有考虑到这些，关键是他们运营的卫星比任何人都多。他们今天已经有20 千瓦的卫星，所以也许一开始只是把它扩到60 千瓦，他们看起来很有信心，可以直接做到100到120 千瓦，而且同一家公司，现在还运营着地球上最大的数据中心。 [00:16:11]

他们有世界上最好的硬件工程师，与此同时，各种坐在扶手椅里怀疑的人，几乎都没有聪明到，也没有务实到能在SpaceX工作，我不想引用Larry Ellison。但有人当时在表示怀疑，Larry就说，听着他正在外面让火箭着陆，我没看到别人能让火箭着陆，现实是，十年之后仍然没有任何其他公司，能够稳定地让轨道火箭着陆。并且完全重复使用，没有可重复使用，这整件事就不成立，也说不通，而可重复使用就意味着，你必须让它着陆，我想把orbital compute，重新定义一下。它是在太空里的rack，而不是在太空里，飘着的五角大楼，那么大的巨型数据中心，那种说法太荒唐了，但你可以这么理解，真正让它成为数据中心的，是你用激光。

把这些rack连接起来，所以它会是太空中的rack，通过激光连接成一个虚拟数据中心。 [00:17:30]

Patrick O'Shaughnessy： 如果你设想那样一个世界，假设这一切都发生了，而且我们能很经济的，把这些东西送上去，在太空各处运行inference，那对地面数据中心意味着什么？

Gavin Baker： 有人曾经说过，美国会尽最大努力，吸取它能拿到的每一种能源，我觉得compute也是一样，这也是为什么？我现在对edge AI的空头逻辑，可能没有以前那么担心了，我们会消耗尽可能多的compute，我认为inference非常适合orbital compute。但training在很长一段时间里，还是会在地球上完成，所以我不觉得这对地面数据中心特别利空，我认为在我的有生之年，这些数据中心都会很有价值。但如果你处在发电和冷却这个生态里，而且正在大幅扩产，那我确实认为值得认真想一想，因为很多新增产能投产的时候，可能正好也是那些可笑的怀疑者，开始明白orbital compute。 [00:18:34]

真的很现实的时候，如果你是那些公司之一，我觉得这件事值得你反复认真思考，同时在这段过渡期里，也有各种很酷的事情发生，比如我们越来越擅长改造喷气发动机。Boom Aerospace就在做这类事情，所以在电力这边资本主义正在全力运转，但在晶圆这边情况不一样，那是一群在台湾那些资深经理人，他们是台湾最重要的人。他们占了台湾GDP用水量和用电量的压倒性份额，大家会谈到扩产，他们都把自己看作，Morris Chang神圣遗产的继承者，我很清楚的记得，20多年前我去科学园去拜访他们。问他们，你们觉得自己能追上Intel吗？ [00:19:24]

他们说，这是一个非常美丽的梦想，但这是给我们孙辈的梦想，后来他们做到了，部分原因是Intel自己犯了很多错误，但也因为他们的思维方式非常不一样。Jensen经常飞去台湾，其中一个原因就是，他希望他们扩大产能，我确实觉得很不可思议，Jensen 从来没有和台积电签过合同，他们做生意靠的是。看起来公平的安排和握手承诺，这太有意思了，没有合同，大家相信长期来看会公平，我们是伙伴会公平对待彼此，事实是，按照过去每一次基础性新技术的市场先例。像AI 这样的技术总是会出现泡沫，Carlota Perez写过一本很棒的书，讲的就是这个，基本上市场是有效的，市场正确理解了，这是一项基础性新技术。 [00:20:09]

这就出现了MichaelMauboussin所说的多样性崩塌，所有人都会开始看多这项新技术，而我现在有点担心市场会出现，共识过于一致的问题，接着就会出现泡沫。这个泡沫会为新技术的建设买单，但供给会跑到需求前面，然后就会崩盘，如果这种建设是靠债务推动的，比如2000年那样崩盘就会特别严重，现在这一轮建设有一点让我很高兴。也很重要，就是它到目前为止，绝大部分还是用经营现金流来融资，这和2000年相比，是一个非常重要的基本差异，还有估值上的差异，还有一个事实是，现在每一块GPU 都在100%利用率运行。而当年99%的光纤都没有被使用，所以这里面有很多基本面的不同，但我们还是得记住，历史不会简单重复，但会押韵，作为投资者，我们必须非常清醒的意识到这一点。

而且要认识到，从过去两三百年的历史看，先别说互联网泡沫，我们有过铁路泡沫，也有过运河泡沫，所以我们应该预期会有泡沫，这很可怕，没有人想要泡沫。泡沫是很糟糕的，糟糕的原因在于，如果你对估值敏感，你就会大幅跑输，然后很可能被所有客户解雇，George Vanderheiden已经不在了，他是非常出色的Fidelity基金经理。他在1999年和泡沫对抗，然后在2000年初退休了，因为我觉得他真的扛不住了，他知道市场是错的，但他的客户非常怀疑他，George你跟不上时代了。你不懂，他当时已经满头白发，他真的是一位很了不起的人，我和他共事的时间很短，但他是我的好朋友，也是我的导师，Jennifer Xu，非常重要的导师和朋友。 [00:21:36]

所以我身上通过他继承了，很多Vanderheiden的影响，也就是同一个人说过，太早做空错了是一回事，George，退休是因为他承受不了跑输，也承受不了。客户一直说你到底怎么了，你不懂，他大概把基金的40%投在烟草，40%投在住宅建筑商，结果他确实跑输了，但在接下来三年里，他相对于Nasdaq的表现。可能好出20 倍到30 倍，我之前一直比较乐观，认为晶圆的根本性短缺，会阻止泡沫出现，而今天这个短缺，基本由TSMC控制，如果TSMC 按Jensen。想要的方式去做，我觉得Nvidia 在2026年，或者2026，2027年，可以卖出2 万亿美元的GPU，也许是2.5 万亿美元，也许是3 万亿美元。 [00:22:14]

但总会有一个上限，如果消费者消化了这么多产能，你很可能就已经过度建设了，所以如果我们最后没有泡沫，那真的应该给TSMC开个庆功会，因为他们将会是单凭一己之力。阻止泡沫的人，现在你已经开始看到一些公司，去找Intel 和Samsung，我们先假设和潜在需求相比，TSMC 的供给一直非常紧张，那会发生什么？从市场历史看，我不知道具体是谁，但Intel 和Samsung里面，总有一家不会一直保持纪律，他们会先松动到某个程度，这会迫使其他所有人也跟着松动。所以我觉得这里面很大一部分，可能取决于TSMC，能在多大程度上继续保持，相对于Intel 和Samsung的人才领先，你得记住，不管具体是多少。

9个月12个月15个月，它都是一个领先节点上的差距，你是说领先节点，没错，还有他们扩张产能的速度，如果我只看一件事来判断有没有泡沫，那就是TSMC 的产能决策。我觉得有一个刚刚好的区间，TSMC扩的足够多，让Intel或桑松很难真正成为一个有规模的第二来源，也就是市场份额远高于30%的那种，但与此同时。他们也继续保留晶圆上的根本约束，帮助我们避免泡沫，当然我也觉得Terra Fab会参与到这件事里，Terra Fab是SpaceX的项目，我相信Tesla也参与了。是一个合资项目，要在美国建设世界上最大的Fab，我觉得他们会成功，第一他们和Intel有合作，这非常重要，因为他们能接触到50年的组织知识，而这些知识只比最前沿落后。 [00:23:45]

9个月几个季度，12个月或者3到5个季度，这是一个优势，另一个优势是，我相信Terra Fab会得到，所有半导体设备公司的关注，TSMC当年能追上来。一个很重要的原因是，ASML、Lam Research，和Applied Materials，都希望他们追上来，这些公司不喜欢。只有一个买方的局面，所以A-team当时都在台湾工作，直到Intel犯了一些错误，局面一下就变了，因为Elon在硬件工程上的生育，这些A-team也会来这里。而且在美国可能有些人很难想象这一点，因为政治已经取代了宗教，Elon 之前涉足政治，这让美国一些人很难清楚的看待他，这挺可惜的，因为我确实认为他为美国做的事。 [00:24:32]

可能比任何其他美国人都多，他几乎是单枪匹马的把制造业带回美国，他也复兴了defense tech，SpaceX在某种意义上，是美国最重要的国防承包商。他用Starlink做的事情对全世界都很了不起，他创造了这么多蓝领制造业岗位，我觉得这本来就是很多自由派的目标，而且这对美国有好处，在推动全球脱碳这件事上。他做的比任何在世的人都多，如果你出于环保原因，对地球上的datacenter不满，那这就是一个答案，所以这很可惜，但在中国台湾韩国和日本，他就是一个活着的神一样的人物。我观察他很久了，他接下来会做的就是招到最好的人，因为最优秀的工程师，都想为Elon 工作，尤其是硬件工程师，他会招来非常厉害的工程师，然后他们会在Terra Fab旁边。 [00:25:20]

建一个台湾城，他会说这些是你们最喜欢的餐厅，我把他们和全体员工，从台湾搬到德州，我们把一切都做成你们喜欢的样子，然后还会有日本城也是一样，还会有韩国城。所有这些都会非常到位，目的就是招到最好的工程师，这就不是现在管理Intel的那些人的思路，所以他会拥有最好的人才，他会拿到WiFiEquipment公司的一线团队。他还有Intel，这很重要，这对任何一届政府的政治目标都太有利了，而且我觉得他足够不一样，不会让Taiwan Semi翻杆，这些项目的周期都很长。对吧，所以Terra Fab要真正开始大量生产NvidiaGPU，或者别的什么芯片，那也是很久以后的事，Elon 做事通常和别人不一样，别人建一个datacenter要花三年。 [00:26:04]

他用122 天就建好了，一个Samsung在德州的fab，不得不给他安排一个办公室，因为他对他们扩建厂房的速度，非常不满意，我们走着看。

DeepSeek 之后的 frontier token、Bitter Lesson 与记忆

Patrick O'Shaughnessy： 你前面提到过DeepSeek，大家当时一个很简单的反应是，好吧，这些模型会变成这样，效果达到前沿模型的95%，但成本只是很小一部分，是蒸馏出来的中国开源模型。也就是说我们大多数想做的事情，都可以用这些模型，时间往前推一点，比如两年后，我这种小公司，没有理由每年花100 万美元，买token 之类的东西。但实际情况看起来和这个判断，很不一样，我很好奇在你看来，为什么会有这种落差。 [00:27:27]

Gavin Baker： 我觉得最有意思的是前沿模型的回报，在模型层AI的经济回报，不是全部，但绝大部分都发生在前沿模型上，这让我很意外，我觉得很多人也很意外，我认为这是最重要。最需要回答的问题之一，作为投资者，你必须对此有一个假设，frontier token会不会继续拿走，模型层创造出来的绝大部分经济价值，这确实很意外。我还记得Gemini3.1Pro，刚出来的时候，它让我非常震撼，太好了，但今天再用它已经让人受不了了，真的受不了，这里可能也有一点动态变化，公司会先用前沿模型做prototype。等真正上线生产时，你会听到很多人改用working，或者用开源模型，但今天的事实仍然是这些经济回报的，绝大部分来自frontier token。 [00:28:02]

这很意外，它会不会持续下去，我觉得是一个非常有意思的问题，因为我经历过Gemini3.1再到Opus，所以我现在对这个问题开放的多，然后我也会用Grok4.3。它确实在Peritonefrontier上，顺便说一句，处在Peritonefrontier上的公司，已经发生了很大变化，这也是我们上次讨论内容的一个后果。Google因为在TPUVA上，做了非常保守的设计选择，试图把一部分控制权，从Broadcom和Nvidia手里拿回来，结果失去了每token 成本上的领先地位。而Nvidia还在继续做激进选择，过去Google主导了Pareto frontier，这里说的Pareto frontier，是智能水平和成本之间的关系。

我觉得这是分析AILabs，是最重要的观察指标，9个月前Google主导了这条曲线，在Pyridofrontier 的每一个点上，OpenAI, AssetAI和Anthropic都在它里面。现在Pyridofrontier主要由Anthropic和OpenAI主导，然后Grok4.3也在Pyridofrontier上，它很明显是成本最低。效果最好的5000亿参数模型，然后Gemini3.1还勉强挂在Pyridofrontier上，如果让我下注，我会赌他们是出于面子在补贴这个价格。我会这么说，第一，RichardSutton的Bitter Lesson，如果被违反，那肯定是这笔交易最大的风险，也是整个AI最大的风险，现在一个人离AI越近。 [00:29:29]

就越怀疑这种情况会发生，我觉得三月份市场走弱的一个原因，是出现了一个更蠢得多的DeepSeek版本，也就是一个叫TurboQuant的东西，TurboQuant是Google 的一种内存优化。一年前有篇论文写过，当时Google正在和Micron，SamsungHynix谈协议，想签一些LTA，把很高的价格锁定很长时间，就在谈判中间。他们发布了这个东西，人们实际做什么？总是比他们说什么更重要，他们就在X 上宣传了一下，然后就传开了，大家都说天哪，DRAM完了，这里有一个DRAM优化方案，但我在全世界找不到一个AI工程师。 [00:30:05]

相信TurboQuant会对DRAM需求产生任何影响，但不管怎样，这就是对RichardSutton的，Bitter Lesson的一种违背，更多compute总会胜过人类在算法上的巧思。更多computedata，或者超过Chinchilla optimal的训练，我想说的是，现在人们越来越常做的这些事，确实是一个真实风险，我觉得真正构建这些模型的人。对这个风险是怀疑的，我之所以没那么怀疑，是因为我觉得我们离ASI已经非常近了，谁知道Bitter Lesson，对400IQ的模型还成不成立，或者也许我们会经历一个短暂阶段。如果你达到了ASI，他第一件想要的事，可能就是变得更聪明，并拥有更多资源，他要怎么做到这一点，他会让自己变得更高效，我认为这确实是一个风险，Bitter Lesson里。

我相信字面上也包括人类，所以我们很快就会知道，Bitter Lesson到底还成不成立，如果它适用于300IQ的AI，那再到400500600IQ。到某个时候我们可能会看到一个，基于AI和ASI的暂时违背，Bitter Lesson的阶段。 [00:31:22]

Patrick O'Shaughnessy： 我很好奇，你怎么看模型创新里的其他部分，比如continual learning和memory，大家似乎最关注这两个方向，觉得他们可能会带我们进入另一个新的范式。你怎么看这两件事的作用？

Gavin Baker： 我觉得我们已经通过这些harness，在memory上做了很多事，后来我们发现harnessengineering，没有模型本身重要，但它真的很关键。而且这些harness和模型越来越多，是在一起共同开发的，harness做的一件大事，你可以把它理解成，模型运行时所处的runtime，他知道工具在哪里。会创建context，memorystate，有非常具体的prompt或指令，总之他会带来很大的差别，差别巨大，哪怕是很简单的版本，简单版本也会带来惊人的差别。我想我上次来这里的时候，说过很多遍，我当时说作为投资人，你一定要付每月250美元，买当时那个版本，这样才能形成自己的直觉，但现在只靠这种方式。 [00:32:14]

已经不可能理解今天frontierAI能做什么了，即使是非写代码的用力，你也需要CloudCode或Codex，而且你需要用EnterprisePlan。原因是，这也是我认为Google失去成本，领先地位之后带来的另一个变化，这些AI模型已经转向按使用量计费，如果你还在每月250、300，或者280美元之类的套餐里。你会被严重限速，你拿到的是一个被切掉大脑的AI版本，因为就像我们之前说的Claude，现在输出的token少了70%，你真正想要的是，Claude和他的Harness。认为为了给你好答案，必须输出的那些token，那你就需要用按使用量计费的plan，顺便说一句，这对AI非常利好，我在2005到2007年做过电信分析师。

移动通信在之前10年里，一直是很好的增长行业，原因是它结合了固定价格和按使用量计费，比如某个价格包含900分钟，超过之后再按使用量收费，移动通信什么时候不再是一个很好的增长行业。就是所有人都转向无限量套餐的时候，顺便说一句长途电话也是一样，AI现在正从无限量使用转向按杯付费，结果证明人们真的很喜欢和朋友打长途电话，人们也真的很喜欢在电话上和朋友聊天。人们也真的很喜欢用AI，尤其是现在一个人可以让100个agent同时工作，所以我认为转向按使用量计费，很可能就是，为什么你会看到，OpenAI 和Anthropic。今年AR远远超过2000 亿美元，因为不只是更多compute会上线，他们还可以通过这些，按使用量计费的enterprisemodel，推高frontier token 的价格。 [00:33:53]

但这也让人难过，对整个世界来说都让人难过，因为这意味着，如果你付不起钱，你就不在frontier上，不过说回continual learning。如果我们解决了这个问题，你是怎么理解它的，人类大脑有太多谜团了，相对于AI，我们是样本效率极高的学习者，我忘了具体是多少，但AI需要的样本量。比我们高出好几个数量级，很多很多个数量级，今天在某些东西可以验证的时候，我们已经有了一种，粗糙版本的continual learning，那就是在midtraining期间。做reinforcementlearning，但真正的continual learning，是一个模型，能够动态调整自己的weight，或者以某种方式实时调整。 [00:34:28]

就像人类一样，这不就是人类会做的事吗？是的，比如我第一次把手伸进火里，我就学会了，以前从没碰过以后，也不会再伸进去，今天的模型，却需要把手伸进火里一百万次，然后还得让设计者，在下一轮训练里。或者在一个RLGym里，给他放一团火，他才能学会，我觉得他必须能动态更新权重，但我也觉得，大家正在研究很多，比这更聪明的技术，如果我们做到这一点。起飞速度就会非常快，而且大家似乎很有信心，continual learning差不多就在眼前，我确实觉得这是第三个大问题，bitterlesson会不会失效。 [00:35:02]

因为ASI之后，人类智慧可能不那么重要了，frontier token还能不能继续保持，现在这样的溢价，我们会不会得到continual learning。如果会什么时候。

新芯片公司、GPU 寿命与 token path

Patrick O'Shaughnessy： 在这一切里，新的芯片公司扮演什么角色？我们已经聊了很多Nvidia，以及它和TSMC，Intel等公司的关系，现在可以说是百花齐放，我觉得可能真的有上千家公司，在尝试做新芯片，想解决这个瓶颈里的某一部分。我很好奇你怎么看这个领域，这个机会，以及它会发挥什么作用？这些公司会发挥什么作用？ [00:36:06]

Gavin Baker： 我觉得这对世界来说是好事，也很健康，对Jensen来说也是好事，因为换一个政府，可能会有不同看法，我认为竞争对所有人都有好处，在坦克设计里他们会讲铁三角。坦克设计里的铁三角是，所有坦克设计者都必须在攻击防御和机动性之间取舍，原因很明显防御越强也就是装甲越厚，坦克就越重机动性就越差，所以你必须在这个三点里做选择。比如以色列的Merkava，它就是偏向防御优化，俄罗斯坦克还有Leopard，一般更偏向机动性优化，芯片设计也是一样，这里有一些由物理定律决定的基本约束。它们体现在TSMC 的设计规则里，你必须在这些约束内做设计，现在有TPUTrainium和AMD，它们本质上都在尝试做一个更好的GPU，今天我觉得可能Trainium做得最好。

当然没有谁真的比GPU更好，但我觉得Trainium已经有点在拽超人的披风了，不过这场比赛还没真正开始，Trainium3需要放量生产，因为它有一个scale-upSwitch网络。如果你想以经济的方式，对大模型做inference，这个网络非常关键，很多公司用的是torus架构，Google之前就是这样，AMD也是，我们还要看看MI450会怎么样。现在还不知道，我们对Trainium3的了解，可能比对MI450更多，但这是一场很难打的仗，所以你必须做不一样的东西，而且这个不一样的东西，还必须很难做。所以我觉得这些创业公司，最好的路径是这样，我的经验法则是，1%的市场份额就会值1000 亿美元，1000 亿美元已经是非常好的venture，结果了。 [00:37:48]

我觉得Jensen 会说，好，如果有人做了不一样的东西，而且拿到1%，2%，或者3%的份额，我们也会做那种芯片，所有人都会面对这件事，但如果你是在尝试做一个更好的GPU。那祝你好运，如果你做的是不一样的东西，那它也必须很难做，你可以做不同的取舍，prefill和inference的结偶，确实把做这些，不同取舍的空间打开了。因为你可以为decode，做非常激进的取舍，也可以为prefill，做非常激进的取舍，prefill指的是接受context，decode指的是输出。对吧，我有一位很棒的同事，叫Andrew Fox，他说你可以想象，一艘18世纪的英国海军战舰，prefill就是在给大炮装弹，decode就是在开炮。 [00:38:25]

prefill字面上说，就是模型理解问题，理解prompt，然后跟踪自己正在生成的答案，它本质上是一个受内存容量限制的问题，decode是生成新token 的过程。它受内存带宽限制，所以如果你是芯片设计师，这就给了你更大的发挥空间，但即便如此，这件事也必须足够难，因为如果你只是在那个铁三角里，做不同取舍去优化内存容量。而这些取舍并不难，那Nvidia也会做同样的取舍，他们从台积电拿到的价格，会比你能拿到的好得多，那就祝你好运吧，而且他们还有一个优势，就是他们和每一家模型公司都合作。可以不断优化自己的设计，顺便说一句，还有一件很有意思的事，如果你是VC投了一家半导体公司，而这家公司告诉你，他们会有优势，因为他们能特殊接触到台积电的某个工艺。 [00:39:10]

我可以向你保证，Jensen在那个工艺，还只是台积电脑海里的一个念头时，就已经看过了，他们对这个工艺的了解，远远超过一家200人的小公司，能想象的程度。台积电也好，供应链里的每家公司也好，都会把所有东西展示给Jensen，就像他们也会把所有东西，展示给AmazonAMD，TPU那些团队一样，这也是另一个原因。别去试图做一个更好的GPU，所以你可以做不同的事，你可以在prefill这块画布上发挥，也可以在decode这块画布上发挥，但你还必须做一件很难的事。因为一旦它做到了规模化，那四家公司会非常快的跟进，我的公司曾经是Cerebras的venture投资人，Cerebras做的事情就是又难又从根本上不同的事情。

也就是wafer-scale computing，它会带来一整套取舍，但他们当时做出的那个架构决策非常难，也让他们能做别人做不了的事情，至于这件事最后能做多大。我们还要看他们现在也在做一些很酷的东西，比如Cerebras面临的一个问题是，一旦你需要把很多芯片拼在一起，扩展scalable网络或者scalable网络。你就需要大量IO，IO受所谓shoreline限制，也就是芯片边缘的长度限制，所以相对于shoreline IO，Cerebras在片上计算和内存上的比例是压倒性的。但他们是一群非常聪明的人，他们做了一件非常难的事，现在他们在尝试，能不能把一片光学wafer直接放到上面，这样就能解决那个问题，我相信他们也在研究DRAM 的hybrid bonding。 [00:40:56]

绕开这些所谓的限制，那些限制其实并不是真的限制，理论上一台Cerebras机器，可以运行任何大小的模型，只是有些模型尺寸，它们跑起来会比其他尺寸更有优势。所以我觉得Cerebras有意思的地方在于，它们做了一件不同的事，而且很难做，真的很难做，就是wafer-scale computing，所以我确实认为这类公司是有角色的。我也会鼓励他们所有人做不同的取舍，尝试做很难的事，因为CerebrasIPO之后大家都会拿到钱，这不会是问题，但Cerebras花了三代芯片才把它做对。这是一家已经十年的公司，这真的很难，你看CEOAndrew Feldman就能看出来，他和整个团队为了走到今天，经历了多难的事情，他们需要有这种韧性和毅力。 [00:41:47]

第一颗芯片失败了，这种事会发生，你能不能回来再做第二颗芯片，不过关于这个话题，我最后还想说一点，这件事会极大延长GPU 的使用寿命，而且可能会单枪匹马。拯救privatecredit，你问privatecredit是什么意思，privatecredit，现在因为那些SaaS 贷款已经很痛苦了，不管这些贷款已经被减计了多少。可能还需要减计更多，因为如果上市公司都在艰难适应，那一家背着很多债的公司，又怎么适应，又怎么投资一个利润结构，完全不同的业务呢？但GPU 里也有大量privatecredit，他们当时给这些GPU做承销，我觉得按的是三年或四年的寿命，而inference的拆分意味着，我认为这些GPU 会有十年或者十五年的寿命。 [00:42:34]

那些AI怀疑论者会说这些公司都在做假账，GPU 的使用寿命只有一两年，CPU的使用寿命也只有四年，因为技术变化太快，不是这样的，技术快速变化，以及prefill和inference的拆分。带来的结果是，你可以把一个Cerebras系统，或者Groq LPU放在Hopper，甚至MI的前面，然后用Hopper和MI来做prefill。把那块GPU 的使用寿命，一直延长到它烧掉为止，当然它们确实会烧掉，所以它们还是有时间上线的，但也许你不需要让它们跑得那么快，这对整个privatecredit行业都会非常有利。它会帮助融资AI建设，因为如果你能开始给GPU 融资成本，更像是5%或6%，而不是我记得CoreWeave最低那笔融资，大概是7%出头，那在数学上。 [00:43:25]

真的会改变这轮建设的融资成本，我们有了这种技术创新，它会降低融资成本，也会延长地球上算力的可用寿命，这里最后还有一点很有意思，我的朋友JaymonBall。刚做了一期播客，Coatue也有一份Deck，里面讲到卖稀缺的人，过得比买稀缺的人好太多，买稀缺的人就是那些hyperscaler，但如果你手里有一个巨大的存量资产。而这个东西现在正好短缺，那也是一个非常非常好的位置，我们也听到CPU 在agentic world里，比过去重要的多，他们要负责orchestration。tocall等等等等，世界上最大的CPU 集群，都在hyperscaler 手里，所以我觉得有些hyperscaler，可能会稍微追上一点，那些卖稀缺的公司。 [00:44:12]

Patrick O'Shaughnessy： 我想把不同而且很难这个想法，放到基础设施之外来聊聊，现在你开始接触新的创始人，也接触那些，必须适应新世界的现任CEO和创始人，你看到的那些最AI-native的创始人。不是做芯片基础设计或者模型的人，而是用这项技术去做其他东西的人，如果你观察到了差异，他们在你看来最不一样的地方是什么？

Gavin Baker： 首先我觉得这不只是芯片设计的问题，对我来说这一直是venture里一个根本问题，有些不同的想法，地球上每个人一听就会觉得显而易见，如果你做venture处在这种位置。而这件事本身又不难做，并且在你建立规模之前，它就已经对全世界都显而易见，那你就麻烦了，规模是终极优势，Amazon当年很厉害的一点是，我觉得这件事对很多人来说是显而易见的。但对零售业的CEO们来说并不显而易见，Amazon非常聪明，任何VC投资的电商公司，他们都会去摧毁，他们会说真可爱，那我们就把这个品类的利润率。打到负1万百分之，Wayfair那帮人就不一样，他们做的是一件很难的事，Amazon想干掉他们，但失败了，那些CEO在运营上非常强，真的很有能力。 [00:45:28]

对我来说在venture里，我总是在看这件事，会不会在这家公司建立规模之前，就变得对全世界都显而易见，还是说它既不明显很不同，又真的很难做，我觉得很多创始人在AI 里都很挣扎。大家现在开始担心，在Jensen 所说的AI五层蛋糕里，利润正在流向能源，流向数据中心，流向芯片，流向模型，但并没有真正流向应用，Cursor和Cognition 已经做到了规模。他们专注在Coding上，18个月前专注Coding的人并不多，OpenAI当时什么都在做，真正专注Coding的是Cursor，Cognition 还有Anthropic。这种对代码的专注方向非常正确，Replit的创始人Amjad Masad，发过一条推文，我觉得特别聪明大意是说，有点接近苦涩教训的一个事实是，coding可能是通往ASI。 [00:46:13]

和有用AI的最短路径，因为如果你真的很擅长coding，你就可以给自己写代码，去做任何事情，所以我觉得这些公司非常聪明，选择了高度聚焦在coding上。我觉得他们大概都已经，做到了一个规模，因此有了自己的位置，我觉得cognition在做的事情，真的非常非常不同，但我觉得很多创始人，真的很挣扎。真的很挣扎，他们试图建立信心，认为自己可以在一些细分领域里先进去，并且在模型公司进入这个细分领域之前，拿到某种数据护城河，或者他们希望这个细分领域足够小。小到模型公司不会亲自去做，但又仍然能做出venture级别的结果。 [00:47:00]

Patrick O'Shaughnessy： 这和你说过的token path有关吗？我知道你之前跟我用过这个说法，是的。

Gavin Baker： 我觉得这个说法来自Altimeter的Jamin Ball，他说如果你是一家软件公司，或者任何类型的AI公司，你就必须在token path上，所以databricks在token path上。类似的公司也在token path上，如果你不在token path上，又不是在某个非常细分的领域里，那日子可能会很难，即便是这些垂直细分领域，我觉得如果你去和模型公司的人聊。他们对其中一些也会持怀疑态度，因为这些细分领域里生成的所有数据，都是来自人类，但你的赌注是，你能用这个狭窄垂直领域里的专有数据，训练出一个成本更低的模型。而frontier lab永远做不到这个成本，也许这是个好赌注，但我觉得你必须非常非常小心，另一方面，如果这些frontier token，相对于其他token 的回报下降。

应用层的价值创造会出现一次爆发，还有一个非常重要的点是，我相信只要Jensen 想，他大概可以做出很接近frontier 的东西，用他自己的模型。用他自己的模型，他们在做一些非常酷的事情，这就是像Joel Spolsky会说的，把你的互补品商品化，我不觉得他想这么做，OpenAI 和Anthropic。某种程度上正想对他做这件事，但没有成功，所以这很像是一个非常逻辑化的思考者，会做出的逻辑反制，我觉得你会看到，今天所谓的开源前沿模型，主要是一些中国模型用的是。偷来的美国token，有人告诉我DeepSeek，最新那个，或者也可能是最早那个，只用了15万条reasoning traces，如果你是一家中国公司。 [00:48:31]

有很多办法可以把这件事洗干净，你可以打各种不同的API，让追踪变得很难，现在美国实验室在非常努力的做反蒸馏技术，但我确实觉得中国开源模型，在资源非常受限的情况下。做出了很了不起的东西，不过这里面有很多蒸馏，所以我认为除了没有足够的compute，去服务Mythos 之外，他们也不想让他被蒸馏，他们想自己用Mythos。自己去蒸馏他，用他来对下一个模型做RL，或者做别的事情，然后我觉得最终，如果OpenAI 的经济账算得过来，前沿阵营里的任何一家，都会面临同样的问题。这里会出现非常有意思的博弈论，因为这是一种新的囚徒困境，我们之前讲过老的囚徒困境，主要是围绕着，你处在一个必须花钱的囚徒困境里，新的囚徒困境会是。 [00:49:12]

如果你站在前沿，你到底要不要通过API 发布那个模型，如果所有前沿公司都同意不这么做，那中国开源模型很快就会完蛋，但只要有一个人背叛协议，他就会拥有最好的模型。会有大量收入和现金流，当然资源等于智能，所以他会开始领先，然后这又会导致其他所有人也把模型放出来，所以这是新的博弈论，他有点像TSMC，Samsung 和Intel之间的那种博弈。现实是如果像Nvidia 或AMD 这样的公司，真的非常认真地使用其他晶圆厂，那家晶圆厂会很快变强，所以我确实认为，Jensen 会让开源模型在一定时间内落后于前沿。我觉得这会是一件非常值得观察的事，顺便说一句，开源也是可以变现的，有一个误解，好像开源就是免费的，开源token 也要花钱，他们要消耗能源生产。

他们也要能源，你需要靠GPU把成本赚回来，而开源模型公司几乎总是会拿收入分成。 [00:50:33]

Atreides 如何使用 AI：安全词、机关枪与 agent

Patrick O'Shaughnessy： 你们怎么让Atreides 为Mythos 3、Mythos 4的世界做准备。

Gavin Baker： 我们就是努力在网络安全上过度投入，有件事我在很多场合都说过，而且我真的相信就是每个人都需要一个安全词，每个人都应该把数字设备放下，真的去海边和家人设一个安全词。或者和公司设一个安全词，而且这个安全词不能是那种，可以被社会工程学套出来的东西，这主要是为了避免网络犯罪，比如看起来像是你儿子女儿，祖父母父母。或者其他亲人给你FaceTime，但那其实是对他们极其准确的模拟，他知道一切还能根据他们过去说过的话，推断他们接下来可能会怎么说，然后他对你说。给我打一百万美元，这是防守，那进攻呢？ [00:51:29]

我想问的是，还有什么事是你仍然能做，但他做不了的，从分析的角度说这是个好问题，我最近刚又看了一遍《最后的武士》，还让公司里的人也去看，如果你没看过《最后的武士》。我强烈推荐你去看，这其实是一部经得起时间考验的电影，是20年前Tom Cruise演的，他的设定是，Tom Cruise是一个愤怒落魄的南北战争老兵。但他其实是个非常优秀的士兵，他之所以愤怒落魄，是因为他觉得自己参与了，对美洲原住民的恶劣行动，后来日本雇用了他，时间是在明治维新时期，日本政府里的现代派。雇他去训练一支由农民组成的军队，让他们学会怎么和武士作战，第一次战斗里，当然是武士赢了，虽然他们没有枪，他打得很英勇，所以武士决定不杀他，而是把他带回村子。 [00:52:16]

后来他成了一名武士，对他来说这感觉很像南北战争，于是他站在武士一边作战，到最后，他被一个拿着机关枪的农民屠杀了，机关枪已经出现了，如果我们不能都成为机关枪的大师。我们就会被机关枪支配，所以我正在努力成为机关枪的大师，我也比较乐观，我觉得会有很长一段时间，就像如果你是一个50岁的武士老兵，打过很多仗，是用剑的大师。那你在使用机关枪时，也会有优势，我一生都在学习投资，所以我乐观的认为，我能够掌握这挺机关枪，也就是掌握这项新技术，把它融入我自己的流程，也融入我们公司的流程。这样我作为一个人类，还能在很长时间里继续贡献价值，但现在我也和大家一样，agent基本一直在跑，你问我最有用的agent是什么？

说实话，最有用的那个，我想我之前也跟你说过，我不想影响你的生意，但对我来说最有用的agent，就是把播客里，我会感兴趣的要点总结的非常好，每天大概有六个小时的内容。我觉得按我的工作职责，我都应该去看，每次只要OpenAI，xAI，Google、Cursor，Fireworks，Baseten的人出来讲话，更不用说Jensen。Elon，Dario这些人，我都会觉得自己必须看，但我真的没有那么多时间，而且这里面确实是大海捞针，有一类东西是我总想看的，比如我对管理层薪酬非常敏感。他们的激励是什么？ [00:53:32]

他们拿的只是普通的RSU还是PSU，如果是PSU，那这些PSU到底在激励他们做什么？如果系统能先把这些做一遍很好的出筛，就能给人省下很多时间，这样人就可以去做更有创造性的工作，而不是去翻proxy statement，把PSU那一段抠出来。再和之前所有proxy statement对比，看它发生了什么变化，因为这里面是有信号的，但非常耗人工，而这类工作特别适合AI，投资里显然还有各种类似的事情。这是做投资人最令人兴奋，最让人激动的时代，确实是这样，但我也有一点开始有点担心了。 [00:54:20]

Patrick O'Shaughnessy： 你是说分化这个问题，你能不能再多讲一点？是什么样的人，再把这种情况延续下去。

市场分化、巨头格局与 startup 互动

Gavin Baker： 我认识的人里像我这样，还不非常看多DRAM 的，一个都没有，真的一个都没有，现在AI 里有很多有意思的事情，其中一个是从横截面来看，估值完全不合理。就是明摆着不合理，不可能都同时成立，有些半导体设备公司，按下个季度年化利润算，交易在40倍，而DRAM 公司，在上一个周期顶部的时候，交易在中个位数倍。当时一度大概是5倍对12倍，某个时候甚至是3倍对45倍，这两边不可能都对，是的，半导体capex公司的商业模式，确实比存储公司的商业模式，改善的更多。我们还不知道HBM 会把存储公司的商业模式，改善到什么程度，是的，他们确实有一部分来自零部件，和维护的经常性收入，但这不值得给出10倍的估值倍数差。 [00:55:12]

我觉得很难解释，Nvidia这样的估值，4月初的时候，相对整个市场来看，它基本上已经是过去10年，或者12年里最便宜的区间，绝对估值也很便宜。但你很难把这个估值，和GE、Vernova这样的估值，放在一起解释，因为后者的估值里，隐含的是Nvidia，会丢掉一个难以想象的份额，所以从横截面来看。估值差异非常大，原因是我们现在处在短缺里，质量最低的公司反而表现最好，如果你是油气投资人，或者矿业投资人，自然资源投资人，而且你很熟悉成本曲线的思维。这一点对你会非常直观，在一个真正的商品牛市里，成本最高的商品供应商，涨得最多，因为他们受益最大，他们会从濒临破产，变成现金流喷涌，我觉得这也是商品投资。

特别难的一个原因，因为在周期里质量会跑赢，但真正所有的超额收益，往往发生在下行周期，那些高成本公司，在短缺和商品牛市里，曾经涨上天，后来就会破产。或者发生类似的事情，你现在在每个行业，都能看到这种事，质量最低的玩家，在不同的行业里，本来是hyperscaler，和买家都讨厌，都嫌弃的，因为他们成本高。不可靠零部件，故障率高等等，但他们现在全卖光了，还在涨价，然后这种情况，又引起了X 上一些，散户账号的兴趣，这些股票就被一路，买到天上去，反过来一些质量。更高的表达方式，实际上表现的非常落后，作为投资人这很难，因为你几乎毫无疑问的知道，那个三个月或六个月涨了十倍的东西，最后会掉回去，当然这也取决于他们拿这笔现金去做什么？ [00:56:36]

但这些低质量公司，真的会用现金做很聪明的事，所以让我有点担心的是，一年前非常怀疑的人现在已经不怀疑了，但我再把这件事和那些高质量公司的估值，放在一起看。他们其实并没有被拉得很高，这又让我感觉好一些，不过确实有一种感觉，我一直觉得2024年和2025年，有人问AI 有没有泡沫，或者谈AI泡沫，这件事挺好笑的。因为核能泡沫和量子泡沫就摆在你面前，我们到底在讨论什么？AI 这个东西是真实的多的，但核能量子那些有点荒唐的东西，可能已经蔓延到了一些更投机，质量更低，市值更小的名字上，如果你在X或Reddit上有很大的影响力。 [00:57:22]

这类股票就很容易被推起来，这让我有点害怕，但我只是希望AI 空头能多一点，比如我希望存储空头能多一点，我之所以这么想，有一个原因是，Astera这只股票。我已经关注了很长时间，看空Astera的人很多，这点我很喜欢，挺好，我最早是在Series C投的，所以如果你觉得，能让我用不同方式给它定价。那就祝你好运，要是你觉得它是所谓的Copper loser，那也祝你好运，市场里还有各种basket，带杠杆的basket，你被归到哪个basket里非常重要。比如铜、光模块和DRAM，今年发生了一件很有意思的事是，2024年和2025年，AI 这笔交易基本是一起走的，你可以做多GPU compute，scale-up networking。 [00:58:09]

光学scale-out，同时做空电力，从风险管理角度看，这个交易是有效的，因为我非常在意factor，但今年1月这一切都散了，比如scale-up networking会暴涨。而scale-out在下跌，或者DRAM 大幅跑输NAND 和HDD，AI 内部这些横截面的相关性，真的崩了，你必须看得非常细，你不能再用一些半导体设备股。或者NAND来对冲memory了，一月份所有横截面的关系，都发生了很有意思的变化，我觉得原因之一可能是，AI的质量到了一个阶段，突然让很多人很容易。把这些不同子行业研究得很明白，然后开始交易它们，再把它们放进不同的basket，这些basket又会影响AI 带来价格效率，对没错，所以我觉得在那些高质量公司之外。

还有一些最大的机会，这些高质量公司我认为能长期复利，也比较安全，不像那些低质量公司那么吓人，机会在于那些被错误分类的公司，比如Astera就被放进了很多Copper loser basket。但Astera最大的产品会是Switch，他们会同时用铜和光把Switch连接到Accelerator，所以从定义上说，如果你是一家Switch公司。或者是一家Accelerator公司，你就不可能是Copper loser，因为你在那条连接的另一端，我想请你对每家主要公司，都简单聊一两句，比如Google、Microsoft、Amazon。这些上市的大玩家，我感觉我总是忘了问你，因为对话总是围绕那些，令人兴奋的新公司展开，先说Google，去年它非常强，因为它有TPU优势，但这个优势现在已经没了。 [00:59:52]

我觉得他们仍然处在，很好位置的原因，很简单，他们拥有最多的compute，我们刚才也聊过，在供给短缺的时候，已有装机基础的价值会更高，他们拥有最大的。compute 装机基础，我有点惊讶的是，他们一直没能拿出，更强的东西，Google I/O就在这周，对，就是这周，如果他们这次发布的东西，连稍微超过OpenAI。或者 Claude 的都没有，那就很有意思了，这对Google 不是灾难，只是很有意思，它说明我们刚才讨论的，Nvidia effect，可能比我想象的还要强。我非常好奇，五天之后，Google发布新东西以后，Pareto frontier到底会变成什么样，这对他们来说是一张大牌，不过Google 拥有的数据量。 [01:00:30]

还有YouTube数据，确实非常有价值，在robotics的世界里，它真的有价值，再加上他们拥有的Compute，以及他们的搜索业务，Google永远不会处在一个差的位置。你也能从GCP的狂飙里看到这一点，你也必须给Zuckerberg和Meta认可，他把Meta在内部变成一家AI First公司，这件事做得很好。我确实认为，在这些真正的互联网巨头里，他是唯一一个做到这件事的人，这点我非常认可他，他当时愿意为人才付高价，签下那些10 亿美元级别的合约，我也非常认可。那个Talent和Muse，我觉得是一个非常大的正面意外，这是MSL的第一个模型，它还不在frontier的Pareto frontier上，还比不上xAI、Google 的一个模型。 [01:01:14]

还有OpenAI 和Claude，但已经很接近了，这让我非常印象深刻，所以我觉得Meta 的位置比之前更好了，绝对位置还没有Google那么强，但它的位置在改善。在市场里变化速度比当前水平更重要，尤其是在三年这种较短的时间框架里，更长时间看竞争优势的水平往往会占主导，但即便如此，变化本身也真的很重要，Amazon 我觉得位置也很强。因为有Trainium未来18个月，你会在他们零售业务里看到，robotics带来真实的P&L效率提升，我其实觉得Nova，也就是他们的内部模型。还没到Muse的水平，但比市场给他的评价要好，再说Microsoft，我觉得Satya是一个非常聪明的人，但在投资者交流里，大家谈论他的方式。 [01:02:08]

已经不是以前那样了，我喜欢Satya也很敬佩他，我觉得他是一位非常出色的CEO，他做出的那些决定，我也很认可，但他确实在三年时间里，从我们要让Google跳舞。变成了Copilot的产品经理，我真的很想知道，在OpenAI那次政变尝试期间，Satya会不会后悔自己的决定，Satya内心深处，会不会希望自己当时支持的是Ilya。而不是Sam，会不会希望今天真正掌管OpenAI 的是，Ilya和Mira，我真的很想知道，因为我觉得在那个世界里，Microsoft 和OpenAI 的合作关系。可能会非常不一样，我觉得这是一个非常有意思的问题，只是我们永远不会知道答案，但我还是很认可它，它现在做的事就是在承担风险，这样他们才有机会获得回报。

这就回到你在不确定性，追行区里必须做的那些决定，不只是花多少钱，还包括把钱花在什么地方，我觉得微软在2025年初，有那么一瞬间退缩了，他们原来有一套算法。我们投入这么多capex，就能得到这样的回报，那套算法当时有点失灵了，如果你退缩就会失去位置，你会失去很多分配额度，而且很难拿回来，所以他们退缩了一下。现在Satya正在做的决定，市场因此惩罚了他们，但我觉得这是正确决定，那就是我们要把自己一个PU用起来，而不是拿去卖，我的意思是谁知道，如果他们愿意直接把GPU 卖给OpenAI。Azure的增长会有多快，他们现在是要把Compute用在内部，让自己的产品变得更好，Copilot这么差，或者说之前一直这么差，一个原因就是可用的Compute不够。 [01:03:41]

他们正在修这个问题，他现在就是Copilot的产品经理，我确实觉得他是一个很优秀的CEO，他们也在尝试用自己的compute，来训练自己的模型。我有点怀疑他们是不是有合适的团队，能把这件事做成，但他们当然有能力像Meta 一样，花钱去招人，也许换一支不同的团队，但我觉得他正在做一些好的决定。而且这些决定有风险，目的是让微软为这样一个世界做好准备，frontier model不再能通过API访问，我觉得这是一个非常有勇气的决定，所以我很佩服他。他也放弃了很多东西，我的意思是，如果微软把GPU 用来服务OpenAI，只服务OpenAI 和Anthropic 的capacity，而不是用在自己的产品上。 [01:04:35]

微软的股价，今天可能已经是800美元了，所以我很佩服他做了一个很棒的决定，真正有意思的是，这些公司在做决策时，到底有多面向外部和startup。互动最深的两家公司，远远领先的是Amazon和Nvidia，然后Google 也有非常深入的互动，再往后，Broadcom的参与方式不一样，他们基本上是所有人最喜欢的ASIC供应商。如果你是一个startup，第二代芯片能和Broadcom 合作，大家会觉得这是一次升级，如果第一代芯片Broadcom 就愿意和你合作，那简直像天上掉下来的礼物。然后你会看到AMD、Microsoft 和Meta，跟startup的互动基本为零，当然我说零有点夸张，但确实非常少，我就会想，这个决定到底意味着什么？ [01:05:30]

因为现在一些最好的团队，已经不在大型上市公司里了，而是在这些更小的startup 里，我觉得这种互动，最终会变成一个相当大的优势，Nvidia、AMD。还有紧随其后的Google，会因此受益，而其他这些hyperscaler 身上，你看不到这种互动，我们快收尾了，我很好奇，关于这个巨大趋势，你有没有开始想到一些。更外围的连锁反应，可以随便展开讲讲，我们已经很详细的聊了，受影响最大的具体公司，也稍微聊了应用层，以及如果想让更多价值流向这一层，必须发生什么？ [01:06:14]

AI 的连锁反应、人身安全与 Pax Americana

Patrick O'Shaughnessy： 我很好奇，随着这个世界变化得这么快，你还在想哪些有意思的连带影响？

Gavin Baker： 确实很疯狂，应用层先别说价值流向了，价值已经被摧毁了，AI在应用层是净摧毁价值的，即使把Cursor、Cognition，这些最成功的AI-native公司算进去。AI也已经在应用层摧毁了数万亿美元的价值，在这个背景下，我确实觉得有一件事我们需要意识到，今天表现最好的公司，也就是估值涨得最多，创造经济价值最多的公司。是那些每个人对应的，以使用GPU比例最高，有效比例最高的公司，也许这只是意味着，未来每个人都会得到很多GPU，但我觉得这是一个有意思的事实，我们需要注意到。我还想说，也许这有点阴暗，但我越来越担心人身安全，我对这件事越来越担心，对那些公众曝光度高得多，和AI关联更强的人，我会更担心，但我真的担心人身安全。

我希望不要发生什么悲剧，可是美国这里的政治暴力正在上升，随着AI 越来越政治化，我担心这种暴力会越来越多地，指向AI 领域的政治领袖，不管我们同意什么？也不管我对OpenAI怎么看？或者不怎么看？我都觉得有人像Sam Altman家里扔Molotov cocktail，这件事非常可怕，我担心因为AI我们正在进入一个波动更高，Beta更高，风险更高的世界。 [01:07:38]

对我个人来说是这样，然后对棋盘上的大玩家来说，你想想这在地缘政治上意味着什么？我们正在看到乌克兰人真的开始赢了，至于他们为什么在赢，我觉得其实并不是因为他们有更好的无人机，我觉得他们确实有更好的无人机，这是原因之一，但我认为乌克兰真正开始赢。是因为他们拥有可能仅次于美国和以色列的最佳战场AI，当中国或者他们的对手开始消化这一点时，他们会怎么回应，如果美国因为AI领先而占优势，那对美国当然很好。但对世界其他地方来说，这是不稳定因素，我经常想的一件事，是创办一个慈善机构去教育全世界，西方到底做过多少了不起的事，奴隶制基本上曾经存在于，几乎所有文明里。 [01:08:25]

而真正终结奴隶制的，是大英帝国这个故事，应该被讲出来，但美国在1945年之后拥有核弹，其他国家都没有，我们本来可以永远控制世界，可我们没有那样做。我们重建了德国和日本，而他们现在是美国最可靠的盟友，以色列韩国日本，这些都证明了美国这个国家的精神，我们没有接管世界，当时确实有这种担忧，也有记录。美国将军们尤其是麦克阿瑟，在日本有点像美国皇帝，有人担心美国会接管世界，美国当时确实有能力这么做，但没有这么做，他们回家了，我们还去军事化，然后世界进入了一段很长的全球稳定时期。虽然中间也有可怕的战争和危机，这就是Pax Americana，美国治下的和平，所以也许这并不会造成不稳定，也许它会带来另一个，由我们的AI主导地位塑造的Pax Americana。 [01:09:05]

我非常乐观，觉得AI会给世界带来很棒的东西，有个人他的女儿被诊断出一种非常罕见的基因突变，没有疗法，他调动了很多资源，也从一些实验室拿到了大量compute。那些实验室知道了这件事之后，就迅速启动起来，他们启动了大量agent，用AI找到了一种已经上市的药物，真的可以影响他女儿的疾病，后来他又创办了一家公司想要治愈这种病。因为AI，他的人生已经发生了无法衡量的变化，所以我是AI 乐观派，甚至可以说是AI 最大化主义者，但我也承认，AI就像是一个事件视界，我很确定，它会成为一个断点。作为社会，我们必须想办法穿越过去，我认为卢德主义者最终会是错的，但我们必须非常认真地对待他们的担忧，我们要确保AI对每个人都有好处，现在最好的AI。

只对有很多钱的人开放，这确实有点反乌托邦，这个问题我们必须解决，我们需要带着谦逊来面对这件事，承认这里有大量不确定性，并且认真思考。 [01:10:27]

Patrick O'Shaughnessy： 每次跟你聊完，我之后都会跟别人说，希望你也能找到一样东西，像Gavin 热爱市场，公司资本主义和历史那样热爱他，今天也都展现出来了，Gavin一如既往。非常感谢你抽时间来聊。

Gavin Baker： 谢谢，谢谢你Patrick。

电力、晶圆与 AI 基础设施的未来