英伟达的免费 API，限速了吗

作者: 纯情
时间: 2026-02-02
分类:
评论

官方写的是 40RPM ，用了很长时间了，确实是。但是从昨天开始，出现了大量的 429 错误。

我能确定我的 RPM 是控制在 40 以内的，怎么个情况 😂

烧 2 万亿美元却难用？Gary Marcus 狂喷 AI 赛道不靠谱：推理模型只是“模仿秀”，OpenAI 一年后倒闭？

作者: 纯情
时间: 2026-01-27
分类: 资讯
评论

整理 | 华卫

“一圈又一圈的循环融资，投资回报率却不尽如人意，这些 AI 系统实际用起来也远没有想象中好用，或许方向本身就站不住脚。”

近日，知名 AI 专家、认知科学家 Gary Marcus 在一场访谈中愤愤表示，“整个世界都在全力押注神经网络，还在这个我始终觉得毫无道理的理念上投入了巨资，但大语言模型根本无法带我们抵达 AGI 这一终极目标。”

这场对话由曾因成功预测 2008 年金融危机而闻名的传奇投资人、华尔街最具影响力人物之一 Steve Eisman 发起，他与 Marcus 共同探讨了当下 AI 进展的方方面面，包括商业路径、社区现状和未来方向等。Marcus 认为，大语言模型已经达到了收益递减的阶段。并且，他指出，现在 AI 领域根本没有技术壁垒了，所有 AI 企业的研发思路基本一致。

对于大量人才从大厂离职去办初创公司的现象，Marcus 直言道，“如果 OpenAI 真的能在下周推出 AGI，谁会在这个即将改变世界的关键节点离职，去创办一家可能要花四年时间才能做出成果的小公司？显然没人会这么做，大家都会想留在公司见证这个时刻。”在他看来，这些企业内部的人也清楚，他们根本没有做出宣称的那种突破性成果。

值得一提的是，他认为，OpenAI 最终会成为 AI 领域的 WeWork，这家公司原本计划以 500 亿美元的巅峰估值风光上市、却在一夕之间破产。“我觉得最终 OpenAI 可能会被微软这样的企业收购。OpenAI 每个月的亏损大概有 30 亿美元，一年就是 300 多亿美元，即便最近完成了 400 亿美元的融资，也只够支撑一年的运营。”

谈及各家模型的未来，Marcus 的预测是，“大语言模型会成为一种标准化商品，各家的模型只会比上一年的版本稍有提升，差距微乎其微，最终品牌差异会变得无关紧要。当产品变成商品后，价格必然下跌。”

以下是详细对话内容，我们在不改变原意的基础上进行了翻译和删减，以飨读者。

2 万亿美元押注 Transformer，根本“毫无道理”？

Steve Eisman：大家好，我是 Steve Eisman。今天我们请到了一位特别的嘉宾，他就是 Gary Marcus。他是大语言模型的坚定质疑者，而大语言模型正是整个 AI 领域的核心根基。接下来，Gary 会和我们分享他的观点，聊聊大语言模型到底是什么。

Gary Marcus：谢谢你的邀请，也感谢一两个月前你在 CNBC 对我的盛赞。

Steve Eisman：不客气，这都是你应得的。在正式开始之前，我的观众大多还不了解你，不如先和大家说说你的背景，让大家知道你在这个领域发表观点是完全有底气的。

Gary Marcus：我这辈子几乎都在研究智能相关的问题。我 10 岁学会编程后，就开始涉足 AI 领域了。我的职业生涯中，很大一部分精力都用在研究自然智能上，比如人类的智能、还有孩子是如何学习语言这类问题。我在 MIT 的博士论文围绕两个方向展开，一个是儿童的语言学习机制，另一个就是神经网络。神经网络是 AI 领域的一种特定研究方法，也被用于人类思维的建模，它的设计灵感可以说和大脑有一点松散的关联。这其实是个很巧妙的营销说法，会让人觉得它是完全基于大脑研究的，但事实并非如此，二者只是浅层关联。早年间神经网络就曾风靡一时，我在上世纪 90 年代就研究过这类模型，发现它们并不能很好地模拟人类的思维方式，但我还是投入了大量精力，想弄清楚它们的实际工作原理。

2012 年深度学习重新兴起时，我当时就觉得，这些东西我早就研究过了，和我博士论文里的内容高度相似。我在 2001 年写过一本名为《The Algebraic Mind》的书，在书里我其实就预判到了如今大语言模型出现的幻觉问题，还有一些推理层面的缺陷，这些都是我们今天要探讨的话题。所以当深度学习再次成为热点时，我一眼就看出了其中的诸多问题，对我来说这些问题都很熟悉。2012 年，我在《The New Yorker》上发表了一篇文章，标题是《Is Deep Learning a Revolution in Artificial Intelligence?》，我在文中写道：“深度学习确实很有意思，我很佩服 Jeff Hinton，他能长期坚持自己的研究方向。”

Steve Eisman：Jeff Hinton 是谁？

Gary Marcus：他是去年诺贝尔生理学或医学奖的得主，也是深度学习领域的核心奠基人之一。

Steve Eisman：原来如此。

Gary Marcus：他的一些学生，最近也开始认同我的观点了。Jeff Hinton 确实是这个领域的大人物，在神经网络一度无人问津的时期，是他一直坚守，这份坚持值得肯定。但当然，他的研究并非全无可议之处，我们这里就不细谈了。他让神经网络重获关注，而更值得你的听众了解的是，真正让这个领域迎来爆发的，是他的学生 Ilya Sutskever，或许还有另外几位研究者。他们找到了方法，能让这套研究了许久的系统落地应用。要知道，神经网络的研究最早能追溯到上世纪 40 年代，Jeff Hinton 也在上世纪 80 年代中期做出了不少重要贡献。而这些研究者发现，借助英伟达研发的图形处理器（GPU），就能实现神经网络的高效运行。

彼时的英伟达，生产 GPU 主要是为了满足电子游戏的需求。这些原本为游戏设计的 GPU，核心优势在于并行计算，简单来说，就是能同时处理多个计算任务，而非按顺序逐个完成。传统的中央处理器（CPU），运行软件程序时基本是逐行执行的，虽然现在的技术已经有了改进，但这仍是计算机科学入门课程里会教的基础原理。而 GPU 能把一个复杂问题拆解成无数个小任务，同时进行处理，它的设计初衷就是为了计算机图形处理。比如要渲染电子游戏的下一帧画面，如果逐行处理，耗时会非常久，而用 GPU 的话，能同时处理整个画面，一个子处理器负责一个像素点，以此类推。不得不说，GPU 在图形处理上的表现堪称完美，我偶尔也玩电子游戏，深知 GPU 的算力有多惊人。

Ilya Sutskever，还有另一位我一时想不起名字的论文合作者，他们证明了 GPU 是运行神经网络的绝佳载体，至于神经网络的具体定义和实际意义，我们之后可以再聊。他们的这一发现，让神经网络的运行实现了两大突破：一是速度大幅提升，二是能处理海量数据。在此之前，六十多年的神经网络研究做出的基本都是些玩具级的模型，而他们证明，借助 GPU 这项技术能真正实现规模化的实际应用，能在更大的维度上落地。可以说，我们如今看到的所有深度学习成果，都源于 2012 年的这次突破。

而在这一突破出现后，两件事接踵而至：《The New York Times》刊发了文章，盛赞深度学习的惊人潜力；第二天，我就在《The New Yorker》的博客上发表了文章。我在文中表示，深度学习固然出色，但也存在诸多问题，它注定会在一些领域表现优异，却在另一些领域束手无策。它擅长模式识别和统计分析，这一点毋庸置疑，但人类的认知活动中还有大量的抽象思维过程。比如我们能理解家谱的逻辑，进而对现实世界的相关问题进行推理，而深度学习模型永远无法擅长这类任务，它的架构本身就不适合做抽象推理。从早年对神经网络的研究以及对人类认知机制的研究中，我早就看清了这一点。你应该读过 Daniel Kahneman 的经典著作《Thinking, Fast and Slow》吧？

Steve Eisman：我读过。

Gary Marcus：Daniel Kahneman 在书中提出了双系统认知理论，他将人类的认知分为系统一和系统二。系统一的思考速度快，是无意识的、基于统计的、本能的反应；而系统二的思考速度更慢，更具思辨性，核心是逻辑推理。神经网络本质上就相当于人类的系统一，这本身没问题，系统一也是人类认知的重要组成部分，但人类的认知还有系统二的部分。尤其是在理性思考时，我们会依赖系统二，进行更审慎、更有逻辑的推理。而神经网络模型，从始至终都不擅长系统二的这类任务，直到现在依然如此。我在 2012 年就指出，深度学习模型只能实现系统一的功能，却无法完成系统二的思考。

而在这之后的 14 年里，整个世界都在全力押注神经网络。这里要说明的是，我们所说的神经网络，就是如今的大语言模型，大语言模型是神经网络的一种形式，抱歉，我之前没明确说明这一点。事实上，2012 年时大语言模型还未出现，后续又有不少技术突破，其中关键的就是 2017 年发表的 Transformer 论文，这也是大语言模型的起源。而全世界在这一领域的投资规模达到了天文数字，据我粗略估算，已经有 1 到 2 万亿美元了，全都投在了这个我始终认为毫无道理的理念上。这些研究者的想法是，只要持续发展神经网络，就能实现智能所需的一切能力，抵达 AGI 的目标，但他们却忽视了系统二的核心价值。

一开始，他们只是把神经网络当成一个巨大的黑箱，直到现在，还有很多人抱着这样的想法。他们觉得，只要把海量数据喂进去，就能得到一个拥有智能的系统，却从未从科学的角度深入思考过真正的智能究竟该具备怎样的架构。我认为这些人太过天真，我也一直试图指出这一点，这也让我成了这个领域里的“孤行者”。很长一段时间里，人们对我的观点不屑一顾，甚至不只是不屑，而是鄙夷。

Steve Eisman：没错，他们对你的态度远不止是不屑，而是赤裸裸的鄙夷。

Gary Marcus：我们还能举出很多这样的例子。我对他们的这种态度感到失望，这个话题我们可以聊很久。他们甚至对我公开表现出敌意，比如我了解到，OpenAI 内部还为我做了专属的表情包。

Steve Eisman：我也看到过这个消息。

Gary Marcus：某种程度上，这也算是一种认可吧，既觉得荣幸，又觉得有些离谱，你能看出来，我一直试图用平常心看待这件事。但这也能从侧面说明问题，Sam Altman 还在推特上称我为“喷子”。他们就是不想听我的观点，而我核心的观点，都写在了 2022 年发表的论文《Deep Learning is Hitting a Wall》里。我在这篇论文中指出，当时“规模化扩张”的理念已经开始流行，也就是通过不断投入更多数据、更多 GPU，把模型做得越来越大，他们认为只要模型足够大，就会拥有超乎想象的能力。

我先暂停一下，和大家解释下这个“规模化扩张”的理念。他们确实有一些数据能支撑这个观点，但这种想法依然太过天真。我把这种理念称作“万亿磅婴儿谬误”，道理很简单：一个婴儿出生时 8 磅重，一个月后长到 16 磅，并不意味着他会一直这样翻倍增长，到上大学时长成万亿磅的巨人。他们就是做出了这样天真的推断，我相信你在商业领域也经常见到这种情况。很多手握巨资的聪明人，都押注了这个理念，他们说，“我们从数据中看到了这样的发展规律，只要投入足够多的数据，就能实现真正的智能。”

“大模型不会思考，重构信息碎片致幻”

Steve Eisman：先稍停一下，我们倒回去说。大语言模型到底能做什么？这些研发者又认为它们本该实现什么功能？我真想把这个问题彻底讲清楚。

Gary Marcus：你这个问题问得特别好。大语言模型的核心工作原理，就是预测序列中的下一个内容。你可以想想苹果手机的自动校正功能，原理差不多，虽说那功能有时候能把我逼疯，你继续说。这个功能并非总能生效，核心逻辑就是你在输入句子时，它会预判接下来可能要打的内容。比如你打出“在……见我”，它大概率会推测你想说“在餐厅见我”。它会对人类的语言表达做统计分析，效果还算过得去，但绝非完美，偶尔还会出错，让人恼火，这就是我们说的自动补全。

而我把大语言模型称作“超级版自动补全工具”，它们只是用一种特殊的方式完成这种预测，这就是其最本质的功能。它们的运作方式里还有些有意思的点，其中一个就是会把所有信息拆解成细碎的片段，之后再重新整合，这就导致信息之间的关联会被切断。也正是因此，它们才会时不时出现幻觉现象，凭空编造内容。

Steve Eisman：我们稍后再细说幻觉这个问题。

Gary Marcus：好，回头再聊。幻觉是这类模型的典型错误之一，早在 2001 年，大语言模型甚至还没被发明出来的时候，我就指出过这个问题。我当时就说，如果一直沿着这个方向研究下去，必然会出现这个问题，而事实也确实如此。大语言模型把信息拆分成碎片，再通过这些碎片预测后续内容。如果用整个互联网的内容对它们进行训练和数据投喂，它们的表现会好得让人意外，因为几乎任何你能想到的问题，注意，这里的“几乎”是关键，几乎所有问题，此前都有人提出过，也有人给出过答案。从某种程度来说，这些模型就是功能强大的记忆机器。

就在前几天，《大西洋月刊》还刊发了相关的文章，而且一直以来都有大量证据能证明这一点。比如你输入《哈利·波特》的部分内容，它能直接补完整段文字，本质上就是因为它记住了这些内容。如果一个模型能记住整个互联网的信息，那确实算得上很厉害。比如你问“道奇队在搬到洛杉矶之前，主场在哪”，网上有大量相关表述，它会告诉你是布鲁克林，大概率能给出正确答案。但仅仅依靠这种方式，模型根本无法形成抽象的概念和思想，还会因为信息碎片的拆解和错误整合出现各种问题。

Steve Eisman：那我们现在聊聊幻觉吧。到底什么是 AI 幻觉？举个例子，再说说出现这种情况的原因。

Gary Marcus：幻觉就是模型凭空编造内容，还无比笃定地呈现出来，但这些内容根本不符合事实。

Steve Eisman：那给我们举个例子。

Gary Marcus：我最喜欢的一个例子和 Harry Shearer 有关，你可能听过他的名字，看过《摇滚万万岁》吗？

Steve Eisman：当然看过。

Gary Marcus：他在这部影片里饰演贝斯手，巧的是，他还是我的朋友。他出演了《摇滚万万岁》，还和 Christopher J. Guest 合作了多部影片，参演了《楚门的世界》，还为《辛普森一家》里的伯恩斯先生等多个角色配音，他的知名度还挺高的，这点对接下来的故事很重要。先倒回说个题外话，我之前遇到的最典型的幻觉案例，主角是我自己。有人发给我一份我的人物简介，里面说我养了一只叫 Henrietta 的宠物鸡，但我根本没养过，这就是个很典型的幻觉案例，纯粹是凭空编造的。后来发现，有位插画师大概叫 Gary Oswald，写过一本关于 Henrietta 去上学的书，模型不过是把这些碎片化的信息胡乱拼凑在了一起。

Steve Eisman：那为什么会出现这种幻觉呢？

Gary Marcus：这就和我刚才说的信息碎片化拆解有关了。我再给你讲讲 Harry Shearer 的那个例子。我总拿宠物鸡 Henrietta 的事举例，有一天他给我发消息，说他没遇到过宠物鸡这种事，却遇到了和自己相关的幻觉案例。他比我有名多了，至少以前是。我当时也算小有名气，而模型给出的信息里，说他是英国的配音演员和喜剧演员，但他根本不是英国人。你只要花两秒看一下维基百科，就会发现他出生在洛杉矶。他名气不小，你也能在烂番茄、互联网电影数据库上查到他的资料，他接受过很多采访，也聊过自己的成长经历，他小时候还在洛杉矶的《杰克·本尼秀》里当过童星，想找到正确的信息一点都不难。

我们会错误地把大语言模型当成和人类一样拥有智能的个体，但实际上，它们所做的只是重构信息碎片之间统计层面的大概率关联，所以难免会出错，这种重构过程也常会出现偏差。Harry Shearer 这个案例就是如此，模型其实就是在构建一个信息集群，用统计学的方式预测各类信息之间的关联。而现实中确实有很多英国的配音演员和喜剧演员，比如 Ricky Gervais、Don Cleeve 等等。模型就把这些信息混为一谈了，这种信息融合的方式整体来看效果还算不错，但你永远无法确定它给出的某一个具体信息是准确的，所以幻觉现象才会频繁出现。

有人专门追踪过相关的法律案件，发现律师提交的辩护状里，有很多引用的判例都是模型编造的，根本不存在。我第一次关注这件事时，他已经发现了约 300 起这样的案件，三个月后再看，数量涨到了 600 起。这些律师不仅用 ChatGPT 这类工具代写文书，还因此被法官发现，受到了处罚。模型会出错，而最危险的是，这些错误还很容易被忽略，人们根本发现不了。还有一个例子，CNET 是最早用 AI 写稿的媒体之一，他们首批用 AI 写的 75 篇文章里，有近一半都存在错误，编辑们却没发现。因为这些文章语法通顺、格式规范，也没有拼写错误，人们很容易就放松了警惕。

我把这种现象称作“看着没问题效应”。大语言模型带来的这种效应，还催生了一个新词汇，我真后悔不是我发明的，叫“低效工作产物”。这个词大概是去年由几位教授提出的，指的是人们用 AI 写报告、提交给雇主，表面上看没什么问题，实则漏洞百出，因为大语言模型根本不具备真正的理解能力。

Steve Eisman：你的意思是，大语言模型并不会思考。

Gary Marcus：它们确实不会思考，只是把统计学上大概率关联的内容拼凑在一起。

Steve Eisman：只是简单拼凑。

Gary Marcus：没错。我还喜欢用“黏合”这个词，它们只是把信息黏合在一起。从统计学角度来说，大部分内容的拼凑是合理的，但总有一部分是错误的，而这些模型根本无法区分对错，也不会主动告知你。它们永远不会说，“维基百科显示 Harry Shearer 出生在洛杉矶，但作为大语言模型，我感觉他可能出生在伦敦，你可以去核实一下”。它们从来不会给出这样的提示，只会把所有内容都当作百科全书里的标准答案呈现出来，无论真假，这也是这类模型的危险之处。

Steve Eisman：确实是这样。

Gary Marcus：这类问题其实有很多，这个案例属于另一种情况，但也和模型的本质缺陷有关。这个问题的根源在于，所有大语言模型都有数据截止日期，它们的训练都是在某个特定时间点完成的，核心模型所掌握的信息，也只到这个时间点为止。研发者会给它们加各种补救措施，比如接入网络搜索功能，但这些补救措施和核心模型的融合效果都很差，不同系统的表现略有差异而已。这类模型最大的问题就是无法应对新事物、新情况，也是它们最根本的缺陷。早在 1998 年，我就通过研究早早发现了这一点。如果一个模型本质上只是个功能强大的记忆机器，当你向它输入一个超出其训练数据范围的内容时，它就会失灵。

有个例子特别能说明问题，具体细节我不太清楚，但特斯拉的 AI 系统也大量采用了这种记忆式的运作方式，而且其系统的复杂程度并不高。有人用过特斯拉的召唤功能，你应该记得马斯克说过，未来可以从纽约远程召唤洛杉矶的特斯拉，但现在显然做不到，不过据说能在停车场里召唤车辆。有人在一场航空展上试过这个功能，你能在油管上找到相关视频。这个人召唤自己的特斯拉，想在航空展上秀一下，结果车子径直撞上了一架价值 350 万美元的私人飞机。

原因就是，特斯拉的训练数据里，根本没有教系统如何应对飞机，毕竟谁会专门训练汽车躲避飞机呢？系统对世界没有形成通用的认知，比如“不要撞上挡路的大型贵重物体”，它根本不懂这些，只会识别训练数据里的自行车、行人等目标，它的识别分类里根本没有“飞机”这一项，所以才会直接撞上去。

所有 AI 企业都变了：悄悄复用经典符号式工具

Steve Eisman：那你有没有了解到，随着这场争论的风向转变，各大企业内部现在的情况如何？

Gary Marcus：我了解到的情况主要有几点。首先，我一直都在说，单纯的大语言模型行不通，必须结合传统的符号式 AI 技术。但之前他们都对此嗤之以鼻，觉得这套技术早就过时了，没必要用，还说人脑的工作模式本就不是这样。而现在，他们都悄悄在一定程度上采用了这项技术，比如引入代码解释器来运行 Python 代码，这些都是经典的符号式工具。说白了，他们正在偷偷把系统二的相关能力融入模型中，只是没有大肆宣扬，但这一改变确实带来了不小的提升。

马斯克发布 Grok 4 时的演示就很能说明问题，我还为此写过一篇文章，标题是《为何 GPT-3 和 Grok 4 无意间印证了神经符号 AI 的正确性》。文章里放了当时的演示图表，能清晰看到，正是那些他们不愿提及的符号式工具的加入，让模型的表现变得更好。如今模型的些许提升，绝大部分都来自这个原因，而非单纯的大语言模型优化，他们其实已经悄悄放弃了纯大语言模型的研发思路。而这对你所关注的商业领域来说意义重大，因为这些符号式工具根本不需要在 GPU 上运行，普通的 CPU 就足够了。

Steve Eisman：原来如此。

Gary Marcus：对我而言，从技术角度来说，这印证了我一直以来倡导的研发思路是正确的。这是第一个变化。第二个变化是，各大企业的很多人都离职去创办自己的初创公司了。你可以想想，如果 OpenAI 真的能在下周推出 AGI，谁会在这个即将改变世界的关键节点离职，去创办一家可能要花四年时间才能做出成果的小公司？显然没人会这么做，大家都会想留在公司见证这个时刻。

所以，大量人才离职的事实就说明，这些企业内部的人也清楚，他们根本没有做出宣称的那种突破性成果。还有一个变化，就是谷歌正在迎头赶上。就像我几年前在 Substack 专栏里预测的那样，因为现在所有企业的研发思路基本一致，这个领域根本没有技术壁垒。

Steve Eisman：没错，完全没有技术壁垒。

Gary Marcus：你和其他一些人都认为，如果所有人都在做大语言模型的规模化扩张，那么最终的赢家就是最有实力承担这笔扩张成本的企业。而放眼整个行业，谁的资金实力能超过谷歌？根本没有。

Steve Eisman：确实。

Gary Marcus：我其实也表达过类似的观点，只是表述略有不同，你的这个说法其实也没错。我当时的观点是，行业头部企业会逐渐趋同，而随着大语言模型成为标准化商品，行业内会引发价格战，服务定价会大幅下降。事实也确实如此，现在大语言模型的按 token 计费价格，已经暴跌了 99%。价格战确实爆发了，而最终的受益者自然是谷歌，这一点我当初虽然没有直接点明，但也有所预判。我大概是在 2024 年 3 月，也可能是 2023 年 8 月开始写相关文章，当时就说，所有企业都在遵循同一种研发思路，没人掌握什么独门绝技，这就意味着头部企业的产品会越来越趋同。

大语言模型会成为一种标准化商品，各家的模型只会比上一年的版本稍有提升，差距微乎其微，最终品牌差异会变得无关紧要。这一趋势带来的结果就是，谷歌迎头赶上了，中国的企业也追上来了，Anthropic 同样不甘落后。就像你说的，当产品变成商品后，价格必然下跌。这对终端消费者来说是好事，但对企业的商业模式来说却是巨大的打击。毕竟企业原本的设想是，花巨资采购 GPU，然后靠模型服务赚回巨额利润。

推理模型进行不了逻辑分析，再升级也没价值？

Steve Eisman：我们能不能聊聊推理模型？先给我的观众解释一下，推理模型和大语言模型有什么区别？推理模型是基于大语言模型研发的吗？

Gary Marcus：推理模型是在大语言模型的基础上运作的，但它不会像大语言模型那样直接给出第一个想到的答案，而是会反复迭代、花费时间去推敲，试图得出最优解。至于具体的研发细节，各家企业都没有公开太多。传统的神经网络模型，在某种意义上都是一次性输出结果的，当然现在行业内对“一次性”的定义有所不同。简单来说，就是把数据输入模型后，神经网络会立刻完成一次正向传播，粗略来讲，模型中的每个神经元都会处理信息并生成对应的结果。而推理模型则会进行多次传播，这是本质上的区别。

我有个朋友把传统模型的输出方式称为“恒时推理”，意思是模型生成答案的时间基本固定，无论什么问题，耗时都相差无几：把数据输入模式识别器，模型会根据现有的模式给出最优解。而推理模型采用的是全新的“变时推理”模式，我之后会聊聊它的适用场景和短板，这种模式的特点是，处理不同的问题，耗时会有所不同。目前还没有企业能完全解决推理模型的所有技术难题，但在一些场景下，它的表现确实不错。

据我了解，推理模型的研发思路之一，就是让模型模仿人类解决问题的思考过程，毕竟这些模型本质上都是模仿系统。比如在解决几何题或代数题时，模型会刻意模仿人类的解题步骤。人类解决这类问题需要一步步推导，融合了推理能力的神经网络模型，同样需要分步骤完成。

Steve Eisman：那推理模型的优势是什么？又有哪些明显的短板？

Gary Marcus：在回答这个问题之前，我想先提一点：推理模型的成本天生就更高，因为它需要占用 GPU 更长的时间来生成答案。

Steve Eisman：好的。

Gary Marcus：那我来说说它的适用场景和短板。推理模型最擅长的，是那些能生成形式规范、可验证的数据来训练模型的领域。比如数学和计算机编程，我们可以编写程序生成各种不同的代码片段来训练模型，也能生成各类几何证明题的解题思路。这类领域之所以适合推理模型，是因为它们都属于封闭领域，相关的知识边界是明确的。

Steve Eisman：没错，数据库中的知识量和相关的有效知识量都是有限的。

Gary Marcus：对，就是这个意思。所以推理模型在几何、编程这类领域的表现最好，而在开放式的现实世界中，它的表现就差强人意了。我总会从你所熟悉的金融领域举例子，当然你肯定有更贴切的案例，比如长期资本管理公司的破产。其实那也是一种模型失效的情况，只是模型的原理不同，当时没人考虑到俄罗斯债券市场崩盘的可能性，最终导致美国金融市场出现了大幅动荡。这是因为当时的金融模型，其参数设定根本没有覆盖这类极端情况。

而现在的推理模型，也面临着类似的问题：它其实并不具备真正的思考能力，哪怕是关于债券的基本问题，它也无法进行真正的逻辑分析。如果用它处理的问题，和训练数据中的内容高度相似，那一切都顺理成章；但一旦超出了它的认知范围，就像我们之前聊到的特斯拉的例子，模型就会立刻失效。

Steve Eisman：也就是它依然无法应对新事物、新情况。

Gary Marcus：没错，即便升级到了新的推理模型，核心问题依然是无法处理未知信息。它只是在原有基础上做了些许改进，但本质上还是受限于对新事物的适配能力。而关键问题在于，现实世界中，大多数有价值的问题都包含着一定的新要素、新情况，并非全是已知的问题。当然，也有例外，我们确实可以用这种不擅长处理新事物的技术，在一些狭窄的领域做出成绩，比如国际象棋和围棋。这些领域的规则千百年间基本没有太大变化，有海量的历史数据可供参考，模型还能通过自我对弈生成更多训练数据。

但在开放式的现实世界中，比如政治、军事战略领域，永远会出现训练数据中没有的新情况。比如，如何应对一位总统授意将军用飞机伪装成民用飞机，去袭击另一个国家的行为？这种情况此前从未发生过，想要分析这类问题，根本无法依靠过往的数据，必须依靠抽象的概念思考，比如权力、外交规则、国际格局的构建逻辑等，这些都是相关领域的学者更擅长的内容。要做到这一点，模型需要接受正确的训练，具备抽象思维能力，而不是单纯依赖数据。即便是在商业应用中，比如看似简单的客户服务，也会遇到类似的问题：用户总会用全新的方式提出问题，而一旦出现这种情况，模型就会因为无法应对新情况而失效。

OpenAI 只够支撑一年，要么倒闭、要么求救微软？

Steve Eisman：假设我任命你为 AI 领域的总负责人，由你掌控所有相关企业，指导整个行业的研发方向。如果你把这些企业的负责人都召集到一起，你会告诉他们，想要实现真正的突破，需要做些什么？

Gary Marcus：我会告诉他们，整个行业需要更多的学术思维多样性。就像在你的金融领域，你会告诉人们不要把所有鸡蛋放在一个篮子里，要做资产配置，分散投资股票、债券、黄金、房地产等。而 AI 领域在过去这些年，就是把所有的精力都押在了一个思路上，大语言模型的规模化扩张，这是行业唯一的研发方向。不可否认，这个思路确实带来了一些成果，模型并非毫无用处，我们也确实能利用它解决一些问题，但它终究无法带我们实现所谓的通用人工智能（AGI）这一终极目标，而且这还是一种成本极高、效率极低的研发方式。你可以对比一下，我的孩子只需要少量的信息和学习，就能理解这个世界，而大语言模型却需要学习整个互联网的海量数据，二者的效率差距简直可笑。

这些企业花费巨资，做出的却是效率低下、可靠性堪忧，但又有一定使用价值的模型。我们需要的是其他更高效、更经济、更可靠的研发思路，企业应该投入资金去探索这些新方向。但问题的根源，其实也来自你所熟悉的金融领域：风险投资家能从那些听起来合理的投资项目中，赚取 2%的管理费。我很好奇你对这个观点的看法，因为这毕竟是你的专业领域。试想一下，作为风险投资家，如果有一个项目能让你管理一万亿美元的资金，哪怕你根本不在乎项目最终的结果，也能赚到 2%的管理费，这足以让你成为亿万富翁。我并不是说所有的风险投资家都是这样想的，我见过很多投资人，他们确实真心想推动技术进步。

但就像任何行业一样，很多投资人都带着功利的心态。对这些功利的投资人来说，最理想的投资标的，就是那些听起来前景广阔、无需真正落地、成本极高的项目，这样他们就能赚取巨额的管理费。我认为，这就是整个行业都沉迷于规模化扩张的原因：投资人能从中赚取不菲的管理费，而且数额极其可观。但从学术研究的角度来说，这绝不是正确的选择，最终也没有带来理想的结果，反而造成了巨额的资金浪费。风险投资家赚走了管理费，而那些有限合伙人，最终会损失大量的资金。

Steve Eisman：你是不是觉得，这个行业的泡沫快要破裂了，还是说现在根本没法判断？

Gary Marcus：其实炒股的那句老话你我都懂，市场保持非理性的时间，可能比你保持偿付能力的时间还要长。

Steve Eisman：没错。

Gary Marcus：我去年用一个比喻形容当下的情况，就像《兔八哥》里的歪心狼跑到了悬崖边，它不往下看，就不会掉下去。当然这不符合物理规律，但很有意思。而现在，你所在的投资圈里，已经有人开始往下看了。我觉得从去年 11 月开始，就不断有投资人说，他们看到了一圈又一圈的的循环融资，投资回报率却不尽如人意，这些 AI 系统实际用起来也远没有想象中好用，或许这个赛道本身就不靠谱。我个人觉得，英伟达的产品做得非常出色，生态体系也很完善，不只是芯片本身，配套的软件等方方面面都很好。我见过黄仁勋，他给我留下了很深的印象，英伟达的产品确实很棒。

但问题的关键是，他们最终能卖出多少芯片？我认为，目前的芯片销售全靠市场投机，大家都在赌，我稍后再说说其他人的看法。所有人都在投机，认为这类芯片的需求会无限大，而这种投机的底层逻辑，是相信这些 AI 模型最终能实现 AGI。真正的 AGI 能完成人类能做的所有事，其商业价值不可估量，每年创造数万亿美元的价值都有可能。但《华盛顿邮报》几天前报道了一项一个月前完成的研究，研究显示，人类日常的工作中，只有 2.5%的工作能真正由 AI 系统完成。所以人们幻想中 AI 能完成的大部分工作，其实它都做不到，也根本做不好。这就意味着，最终所有在芯片上的投资，都会变得毫无意义。

而在这些企业里，OpenAI 可能是最脆弱的那个。OpenAI 有超过一万亿美元的未兑现承诺，却从未实现过盈利，如今又身处一个产品高度同质化的市场。它最大的竞争对手谷歌已经迎头赶上，甚至可以说实现了反超，还拿下了和苹果的合作大单，这可是笔大生意。所以我觉得 OpenAI 现在已经手忙脚乱了，实在看不出它的估值有任何合理性。

Steve Eisman：对我所在的投资圈来说，如果投资人开始从 OpenAI 撤资，而它又融不到新的资金，那会给整个生态系统带来连锁反应。

Gary Marcus：没错，这正是我认为即将发生的事。我觉得最终 OpenAI 可能会被微软这样的企业收购。我这几年一直说，OpenAI 最终会成为 AI 领域的 WeWork。未来人们都会疑惑，它当初怎么会有那么高的估值，这完全不合逻辑。OpenAI 的年收入只有几十亿美元，却每个月亏损数十亿美元，还有众多竞争对手，这样的企业根本撑不下去。如果投资人撤资，或者不再继续注资，OpenAI 就会陷入巨大的危机。它每个月的亏损大概有 30 亿美元，一年就是 300 多亿美元，即便最近完成了 400 亿美元的融资，也只够支撑一年的运营。

Steve Eisman：没错，也就一年的时间。

Gary Marcus：而且现在很多人都在持观望态度，他们会觉得，谷歌才是更适合这场竞争的玩家，毕竟谷歌已经追上来了。如果这场竞争只拼规模，那赢家必然是谷歌，这是毋庸置疑的。谷歌有能力做出巨额投入，甚至根本不需要英伟达的芯片，因为他们自研了张量处理单元，能实现类似的功能，所以谷歌的抗风险能力更强。他们有稳定的财务支撑，最终一定会赢。

Steve Eisman：没错。

Gary Marcus：只要有一部分人意识到，OpenAI 想要活下去，需要的资金量是天文数字，它的处境就会变得岌岌可危。它下一轮可能需要 1000 亿美元的融资，而全世界能拿出这么多钱的人，可能也就五个。就算其中四个愿意投资，只要有一个拒绝，就会出问题；而如果五个都拒绝，它要么倒闭，要么只能去找微软求救。

“脱离世界模型做 AI，根本行不通”

Steve Eisman：Gary，在我们结束访谈前，还有什么我该问却没问的问题吗？

Gary Marcus：我觉得这次访谈特别棒。要说还有什么重要的点没聊到，那应该就是“世界模型”这个概念。

Steve Eisman：没错，我本来也想聊这个。你一直说我们需要构建世界模型，这个概念完全超出了我的专业领域，不如你给大家解释一下，到底什么是世界模型？

Gary Marcus：不同的人对世界模型有不同的定义，简单来说，它就是在计算机系统中，构建一个能表征外部现实世界的体系。我说说我认为我们需要的世界模型是什么样的：软件内部需要有一个结构，能对应现实世界中的各种事物。比如导航系统的世界模型，需要能表征道路的分布、连接方式，以及不同路段的通行时间。在传统的 AI 领域，世界模型是研发的起点，所有的研究都基于此，没人会想过脱离世界模型做研发。Herbert Alexander Simon 是上世纪 50 年代 AI 的奠基人之一，他写过一本自传叫《Models of My Life》，他一生都在研究各类模型和世界模型，并且认为，做好 AI 的关键就是构建正确的世界模型。

而大语言模型却试图脱离世界模型运作。构建一个针对特定事物的世界模型，尤其是复杂事物，需要付出巨大的努力。比如过去研发专家系统时，研究者需要构建能模拟医生思考方式的模型，能表征病人身体机能、生理结构的模型，这个过程非常繁琐。当时还有一个专门的领域叫知识工程，做这项工作成本极高，没人愿意做。大语言模型和其他类型的神经网络出现后，研发者宣称，不用再做这些繁琐的工作，只需要让系统从数据中自主学习就行。

但事实证明，这根本行不通。就像大语言模型会把出生在洛杉矶的 Harry Shearer 说成是伦敦人，原因就是它没有一个完善的世界模型，无法像设计精良的软件那样，精准调取正确的信息。所以我们必须在 AI 系统中融入世界模型，才能避免幻觉现象的发生。

Steve Eisman：我还是不太理解世界模型到底是什么。

Gary Marcus：用非专业的语言解释确实有难度，简单说，它就是对世界的一种表征，而且这个“世界”不一定是现实世界。比如我们对《星际迷航》《星球大战》《哈利·波特》这些虚构世界，也会有对应的世界模型。这也是人类和当前 AI 系统最本质的区别：当我们看一部电影、读一本书时，会在脑海中构建出这个世界的运行规则，并且能判断情节是否符合这个世界的逻辑，会不会有不合理的设定。比如看了《哈利·波特》，我们会知道里面的人能骑着扫帚飞，但不会把这个设定和现实世界混淆，不会回家后跳上扫帚就想从窗户飞出去。

人类能快速构建并同时掌握多个世界模型，就算看一部新的科幻剧，20 分钟左右就能理解这个全新世界的规则，这是人类的天赋。但在 AI 领域，无论是传统的符号式 AI，还是现在的大语言模型，都做不到这一点。传统 AI 的优势是可以人工构建世界模型，你可以雇一群学者花六周时间，把一个问题的相关规则梳理清楚，构建成模型。最近离世的顶级研究者 Doug Lenat 就做过这样的研究，他为《罗密欧与朱丽叶》构建了世界模型，他的系统能真正理解这部剧的关键情节，而非从网上的读书笔记中获取二手信息，表现非常惊艳。但问题是，我们不知道该如何让传统 AI 自主学习、构建世界模型。而大语言模型则完全做不到构建世界模型，只是在假装自己能做到。

我有个很经典的例子，就算用整个互联网的内容训练大语言模型，让它接触海量的国际象棋规则和对局记录，它依然会走出违规的棋步，因为它从未真正抽象出国际象棋的运行逻辑。这一点就足以说明问题了。试想一下，一个人看了一百万盘象棋对局，读了维基百科、象棋网站上的所有规则，还看了 Robert James Fischer 的象棋著作，不可能连基本的棋规都掌握不了，但 AI 就是做不到。

所以我们需要研发能自主归纳出世界模型的 AI 系统，这类系统能从数据中挖掘因果规律，识别其中的核心要素。这是一个难题，不是说有人明天回家鼓捣一下就能解决的。长期以来，无论是传统 AI 还是大语言模型，都在回避这个问题，而现在，我们必须直面它。

Steve Eisman：看来这需要很长的时间来研究。

Gary Marcus：确实需要很久。我想说的是，AI 确实会以我们难以想象的方式改变世界，但绝不是现在，靠当下的这项技术根本做不到。我们需要把这一点考虑进去，做出合理的投资决策。现在的问题是，我们到底是在投资基础研究，还是在为一项已经成熟的技术做规模化投入？答案显然是后者。而当下的市场，大多是在投机，赌那些目前行不通的技术，只要做得更大，就能凭空实现突破。

但事实上，单纯的规模化根本解决不了这些核心问题，我们真正需要的是扎实的基础研究。这是我过去五年一直强调的观点，也是 SSG 在去年 11 月提出的观点，而 Ilya Sutskever 也表达了类似的看法。当我们这些背景截然不同的人，都达成了这样的共识，行业内的人其实应该认真听一听。

参考链接：

https://www.youtube.com/watch?v=aI7XknJJC5Q

突发！黄仁勋2026首度来华

作者: 纯情
时间: 2026-01-26
分类:
评论

编辑：KingHZ 定慧

【新智元导读】AI不是泡沫，而是人类史上最大基建狂潮！黄仁勋直言：已投数千亿，仅是开端，未来需数万亿美元打造「五层蛋糕」，从电厂到应用层全产业链爆发，就业机会前所未有。

突发！

腾讯科技独家新闻报道，2026年黄仁勋首度来华，首站到访了英伟达在上海的新办公室，与员工交流，回顾公司2025年主要事件。

据报道，这次来华行程与2025年初基本一致，主要参加上海、北京和深圳分公司的新年晚会以及供应商答谢会。

腾讯科技：独家丨黄仁勋2026年首度来华，未提及H200

根据知情人士，黄仁勋和员工的诸多问题中，主要聚焦在2026年重点芯片相关的话题。

根据英伟达真实路线图，继Blackwell之后，2026年的重点大概率是Rubin架构。

而就在中国行前夕，黄仁勋在达沃斯世界经济论坛上的一番发言，正在全球科技界引发震动，让全场脊背发凉：我们正在犯一个历史性错误——

把AI当作技术，而不是电和路。

这句话背后，是一场数万亿美元的财富转移：

水管工、电工、建筑工人的收入未来或突破「六位数」，而坐在办公室里的白领，可能面临第一波AI冲击。

这不仅是科技革命，这是人类工作价值的重新定价。

人工智能（AI）爆发，已拉开「史上最大规模基础设施建设」的序幕。

规模到底有多大？

黄仁勋表示，尽管各大企业已为这项技术投入数千亿美元，但未来仍需持续投入巨额资金。「我们需要建设价值万亿美元级的基础设施。」

他认为，ASI基建新工种将涌现，预测未来美国的建筑工有机会实现「六位数」收入。

人类历史上最大规模基础设施建设

2026年1月21日，瑞士达沃斯，世界经济论坛（WEF）。

在一场挤得水泄不通的主论坛上，黄仁勋（下图右）与Larry Fink（下图左）展开了一场关于AI未来的深度对话，豪言AI是「人类历史上最大规模基础设施建设」的基石。

众所周知，黄仁勋是NVIDIA创始人兼CEO，是AI时代「算力之王」；而后者Larry Fink，也不简单，是华尔街的两枚定海神针之一贝莱德（BlackRock）共同创办人、董事长、CEO。

黄仁勋提到，2025年是有记录以来风险投资规模最大的年份之一，大部分资金流向他所称的「原生AI公司」。

这些企业遍布医疗、机器人、制造与金融服务领域。黄仁勋指出：「这是首次出现足够成熟的模型，能够支撑这些行业的深度开发。」

相关投资正直接转化为就业岗位。

他特别列举了当前紧缺的技术工种：水管工、电工、建筑工人、钢铁工人、网络技术员，以及负责安装运营高端设备的专业团队。

从熟练技工到初创企业，AI正开启下一次平台级变革。

对全球打工人来说，这场变革将推动工作重心从执行任务转向实现价值。

AI 之下，工作要有目的

面对大家对AI取代人类的担忧，黄仁勋给出了反直觉的有力反击：AI不会摧毁工作，它正在让工作从「完成任务」转向「实现人生价值」。

他以放射科医生为例。

2016年，「AI教父」辛顿曾表示：「我们现在就应该停止培训放射科医生了」，因为AI很快就能比他们做得更好。

他说得没错：近十年来，模型在各项基准测试中的表现已超越放射科医生。

然而，放射科医生的岗位数量正处于历史最高水平，平均薪资高达52万美元。

为什么？

因为医生的使命是诊断疾病和救治病人，看片子只是任务之一。

AI处理了看片子的任务，让医生能花更多时间与病人互动，从而能接诊更多病人，从而医院效益好了，自然需要更多放射科医生。

同样的逻辑也适用于护士。

美国正面临500万护士的短缺，部分原因是护士们近一半的时间都花在填表和记录上。

AI接管了图表记录和转录工作后，护士的工作效率提高了，医院效益变好了，反而需要招募更多护士。

作为CEO，黄仁勋幽默比喻：「若有人观察我和Fink的工作，大概会觉得我俩是打字员。」

但自动化打字不会取代他们的CEO工作，因为打字并非核心价值。

再比如，黄仁勋盛赞Claude「不可思议」，宣称「所有软件公司都需要使用它」。

黄仁勋并非突然认同Anthropic的AI安全理念，而是折服于他们的工程能力。Claude Code正在以惊人速度吞噬企业软件开发市场，以至于英伟达这家硬件公司竟公开点名推荐特定模型。

这说明AI已跨越「新奇事物」的门槛，蜕变为软件行业基础设施。

AI通过协助事务性工作，让人更能聚焦核心使命，提升效能，从而创造更大价值。

「所以关键在于：你工作的本质价值是什么？」黄仁勋最后发问。

英伟达创始人兼首席执行官黄仁勋与贝莱德董事长兼首席执行官Larry Fink在2026年瑞士达沃斯世界经济论坛年会对话

在对话中，他也淡化了外界对巨额支出承诺可能导致AI泡沫的担忧。

五层蛋糕论

AI没有泡沫

据估计，仅2025年一年，全行业就将在AI研发上投入约1.5万亿美元——

这个数字超过了几乎所有其他领域任何企业集团的名义支出。

然而，黄仁勋坚持认为，这并不是过度投资。他说，这代表着人类历史上规模最大的基础设施建设，而这还只是刚刚开始。

他进一步解释称，在芯片领域，「台积电已宣布计划新建20座芯片工厂；富士康正与我们合作，还有纬创和广达，将新建30座计算机工厂，这些工厂后续将转化为AI工厂（数据中心）。」

「美光已开始在美国投资2000亿美元，SK海力士表现非常出色，三星也做得非常出色。你们可以看到，整个芯片行业正以惊人的速度增长，」黄仁勋补充说。

而且不止单一的芯片突破。

黄仁勋将AI产业精辟地拆解为五个核心层级，重申了他的「AI五层蛋糕论」：

能源（Energy）：为AI提供动力的电力基础。
芯片与计算基础设施（Chips and Computing Infrastructure）：硬件算力的基石。
云数据中心（Cloud Data Centers）：承载计算的枢纽。
AI模型（AI Models）：智能的大脑。
应用层（Application Layer）：最终创造经济效益的顶端。

他特别指出，最大的经济效益将来自应用层——

AI正在重塑医疗、制造、金融服务等行业，并改变整体经济中的工作性质。

从能源发电、芯片制造到数据中心建设与云端运维，黄仁勋表示AI建设已催生大量技术工种需求。

更关键的是，他用「价格」来反证泡沫论：

如果这是泡沫，算力应该不缺、租GPU应该越来越便宜；但现实相反——GPU 很难租到，算力现货租赁价格在上涨，不只是最新一代，连两代以前的GPU也在涨。

这意味着需求来自真实业务，而不只是投机资本烧钱。

黄仁勋还举了企业调整研发预算的例子：比如制药公司把一部分投入从湿实验室转向AI超算。

AI是电，是路，是生产力

黄仁勋将AI定位为国家关键基础设施。

「AI即基础设施，」他强调，各国应像对待电力或公路那样重视AI，「必须将AI纳入国家基础设施体系」。

他呼吁各国基于本土语言文化构建自主AI能力：「开发属于自己的AI，持续优化迭代，让国家智慧融入生态系统。」

Fink质疑是否只有高学历人群才能使用或受益于AI。

黄仁勋驳斥了这一观点。

「AI超级易用——这是历史上最简单的软件，」他表示，AI工具仅用两三年已触达近十亿用户。

因此，掌握AI素养正成为必备技能：「学习如何使用AI、引导它、管理它、设立防护栏、评估结果，这些能力与领导力和团队管理同等重要。」

回到「放射科医生」，RSNA（北美放射学会）主席、斯坦福大学医学教授Curt Langlotz之前表达过类似的观点：

AI不会取代放射科医生，但会使用AI的放射科医生将取代不会使用 AI 的放射科医生。

欧洲的AI超车机会：物理AI

对于发展中国家，黄仁勋认为AI带来了缩小长期技术差距的契机：「AI很可能弥合技术鸿沟，普惠性与资源丰沛性将发挥关键作用。」

谈到欧洲时，他特别指出制造业与工业实力是巨大优势：AI不是写出来的，是教出来的。

「机器人是世代难逢的机遇，」黄仁勋强调，这对工业基础雄厚的国家尤为关键。

「如今我们可以将工业能力、制造能力与人工智能相融合，由此迈入实体AI即机器人技术的世界，」他补充说，这为欧洲带来了「跨越」由美国主导的软件时代的机遇。

「我认为，为了在欧洲构建繁荣的AI生态系统，我们必须认真对待能源供给的增长，加大对基础设施层的投资，这一点是确定无疑的，」黄仁勋说道

Fink总结讨论时表示，这场对话说明世界远未形成AI泡沫，真正的问题在于：「我们的投资够吗？」

黄仁勋赞同这一判断，指出庞大投资势在必行：我们必须为AI技术栈的所有上层建筑构建必要基础设施。

他形容这一机遇「非同寻常，每个人都应参与其中」。

他重申2025年全球风投规模创历史新高，超千亿美元资金流向全球，其中大部分注入AI原生初创企业。「这些公司正在构建上层的应用生态，」黄仁勋说，「而它们需要基础设施与投资来筑造未来。」

Fink补充道，确保增长红利被广泛共享至关重要：

我相信全球养老基金参与这场变革将是绝佳投资机遇，能与AI世界共同成长。我们必须让普通养老金领取者和储蓄者分享这份增长。若只能作壁上观，他们将被时代抛在后面。

CUDA要凉？Claude 30分钟铲平英伟达护城河，AMD要笑醒了

作者: 纯情
时间: 2026-01-26
分类: 资讯
评论

编辑：桃子

【新智元导读】英伟达护城河要守不住了？Claude Code半小时编程，直接把CUDA后端迁移到AMD ROCm上了。

一夜之间，CUDA护城河被AI终结了？

这几天，一位开发者johnnytshi在Reddit上分享了一个令人震惊的操作：

Claude Code仅用了30分钟，便将一段完整的CUDA后端代码，成功移植到AMD的ROCm上。

整个过程，没有手写一行代码。

这架势，简直是要填平这两个生态系统之间的鸿沟。

更关键的是，这次移植完全没有依赖传统的「中间转换工具」，如Hipify翻译层，而是一键通过CLI完成。

就连AMD软件副总Anush E.为之震惊，GPU编程的未来，是AI智能体的。

消息一出，整个科技圈瞬间沸腾，很多人直呼：英伟达CUDA护城河要守不住了…..

这究竟是怎么回事？

Claude手撕CUDA，仅30分钟

Claude Code是在一个智能体框架运行的，这意味着它可以自己「动脑子」。

在执行过程中，他不会机械地转换关键词，而去真正理解代码，即特定核函数的底层逻辑。

开发者johnnytshi介绍，这次移植中，最棘手的数据布局差异问题也被AI解决了，确保了内核核心计算逻辑保持一致。

令人惊叹的是，johnnytshi在短短30分钟内，就把整个CUDA后端移植到了AMD ROCm上，而且中间没用任何翻译层。

另外一个好处当然是，不用费劲去搭像Hipify这种复杂的翻译环境了；直接在命令行（CLI）里就能干活。

如今，全网都被CUDA护城河被攻破呼声淹没了。

毕竟，英伟达霸主地位，很大程度上建立在CUDA这个几乎成为行业标准的编程生态上。

无数AI框架、深度学习库、科学计算工具都深度依赖它。

AMD的ROCm虽然功能强大，却一直面临生态兼容性，以及开发者迁移成本高的痛点。

现在，一个Claude却用极短时间踢碎了门槛，说不定未来更多CUDA代码可能轻松在AMD GPU跑起来了。

实现细节

GitHub中，johnnytshi本人也更新了日志和说明。

为AMD GPU实现了完整的ROCm后端，从而在RDNA 3.5及其他AMD架构上支持基于注意力机制的现代国际象棋网络。

GitHub：https://github.com/LeelaChess...

在src/neural/backends/rocm/中添加了完整的ROCm后端
实现了注意力网络架构（多头自注意力、FFN、嵌入层）
使用rocBLAS进行GEMM运算，使用MIOpen进行卷积运算
针对RDNA 3.5上的FP16性能优化了NCHW布局
提供三种后端变体：rocm (FP32)、rocm-fp16 (FP16)、rocm-auto (自动检测)
MIOpen是必选依赖（类似于CUDA的cuDNN）
通过rocm\_agent\_enumerator自动检测AMD GPU架构
编译选项：-Drocm=true -Damd\_gfx=gfx1151（或使用自动检测）

性能说明：

FP16性能：在Strix Halo (Radeon 8060S, gfx1151) 上 >2000 nps
自动Batch Size调优（RDNA 3.5上min\_batch=64）
测试过rocWMMA，但rocBLAS性能更好

验证情况（Strix Halo – Radeon 8060S, gfx1151）：

测试模型：768x15x24h-t82-swa-7464000.pb.gz 和 maia-1900.pb.gz
后端：rocm-fp16功能正常，能生成正确的走法
环境：ROCm 7.2.53150, MIOpen 3.5.1
注：仅在RDNA 3.5上进行了测试；其他AMD架构暂未验证

GPU未来，是AI智能体主场

当然，这次演示也有局限性。

对于简单或中等复杂度的内核，Claude Code表现得非常出色。更重要的是，写核函数的核心就在于搞定「深度硬件」优化。

不过，一部分觉得Claude Code在这方面还是差点火候——

如果遇到那些针对特定硬件缓存层级，内存访问模式做过极致优化的复杂内核，AI目前还难以完全取代人类专家。

即便如此，这一事件释放出的信号已经足够强烈。

过去几个月，ZLUDA项目、还有微软内部的尝试，都想要打破CUDA的垄断。

但它们大多依赖规则映射或中间层，自动化程度和智能水平有限。

Claude Code代表的智能体式编程，直接跳过了这些环节，用「理解+自主决策」的方式填平生态鸿沟。

正如AMD软件副总所言，GPU编程的未来，是AI智能体主场。

全员AI编程，浓度高达100%

如今的Claude Code已经让整个硅谷入坑了（Claude-Pilled）。

两天前，CEO Dario Amodei在达沃斯上再出暴论：软件工程师们没有时间了。未来6-12个月，AI能够彻底取代这些人！

甚至，Anthropic内部工程师已经不再手写代码了，全是Claude完成。

别不信，是真的。

就在Wired最新采访中，Claude Code之父Boris Cherny坦承，「自己100%代码都是AI写的」。

或许Anthropic工程师怎么也没有想到，一个「副业项目」竟让硅谷如此狂热。

Boris Cherny回忆道，「一年前我们发布Claude Code时，甚至不确定『智能体编程』能不能成，但火爆来得太快了」。

Cherny个人经历就是最好的缩影：

刚发布时，他只有5%代码是用Claude Code写的；

到了去年5月，有了Opus 4和Sonnet 4，这个比例变成了30%；

而现在，有了Opus 4.5，他在过去两个月里100%的代码都是由Claude Code完成。

在Anthropic内部，这种全员AI化更是到了极致。

几乎100%技术员工都在使用Claude Code，甚至连Claude Code团队本身95%的代码也是由自身写出来的。

斯坦福AI教授都在用了

不得不说，AI编程的进化速度令人咋舌。

回望2021到2024年，大多数工具不过是高级版的「自动补全」，在开发者打字时卑微地建议几行代码。

但到了2025年初，随着Cursor和Windsurf等初创发布早期的Agentic编程产品，游戏规则改变了——

开发者只需用大白话描述功能，剩下的脏活累活全扔给AI智能体完成。

Claude Code也在这个时间点，真正诞生了。

Boris Cherny坦承，早期版本也曾跌跌撞撞，甚至陷入死循环。但Anthropic下了一步狠棋：不为当下的AI能力开发产品，而要为AI即将抵达的未来而构建。

这一赌注押对了。随着Anthropic下一代旗舰Claude Opus 4.5的发布，AI编程迎来了真正的「拐点」。

斯坦福大学AI讲师、Workera CEO Kian Katanforoosh最近就把公司全员迁移到了Claude Code。

他直言，对于高级工程师来说，Claude Code比Cursor、Windsurf更能打。

Katanforoosh感叹道，最近唯一让我看到编程能力有阶跃式提升的模型，就是Claude Opus 4.5。

「它给人的感觉不像是在模仿人类写代码，而是它真的找到了一种更聪明的解决路径」。

据传，微软内部也在大规模采用Claude Code了。

年入超10亿美金的「副业」

Claude Code大获成功，给Anthropic带来了最直观的效益。

去年，AI编程智能体业务彻底爆发。11月，Anthropic宣布Claude Code在上线不到一年内，年度经常性收入（ARR）就突破了10亿美元。

到2025年底，ARR至少又增长了1亿美元。

彼时，该产品约占Anthropic总ARR（约90亿美元）的12%。虽然比起向大企业提供 AI 系统的核心业务来说还算「小弟」，但它已是公司增长最快的板块之一。

尽管Anthropic在AI编程领域看似独孤求败，但Claude Opus 4.5的光环其实照亮了整个赛道。

竞争对手Cursor也在11月达到了10亿美元ARR，OpenAI、谷歌和xAI更是磨刀霍霍，试图用自研模型分一杯羹。

但Anthropic没打算停下。

前几天，他们又发布了Cowork——这是一款面向非编程领域的AI智能体。

它能管理你电脑里的文件、操作各种软件，而且完全不需要你在代码终端里敲命令。

不是取代，是进化

提及Cowork时，Cherny透露自己已经用疯了。

比如项目管理，他会让Cowork盯着工程师的任务表格，谁没填名字，AI就会自动在Slack上发消息催人。

Cherny感慨道，「这是我当工程师以来最爽的时候，因为我不再需要做那些枯燥乏味的脏活了」。

面对那些因不再需要亲自写代码而感到失落的工程师，Cherny给出了他的建议：

这行业一直在变。我祖父在苏联用穿孔卡片编程；后来变成了机器码；再后来是C语言、Java、Python。

这是一条不断抽象化的连续体，AI智能体只是这条线上的最新一个点。

如今，Cherny每天早上起床会在手机上启动3-4个编程智能体，到了公司再在终端里开几个。

任何时候，他都有五到十个智能体在跑任务。

Cherny总结道，「AI智能体将接管生活中所有繁琐的事——填表、搬运数据、发邮件。这会具有颠覆性，我们必须适应」。

话又说回来，Anthropic能不能先解决下Claude使用量？

英伟达财报之外：一个正在松动的 AI 权力结构

作者: 纯情
时间: 2026-01-21
分类: 资讯
评论

编者按： 英伟达财报的营收神话是否掩盖了其现金流恶化的现实？而在“循环融资”的质疑声中，OpenAI 与甲骨文等关键客户的供应链“去英伟达化”浪潮，又将如何重塑 AI 硬件的竞争格局？
我们今天为大家带来的这篇文章，作者的观点是：英伟达目前的高速增长依赖于激进的库存策略和宽松的信用条款，但其最大客户正通过定制芯片和直接采购关键组件来构建独立的供应链，这导致双方关系正从深度捆绑走向潜在的激烈竞争。

作者 | Philippe Oger

编译 | 岳扬

过去 48 小时，我完全沉浸在对英伟达 2026 财年第三季度财报[1]的深度研究中。如果你只看新闻标题，一切看起来都完美无缺：营收同比增长 62 %，达到 570 亿美元，黄仁勋还在大谈“AI 的良性循环”。

但我想弄清楚光鲜数据下的真实情况，于是深挖了资产负债表，并将其与围绕 OpenAI 和 Oracle 的所有新闻进行了交叉验证。 我并不是华尔街的专业分析师，但即便仅凭自己梳理线索（并借助了 Gemini 的帮助），我也开始看到这个所谓的“AI 联盟”出现了一些裂痕。就在英伟达创下业绩纪录的同时，他们最大的客户似乎正在悄悄武装自己，准备另起炉灶。

以下是我对硬件市场、OpenAI 与英伟达之间“亦敌亦友”的关系，以及包括迈克尔·贝瑞（Michael Burry）在内大家都在讨论的“循环融资（circular financing）”理论的一些看法。

01 英伟达财报：完美表象下的隐忧

表面看来，英伟达无疑是 AI 时代的绝对王者 —— 数据中心业务已占据公司总营收近九成，这一事实无可辩驳。然而，当我深入研读财报细节时，发现了三处值得警惕的“红色信号” ：

现金流之谜：英伟达公布的净利润高达 319 亿美元，但我查阅现金流量表时发现，其经营活动产生的现金流仅为 238 亿美元。这意味着有 80 亿美元的利润尚未立即转化为现金。
库存激增：我注意到，今年库存几乎翻倍，达到 198 亿美元。管理层解释称这是为“Blackwell”发布做准备，但在我看来，持有大约 120 天的库存量，会带来巨大的资金占用压力。
应收账款周期拉长：我计算了其应收账款周转天数（DSO），发现已悄然攀升至约 53 天。在营收飙升的同时，英伟达却要等待近两个月才能回款，这暗示他们可能正在向企业客户提供极为宽松的信用条款，以维持增长飞轮的运转。

我的个人判断？英伟达正通过透支现金流来囤积库存，将全部赌注押在 Blackwell 架构[2]能在第四季度被市场瞬间消化。

02 拆解“资金空转”传闻的虚实

我想说清楚一点：接下来这部分内容并不是我最先发现的。最近财经新闻到处都在讨论这件事，而且如果你关注迈克尔·巴里（就是那位电影《大空头》里的“大空头”原型人物），你很可能已经看到他发推文警告所谓的“循环融资”和可疑的收入确认（Revenue Recognition）[3]行为。

我尝试自行理清这其中的关系，看看大家究竟在争论什么。巴里最近分享了一张图表，把这一系列交易描绘成一张交易“关系网”，其结构大致如下：

环节一：英伟达承诺向 OpenAI 投资数十亿美元（这属于已被广泛报道的“千亿美元投资路线图”中的一部分）
环节二：OpenAI 与甲骨文（Oracle）签署了一份高达 3000 亿美元的巨额云服务合同（即“星门计划”，Project Stargate），用于托管其人工智能模型。
环节三：为履行该合约，甲骨文随即向英伟达下达价值 400 亿美元的 GB200 GPU 采购订单。

巴里的核心论点（也是据传美国司法部等监管机构介入调查的原因[4]）在于：这套模式形同“资金空转”。这引发了一个尖锐的问题：如果英伟达停止向 OpenAI 投资，OpenAI 还有足够现金去和甲骨文（Oracle）签下那笔大单吗？而甲骨文又是否还会采购那些芯片？ 如果答案是“不会”，那么部分营收数据的稳固性可能远不如表面看来那样坚实。

03 OpenAI 正在采取行动降低对英伟达的依赖

我近期一直在关注的另一个重大转变，是 OpenAI 的战略转向。他们曾是英伟达最耀眼的“模范客户”，如今却越来越像一个潜在的竞争对手。一方面，他们仍与 NVIDIA 保持紧密合作 —— 部署 10 吉瓦（gigawatts）的基础设施用于训练 GPT-6；但另一方面，他们似乎正在构建一条能彻底摆脱黄仁勋（Jensen Huang）掌控的供应链。

如果你有所留意，相关迹象其实已经相当明显。 “星门计划”（Project Stargate） 不仅仅是个数据中心，更是一项包含定制硬件在内的庞大基础设施计划。据多家媒体报道（例如此处[5]、此处[6]、此处[7]，并在 Hacker News 上引发了激烈的讨论[8]），OpenAI 已直接从三星和 SK 海力士（全球两大 HBM 内存供应商）采购 DRAM 晶圆，绕开了英伟达的供应链。

此外，人才流向也透露出关键信号：OpenAI 已从数个行业巨头处挖走多名芯片人才，包括 2023 年招揽了谷歌前 TPU 负责人 Richard Ho，以及近期从苹果挖走的约 40 名硬件工程师。

结合 OpenAI 与博通（Broadcom）的合作[9]，我推测其策略是：用英伟达 GPU 构建智能模型，但最终在自家的定制芯片上运行推理任务 —— 以此大幅削减高昂的运营成本，或押注类似谷歌 Edge TPU 的专用芯片（NPU）来处理推理负载。

但关键问题来了：OpenAI 打算用谁的钱来支持这项事业？而英伟达对其未来规划又究竟有多大影响力？

而且，所谓“英伟达向 OpenAI 投资 1000 亿美元”的说法，至今尚未得到官方证实（如此处[10]所述）。

04 甲骨文一个有趣的思路：收购 Groq

眼下所有人都在讨论推理成本问题（Inference costs） —— 也就是实际运行 ChatGPT 或其他大语言模型（LLM）的花销，远比训练它们更昂贵。我最近在关注 Groq 这家初创公司，他们明确宣称在推理任务上比英伟达更快、更便宜。其创始人乔纳森·罗斯（Jonathan Ross）[11]曾是谷歌 TPU 团队的负责人，甚至可以说是 TPU 概念的最初提出者。

但还有一层情况，我认为被大多数人忽视了：OpenAI 直接采购晶圆所引发的 HBM 短缺问题。

据我所知，目前英伟达最大的瓶颈之一就是 HBM（高带宽内存）。 HBM 由专业内存代工厂生产，而这些产线早已完全超负荷运转。然而，Groq 的架构依赖的是 SRAM（静态随机存储器）。 由于 SRAM 通常是在逻辑制程代工厂（比如台积电 TSMC）中与处理器本身一同制造的，理论上它不会遭遇与 HBM 相同的供应链紧张问题。

综合这些因素，我觉得甲骨文真该认真考虑一下收购 Groq。拿下 Groq 不仅意味着获得更快的芯片，更关键的是 —— 当其他芯片全都售罄时，Groq 的芯片可能仍然有货。这本质上是一种供应链对冲（supply chain hedge）。

对甲骨文的最大客户 OpenAI 而言，这也将带来巨大的优势：更快、更便宜的推理能力。

再结合此前的传闻：甲骨文出租英伟达芯片的利润率极其微薄[12]，据传低至 14%，那这笔收购就显得更加合理。通过控股 Groq，甲骨文不仅能摆脱“英伟达税”（NVIDIA Tax），改善自身利润空间，还能彻底绕过 HBM 短缺的困局。

据 Groq 在 2025 年 9 月的最近一轮融资披露[13]，其估值约为 69 亿美元。即便支付溢价，以甲骨文的财力也完全有能力完成这笔收购。

但问题是：英伟达会允许这事发生吗？

如果答案是否定的，那又说明了什么？是否意味着当前这套“循环融资（circular financing）”体系中存在某种利益交换 —— 比如，英伟达承诺向 OpenAI 投资 1000 亿美元，条件是甲骨文必须只能使用英伟达芯片？

05 Final Thoughts

进入 2026 年，观察英伟达、OpenAI 与甲骨文之间的博弈，这场三方角力正陷入彼此钳制的僵局。我无从得知英伟达是否事先知晓 OpenAI 与内存厂商之间的晶圆供应协议，亦或其中存在任何合谋？英伟达是否正在极力维持自己在“星门计划”（Stargate）中训练和推理环节的独家地位？而 OpenAI 又到底打算打造什么样的芯片？是类似 TPU/LPU 的架构？还是更偏向 Edge TPU 那样的边缘推理芯片？

迈克尔·巴里（Michael Burry）正在全面做空这套体系[14]。

至于我，只是个读财报的普通人，无力揣测市场走向。但我非常确定一点：AI 硬件市场比以往任何时候都更炽热，未来几个季度的风云变幻必将精彩绝伦。

免责声明：我偶尔会发表些真知灼见，但更多时候说的都是蠢话。阅读本文时请务必谨记这一点。

END

本期互动内容 🍻

❓如果“循环融资”属实，谁最可能成为这个链条中最先断裂的一环？

文中链接

[1]https://nvidianews.nvidia.com/

[2]https://www.nvidia.com/en-us/data-center/technologies/blackwe...

[3]https://www.investing.com/news/stock-market-news/michael-burr...

[4]https://m.economictimes.com/news/international/us/nvidia-reje...

[5]https://openai.com/index/samsung-and-sk-join-stargate/

[6]https://www.asiafinancial.com/samsung-sk-hynix-building-starg...

[7]https://www.kedglobal.com/artificial-intelligence/newsView/ke...

[8]https://news.ycombinator.com/item?id=46169224#46170844

[9]https://openai.com/index/openai-and-broadcom-announce-strateg...

[10]https://fortune.com/2025/12/02/nvidia-openai-deal-not-signed-...

[11]https://www.linkedin.com/in/ross-jonathan/

[12]https://www.fool.com/investing/2025/12/02/michael-burry-just-...

[13]https://groq.com/newsroom/groq-raises-750-million-as-inferenc...

[14]https://www.techradar.com/pro/security/could-the-ai-bubble-be...

本文经原作者授权，由Baihai IDP编译。如需转载译文，请联系获取授权。

原文链接：

https://philippeoger.com/pages/deep-dive-into-nvidias-virtuou...

最烦做演讲！黄仁勋曝英伟达养了 61 个 CEO、从不炒犯错员工：CEO 是最脆弱群体

作者: 纯情
时间: 2026-01-19
分类: 资讯
评论

整理 | 华卫

“世界上不会再出现第二个我这样的 CEO 了。”近日，英伟达联合创始人兼首席执行官黄仁勋（Jensen Huang）在一场私人访谈中这样说道。

据称，这场深度对话已经酝酿了三十年，将黄仁勋鲜为人知的一面展现在大众眼前。主持人 Jodi Shelton 与黄仁勋的职业交集始于三十余年前，彼时，图形处理器（GPU）尚未掀起席卷全球的 AI 革命。从加速计算的源头到生成式 AI 的前景，这场对话堪比一堂远见大师课。

在访谈中，黄仁勋表示，从某种意义上说，英伟达其实有 61 位 “CEO”。过去这些年，包括他在内，很多人都犯过严重的错误，但在英伟达，从来没有人因为犯错而被解雇。“我们打造了一个足够安全的环境。”他还透露，CEO 这个职位，远比人们想象的要脆弱得多。“实际上，我们可能是公司里最脆弱的一群人。不过对我来说，承认这种脆弱，并不是什么难事。”

有意思的是，他提到，在很多方面，自己都算是一个 “不情愿的 CEO”。“公开演讲简直让我怕得要死。比起待在公司外面抛头露面，我更喜欢扎根在公司内部；比起发表演讲，我更喜欢安静做事；我甚至一点都不喜欢做主题演讲，但为了公司，我必须去做这些事。”

此外，黄仁勋称，英伟达的成功，绝不是靠产量取胜。“虽然是英伟达发明了 GPU，但从产量来看，我们其实是全球最小的 GPU 制造商。很多不知名的厂商，GPU 产量都比我们高。”而“没有终极目标” 这一点，对英伟达的发展真的起到了至关重要的作用。

对于五年后的世界，黄仁勋断言，英伟达和整个行业在 AI 领域的投入，必将彻底改变计算机的运作模式，未来的计算机，将从 “由人类编程” 进化为 “在人类引导下自主学习编程”。并且，100% 的工作岗位都会发生变化，但不会有 50% 的岗位消失。未来的趋势不会是就业岗位减少，反而是大家会变得比现在更忙碌。并且，那些现在没有工作的人，很可能会因为 AI 获得谋生的手段。

网友们纷纷就此次访谈对黄仁勋评价道，“我从未见过他如此坦诚直率，真是不可思议。”

以下是详细对话内容，我们在不改变原意的基础上进行了翻译和删减，以飨读者。

“走了整整 33 年才看到成果”

Jodi Shelton：大众其实特别好奇像你这样的人，毕竟你们正在定义科技的未来，而科技的未来就是整个世界的未来。所以我们想做的，是挖掘你成功光环背后的个人经历以及支撑你走到今天的价值观。你对这个定位怎么看？

黄仁勋：说实话，不太喜欢。

Jodi Shelton：真的不喜欢吗？可你现在是名人啊，大家都想了解名人的故事。

黄仁勋：我从不觉得自己是名人，也根本不是什么名人。我只是恰好执掌着一家举足轻重的企业，是这家堪称史上最成功的科技公司之一的 CEO。很早以前，我们就做了一些正确的决策。回溯到 1993 年，我们就立志要重塑计算行业，而且对于计算机的架构，我们有着自己独到的见解。在很长一段时间里，这个观点都不被看好，甚至颇具争议。要知道，当时整个行业的焦点都在微处理器和 CPU 上。说起来，我和你就是在那个时期认识的。我们早在 1993 年底或者 1994 年就相识了，对吧？从那时起，英伟达就在做我们现在依然在做的事：重塑计算。

Jodi Shelton：没错，我记得很清楚。那时候的硅谷，正处在 CPU 为王、摩尔定律大行其道、个人电脑革命如火如荼的年代。

黄仁勋：是啊。而且我们早期的客户，全都是 PC 芯片组领域的初创公司。这些企业可以说是半导体行业辉煌版图的奠基者，像 Cirrus Logic、S3 Graphics、Western Digital、Trident Microsystems，你还记得这些名字吗？

Jodi Shelton：当然记得。

黄仁勋：这些公司，称得上是英伟达的 “前辈”。而现在，我们依然在这条路上前行，致力于打造一种全新的计算模式。这条路，我们走了整整 33 年才看到成果。我只是恰好成为了这家公司的 CEO，仅此而已。

Jodi Shelton：可能对你来说，这一切是水到渠成，但对整个世界而言，英伟达的崛起堪称横空出世。大概从 2023 年 11 月起，整个世界的科技格局都因你们而改变。你是怎么看待这次转型的？

黄仁勋：要知道，想要创造未来，就必须在未来到来之前，先置身于未来之中。坦诚地说，从我们发明 CUDA 技术、推出相关产品的那一刻起，就已经踏上了通往未来的道路。英伟达最让我骄傲的一点是：我们不仅擅长技术发明，更擅长把技术转化为产品推向市场。世界上有太多的公司、科研人员和发明家，他们确实创造出了先进的技术，但最后往往只能感慨 “这个技术我早就做出来了”、“这个想法我早就有了”。每次听到这种话，我都觉得很惋惜。这些优秀的发明家，遗憾的是没能遇上同样优秀的产品创新者。

所谓产品创新者，就是能把一项技术发明转化为一款能推向市场的成熟产品的人。而这还不够，你还得为产品制定精准的市场策略，甚至需要亲手培育出一个全新的市场，让市场能够接纳你研发的产品和制定的策略。英伟达就是这样一家公司，我们具备技术发明、产品创新、策略制定、生态构建乃至市场培育的全链条能力，而且我们已经多次成功做到了这一点。所以对我来说，这种 “身处未来” 的状态，已经持续了很长时间。

Jodi Shelton：确实如此。

黄仁勋：很久以前，我们有一个战略，现在已经不怎么提了，叫 “CUDA 无处不在”。很多人都听过我当年四处推广 CUDA 的故事，跑遍各大高校、初创企业和成熟企业。有时候，台下听众加起来也就三个人，但我还是会掏出笔记本电脑，为他们演示 CUDA，告诉他们这项技术将如何改变世界。我走访了无数科研机构和实验室，参加了数不清的行业会议，推广 CUDA 的次数，估计比世界上任何人都多。长久以来，我一直沉浸在这样的 “未来图景” 里，讲的故事多了，甚至会产生一种 “未来已经到来” 的错觉。

Jodi Shelton：确实有这种感觉。

黄仁勋：所以现在看到这一切成为现实，我依然满心欢喜。而且在我看来，这一切其实并不意外，因为支撑英伟达发展的是计算机科学领域最根本的底层逻辑，不是靠一时的直觉，也不是凭主观的喜好。从很多方面来说，如今的成果是一种必然。但我想说的是，当你把一件事物的速度提升一千倍，或者规模扩大一千倍、体积缩小一千倍时，无论这件事物原本是什么，都会发生质的飞跃。而这种质变最终带来的结果，往往是超乎想象的。

我们早就预见到深度学习技术有着巨大的扩展潜力，这也是我们举全公司之力押注这一领域的原因。我们知道，AlexNet（深度卷积神经网络）绝不会是深度学习的终点，这种技术架构天生具备极强的可扩展性，再加上全球海量的数据资源，深度学习的爆发是水到渠成的事。不过我当时也清楚，有一项技术会成为我们前进路上的障碍，那就是无监督学习，或者说自监督学习，也就是让计算机摆脱人工标注数据的束缚，实现自主学习。因为人工标注数据的效率，迟早会成为技术发展的瓶颈。而当无监督学习技术取得突破的那一刻，我就知道，我们的时代来了。

就在不久前的投资者路演上，还有人跟我说，我当时就明确跟他们提过这场 “质变”。如果你去回看当时的财报电话会议，就会发现每当谈到对世界至关重要的技术话题时，我都会把这一点讲得非常透彻。在每一场投资者路演，在每一个我演讲的场合，我都会强调这个观点。如今，无监督学习技术确实取得了重大突破，深度学习的规模效应也彻底释放出来，我们才算真正驶入了发展的快车道。但即便如此，这项技术如今能解决的问题，依然让我感到惊喜。我们早就预料到技术会发生质变、计算平台会迎来变革，但我们没想到，变革的成果如此丰硕。

我们现在能够解读蛋白质的 “语言”、细胞的 “语言”、量子的 “语言”，能够读懂世间万物的各种表征形式。过去我们用来描述信息的方式，如今正在被彻底重塑。从几何图形、纹理材质到如今的 3D 高斯和 3D 点云，信息的呈现形式日新月异。这种感觉就好像人类突然变得无比聪慧，连英语这种语言体系都随之改变了。我们不再沿用过去的词汇、语法和句式，因为我们的智慧已经进化到了一个全新维度，能够用一种全新的方式进行交流。或许未来人类的交流方式会变成简单的 “嘀嘀嗒嗒” 的信号声。这让我想起了电影《降临》里的场景，人类突然开始用抽象的图形进行沟通，仅仅通过图形就能传递海量的信息，实现更深层次、更高效率的交流。

最不可思议的是，我们现在解决的很多问题在过去是完全无法想象的，而且解决问题的速度也远超以往。过去我们常说摩尔定律，而现在英伟达的发展速度完全可以用 “英伟达定律” 来形容，比过去快了整整一千倍。未来十年必将是波澜壮阔的十年，光是想想就让人无比兴奋。

Jodi Shelton：要做到你所做的这些事，要能够预见未来，并且坚信未来一定会到来，需要何等强大的自信啊。就像你之前说的，我们 1994 年就认识了，这么多年来，你一直都是这个样子。

黄仁勋：是啊，我记得很清楚。

Jodi Shelton：那时候我才二十几岁。你应该比我大一点吧？

黄仁勋：当时我差不多 29 岁，快 30 岁了。

英伟达有 61 位“CEO”，从没有人因犯错而被解雇

Jodi Shelton：我还记得我们第一次见面的场景，当时我是为了给杂志写稿采访你。我问你：“黄仁勋，硅谷人才流动频繁，很多人来了又走，你会担心这个问题吗？” 毕竟当时很多 CEO 都在抱怨这件事。而那时你才 29 岁或 30 岁，你是这么回答我的：“英伟达既不是教堂，也不是监狱。想来的人可以来，想走的人也可以走。” 我当时听完特别震撼，心里想着：“这个人到底是谁啊？” 年纪轻轻，却有着如此的自信和智慧。我还听过一个类似的故事，张忠谋（ Morris Chang）第一次见到你的时候，你当场就说：“我会成为你最大的客户，至少也是最大的客户之一。” 他当时的反应是：“哇，这小伙子可真有魄力。” 所以我很好奇，你这么年轻的时候，这份自信是从哪里来的？

黄仁勋：哈哈，你要知道，什么都懂其实也挺痛苦的，我开玩笑的。对了，张忠谋要是知道英伟达现在是台积电最大的客户，一定会很开心的。

Jodi Shelton：那是肯定的，他肯定会为你感到骄傲。

黄仁勋：我也为他感到骄傲。要知道，在个人电脑革命时期，英伟达就曾是台积电最大的客户。如今，我们再次成为了他们最大的客户，对此我感到非常欣慰。言归正传，我觉得一个人必须坚信自己所相信的东西。而且这份信念，不能建立在道听途说之上，不能因为别人说了什么，你就去相信什么。你必须认真思考，梳理出自己相信这件事的逻辑，并且把这些逻辑拆解成可靠的底层原则。之后，你还需要定期检验这些原则，确保你所秉持的信念、所付诸的行动，都是建立在坚实的基础之上的。

如果这个基础不够稳固，或者因为某些原因发生了变化，那就说明它可能并非真正的底层原则，也许它并没有锚定在物理规律或客观事实之上。一旦出现这种情况，你就要重新评估，然后及时调整方向。我一直都是这样做的。而且，如果你真心相信一件事，就应该付诸行动去实现它。我从 1993 年起就坚信我们正在做的事情，直到今天，这份信念依然没有改变。正因为坚信不疑，所以我才会不断地推演，不断地在脑海里进行逻辑梳理。我会持续复盘过去的决策，也会不断预判未来的趋势。

就像昨天我们开了那么多场会议，每场会议上，我都会重新梳理我们一路走来的逻辑。你会发现，过去的那些假设，有些是正确的，但也有些是错误的。正是因为我们足够灵活，能够根据实际情况及时调整方向，才最终走到了今天。所以，时常回头复盘、重新推演过往的决策，是一件很有意义的事，它能帮你更好地锻炼向前推演的能力。正因为我一直坚持这样做，所以我始终活在自己认定的真相里。直到现在，我依然觉得自己只是英伟达的一名员工。我非常在乎这家公司，但公司里有很多人都和我一样，对这家公司倾注了深厚的感情。

在一家治理完善的公司里，CEO 的角色定位是很明确的。CEO 需要向董事会汇报工作，而董事会则要对股东负责。如果 CEO 的工作表现没有达到董事会的预期，不管董事会有 12 位、13 位还是 15 位成员，他就会被解雇。所以说，CEO 其实也是公司这个组织里的一名员工。这就是为什么我说，英伟达既不是教堂，不是想来就能来；也不是监狱，不是想走都走不了。这种心态能让你始终保持脚踏实地，保持谦逊，保持锐意进取的状态，因为你必须每天都努力，才能对得起自己的这份工作。

有时候会有人问我：“黄仁勋，你热爱自己的工作吗？” 我会告诉他们，我并非每天都热爱这份工作，但我每天都会全力以赴去做好它。我觉得，这种态度源于两个方面：第一，我坚信自己是这份工作的最佳人选；第二，我必须每天都努力，才能配得上 “最佳人选” 这个身份。

Jodi Shelton：在大家眼里，你就是英伟达的代名词，英伟达就是你。这么多年下来，你已经和这家公司深度绑定了。

黄仁勋：我应该是英伟达内部被拍照最多的人吧。

Jodi Shelton：没错。不过，要是将来换了新的 CEO，这个人真的能接好你的班吗？

黄仁勋：世界上不会再出现第二个我这样的 CEO 了。原因很简单，我是被这家公司一步步培养起来的。刚创立英伟达的时候，我对怎么当 CEO、怎么做战略规划、怎么打造产品、怎么开创一个全新的行业，一窍不通。我只知道怎么融资，却不懂怎么和股东沟通，不了解股东、政策制定者、各国领导人以及企业管理者的想法，也不知道该如何把握员工的心态、如何打造企业文化，甚至连 “企业文化” 这个词到底意味着什么，我都无法准确界定，让我制定公司战略那更是天方夜谭。这就是我第一天接手工作时的真实状态。而在过去的 33 年里，我在这些领域都一步步做到了得心应手。

如果说这个世界上有谁能称得上是 “企业战略宗师” 或者 “行业开创者”，那这个人大概就是我这样一个小个子。我把自己的整个职业生涯都投入到学习这些能力上，而且我本身就是个好学生。除此之外，我对这份工作的投入程度和深厚感情，是很难通过招聘来复制的。在我心里，英伟达就像我的孩子一样，我对它倾注了全部的心血。我的家人也陪着我一起，为这家公司的成长付出努力。这种对公司的特殊情感，是很难被替代的。毕竟 33 年来，我见证了英伟达的每一次成功、每一次失败、每一次挫折，亲历了它做过的所有明智决策，也目睹了它犯下的各种错误。这种对公司的深刻理解和情感联结，不是随便招一个能力出众的人就能替代的。

不过从另一方面来说，英伟达的管理团队架构其实早就做好了准备。我现在有将近 60 位直接下属，他们中的每一个人，放到其他公司都能胜任世界级 CEO 的职位。我总是当着他们的面推演各种决策逻辑，我的每一个决定，都是在他们的注视下做出的，我会把背后的思考过程原原本本地讲给他们听。公司的每一次成功、每一次挫折、每一个挑战、每一场困境，我都会和他们一起复盘。所以从某种意义上说，英伟达其实有 61 位 “CEO”。他们每个人都对这家公司饱含深情，很多人已经在这里奋斗了 33 年。我认为，英伟达的成长模式是独一无二的，这也造就了它无可比拟的韧性。

Jodi Shelton：显然，你搭建的这套管理架构在行业内已经成了一段传奇，所有人都在谈论你这近 60 位直接下属。要让这样的架构顺畅运转，这些人肯定都得是万里挑一的顶尖人才。

黄仁勋：没错。

Jodi Shelton：他们不光要头脑聪明，毕竟硅谷从来不缺聪明人，更得是适配英伟达的顶尖人才。

黄仁勋：确实如此。

Jodi Shelton：那你能不能跟我说说，你是怎么筛选和培养这些人才的？另外，我记得你有个原则，找不到合适的人，就宁可让职位空着。我想到了 Colette Kress 的例子，你当时面试了 22 位首席财务官候选人，最终才选定了她。现在她在华尔街已经是一位传奇人物了。你当初是怎么选中她的？你选拔这类核心人才的标准是什么？

黄仁勋：在我看来，宁让职位空着，也不能让不合适的人占着位置，所以我从来不会急于招人。就算 CEO 的位置暂时空缺，或者某个副总裁职位没人接任，公司的运转也不会停滞。只要你坚信这一点，坚信 “空位胜于错配”，你就有足够的时间去寻找那个真正合适的人。这个合适的人选，需要满足很多条件，其中很重要的一点，就是你得发自内心地欣赏他、认可他。

我记得 Colette Kress 入职第一周的时候，就问过我：“黄仁勋，你希望我在首席财务官这个岗位上干多久？” 我告诉她：“只要我们还活着，只要死亡不将我们分开，你就一直干下去。” 因为任何其他答案都是没有意义的。这份工作没有所谓的 “截止日期”，唯一的终点，就是当她觉得英伟达不再适合自己的时候。这个原则不仅适用于 Colette，也适用于我那 60 位直接下属。我愿意为了等待合适的人，让职位空很久。而在这个过程中，公司依然会稳步向前。无论这个空缺的职位对应着什么使命、什么工作，大家都会主动顶上。退一步说，就算没人接手，我也会尽全力扛起这份责任，保证公司正常运转。

这就是我的用人哲学，永远不要让不合适的人占据岗位，耐心等待那个对的人出现。经常有人问我，什么样的员工才算优秀员工，什么样的管理者才算卓越管理者。说来奇怪，我其实没有标准答案。因为能走到我面前的人，都足够聪明、足够能干。你随便找一个首席财务官，我敢保证他绝对胜任本职工作。其他岗位的候选人也是如此。在我看来，英伟达之所以能创造奇迹，关键不在于单个人的能力有多强，而在于团队成员之间的 “化学反应”。更重要的是，这源于我们的企业品格。这种品格，才是一家伟大公司的核心竞争力。市面上有很多公司都在做芯片，虽然是英伟达发明了 GPU，但从产量来看，我们其实是全球最小的 GPU 制造商。

这话听起来可能有点不可思议，但事实就是如此，很多不知名的厂商，GPU 产量都比我们高。很明显，英伟达的成功，绝不是靠产量取胜。我认为，真正的秘诀在于我们独特的企业文化和企业品格、团队在逆境中凝聚在一起的力量。在外人看来，我们似乎总是一帆风顺，但其实研发 Grace Blackwell 芯片的过程，差点拖垮了整个公司。但我们硬是咬牙扛了过来。这个项目的复杂度和规模都是前所未有的，外界对我们的期望也高得离谱。我们最终不仅达标，甚至超出了所有人的预期，而支撑我们做到这一点的，100% 是企业品格。这不是靠智商，也不是靠勤奋就能实现的，毕竟这个世界上，聪明又努力的人太多了。

这种企业品格，是没法通过面试来筛选的。但我始终相信一件事：几乎任何人进入英伟达之后，都会被这种品格所感染、所塑造。这就是我们公司最神奇的地方：我们能够承受挫折，能够直面各种艰巨的挑战，并且一次次从困境中突围。很少有公司的团队能做到这一点。通常来说，当公司遭遇重大挑战后，总会有人因为心存不满离开，或者因为被当成 “背锅侠” 而被解雇。在团队合作中，出了问题总要有人承担责任，这是毋庸置疑的，就像一场球赛输了，我们必须清楚是谁失误丢了球。

在英伟达，我们打造了一个足够安全的环境。过去这些年，包括我在内，很多人都犯过严重的错误，这些失误大家都看在眼里，但从来没有人因为犯错而被解雇。久而久之，英伟达就形成了自己独有的文化和特质。这种文化的核心，就是包容、宽恕，以及从错误中学习。对我来说，有两件事至关重要：只要团队里的每一个人，都为了共同的目标拼尽了全力，这就足够了。

敢叫板 20 岁新锐的黄仁勋，也有至暗时刻？

Jodi Shelton：刚才聊到 “痛苦与磨砺” 的理念，你可以再深入谈谈吗？我最近听 Andy Karp 在播客里说，“人生的二十几岁，要么用来享乐，要么用来打拼事业”。你认同这个观点吗？当然，不是每个人都能成为帕兰提尔或者英伟达的 CEO，但对年轻人来说，想要在事业上有所成就，到底需要付出什么？你想给年轻人传递怎样的职业与成功之道？

黄仁勋：Andy 很睿智，总能说出一些深刻的人生哲理。不过我对这类说法，倒没那么执念。我一直很佩服张忠谋先生，他一直工作到 80 多岁，思维依然敏锐得像一把刀。如果要在维基百科里查 “大器晚成” 这个词，配图说不定就是他。能在人生最具创造力的阶段，持续奋斗 50 年，这难道不是一件幸事吗？我自己也倾向于这种人生轨迹。对我而言，投身于有价值的事业，远比用后 20 年的时间环游世界更有意义，当然，环游世界本身也没什么不好，只是我现在就已经在满世界奔波了。

不得不承认，二十几岁的我，确实更聪明、专注力更强、思维速度也更快。但那个年纪的人，往往缺少一样至关重要的东西，阅历沉淀出的智慧、处理复杂问题的分寸感、制定长远战略的眼光，以及长线思维的能力。这些能力，光靠读书是学不来的。现在的年轻人可以刷短视频，通过共情去感受别人的经历，算是一种间接的经验积累，这种模仿式学习确实有价值。但还有一样东西，是无法通过旁观习得的，那就是坚韧的意志，是直面痛苦与挫折时，懂得如何应对的底气；是熬过精神内耗、挺过煎熬时刻、战胜内心恐惧的勇气。

经营公司的过程中，恐惧是真实存在的。我们的决策，关乎数万人的生计。当公司发展不顺时，一个感受不到恐惧、焦虑和脆弱的领导者，反而是不合格的。如果对结果毫不在意，那未免也太冷漠了。而这些真切的感受和应对的能力，只有亲身经历过，才能真正掌握。所以我觉得，两种人生选择没有绝对的对错。年轻时打拼，确实精力充沛，可以熬夜加班，可以付出十倍的努力，更容易早早取得成功。但我现在身上拥有的东西，是三十岁时的我完全不具备的。

如今的我，思维速度虽然慢了，但依靠智慧和经验积累的思维模型，能更快地找到正确答案。就算和二十岁的年轻人同台竞争，我也有信心不输给他。他们未必能胜过现在的我。

Jodi Shelton：那我们来聊点更私人的话题吧。能不能说说你的童年？哪些高光或至暗的经历，对你如今的性格特质产生了直接影响？

黄仁勋：我从来不觉得自己是天赋异禀的人，智商也算不上出众。小时候入学需要参加考试，我当时的成绩确实很不错，那会儿的考试还是全国性的。我记得母亲总是逢人就说，我是个非常聪明的孩子。不管这话是不是真的，她反复的肯定，无形中给了我一种压力，我必须变得足够聪明。这件事让我意识到，无论是为人父母还是做管理，给身边的人或者整个公司设定一个超出常理的高目标，往往能激发他们的潜能，让他们迎难而上。当然，也有人会被这样的目标吓退，但对我而言，这种激励起到了积极的作用。这是我第一个想到的童年片段。

另一件事，是关于我母亲的。当年我们学习英语的时候，她其实根本不懂英文，而且我觉得她可能连高中都没毕业。但这丝毫没有妨碍她每天教我们学英语。你可能会觉得不可思议，一个完全不懂英语的人，怎么教孩子学英语？她的方法很简单：买一本韦伯斯特词典，照着单词的拼写规律，写下英文单词，再标注上中文释义，把纸对折做成单词卡，然后逼着我们背下来。我们的发音准不准确，她其实也无从判断。但这件事，让我学到了一个道理：一个人只要有足够坚定的意志，就算暂时不知道该怎么做，也不该停下脚步。很多事情，其实并没有想象中那么难。小时候的这段记忆，我一直记到现在。

还有一段经历，是我们搬到肯塔基州之后。我当时是学校里年纪最小的孩子，就读的奥尼塔浸会学院坐落在山顶。每天上学，我都得走下山坡，穿过一条河，再走过一片广阔的田野，才能到达那所小小的学校。那是 1973 年，我是整个镇上第一个出现的中国孩子。镇上的那些孩子都很野，每次我过吊桥的时候，他们都会找我的麻烦。那座吊桥的桥面是木板铺的，有些木板已经缺失了，桥下的河水很深。而那些孩子，就守在桥的另一头等我。那时候我才 9 岁。

Jodi Shelton：天哪，才 9 岁。眼前是一条河，一座破吊桥，桥对面还有等着找麻烦的孩子，这简直太糟糕了。

黄仁勋：是啊，但我每天都得走这条路去上学。这大概就是童年时期的 “痛苦与磨砺” 吧。每天早上都是这样。下午放学回家后，我还有任务：打扫卫生间。那时候家里的每个孩子都有分工，我哥哥当时 11 岁，他的活儿是去烟草农场干活，而我的工作就是打扫卫生间，每天都要做。

Jodi Shelton：你觉得当年那些找你麻烦的孩子，知道你现在的成就吗？

黄仁勋：奥尼塔浸会学院的校长最近还发邮件给我呢。他们每年都会给我寄圣诞礼物，知道我喜欢吃肯塔基风味的香肠肉汁配饼干。

Jodi Shelton：这个爱好是在肯塔基养成的吧？

黄仁勋：没错。我记得我 45 岁生日的时候，家人带我回了一趟母校。当年食堂里做饭的阿姨们居然还健在，特意回来给我做了一顿饭。

Jodi Shelton：天哪，这也太暖心了。

黄仁勋：真的特别感动。她们给我做了正宗的肯塔基香肠肉汁配饼干，味道还是小时候的样子。

Jodi Shelton：你的父母见证了你的成功吗？

黄仁勋：当然，他们现在身体还很好，特别为我骄傲。他们对我的事情了如指掌，我父亲会读所有和我相关的报道。要是看到有人说我的坏话，他还会生气。我总劝他别什么都看，不然天天都得生气，别理会那些负面新闻。

Jodi Shelton：挺有意思的。现在功成名就了，你会怀念那些还没这么受关注的日子吗？会想念那些平凡的小事吗？比如你很爱车，现在却没什么机会开车了吧？我记得你是我认识的人里，第一个也是唯一一个拥有柯尼赛格跑车的人。

黄仁勋：克里斯蒂安・冯・柯尼赛格真是个天才设计师，那辆车太棒了。启动的时候，引擎声和蝙蝠侠的座驾一模一样。而且启动它得按七个步骤，因为动力实在太强劲了，不能随便让别人碰。不过我现在已经没有那辆车了，也确实很少开车了。

Jodi Shelton：会想念开车的感觉吗？

黄仁勋：有一点吧。我现在还是会关注新车，比如新款的法拉利，每次看到都觉得很惊艳，这些车真的是工程学的杰作。

Jodi Shelton：确实很厉害。我去过法拉利的工厂，亲眼看到一辆车从工业器械一步步变成顶级消费品，现在甚至成了艺术品，这个过程太震撼了。

黄仁勋眼中五年后的世界

Jodi Shelton：如果五年后我们再坐在这里，你觉得到那时的世界会是什么样子？哪些变化会让我们最惊讶？

黄仁勋：如果我们回归底层逻辑，再结合现实的实用性和技术落地的规律来判断，有几件事是可以预见的。首先，英伟达和整个行业在 AI 领域的投入，必将彻底改变计算机的运作模式，未来的计算机，将从 “由人类编程” 进化为 “在人类引导下自主学习编程”。过去我们是手把手教计算机学日语，未来我们只需要告诉它 “去学日语” 就够了。未来的计算机，将能够处理比现在大十亿倍的问题规模。这个变化的影响之大，我们现在甚至无法完全想象，因为提出解决方案是一回事，而能否构想出需要解决的问题，就是另一回事了。很多问题之所以无法被解决，往往是因为我们连如何定义和描述它们都做不到。

未来，无论是数字生物学、物理科学、量子物理还是材料科学的复杂难题，都会变得容易攻克。就算是交通拥堵这种日常问题，也能得到极大改善。就拿智能电网来说，现在的电网存在大量能源浪费，AI 会精准计算出所需的能源量，实现按需分配，从根本上避免过度供应造成的损耗。AI 解决这些日常难题的能力，会让人惊叹不已。到那时，每一个科学领域都会被重塑，当下所有的难题都会被技术赋能、迎刃而解。工具的速度提升了，难题自然就显得 “渺小” 了。举个例子，如果飞机的速度能达到 10 马赫，整个世界就会变得 “小” 很多，喷气式飞机的出现，其实已经让世界变小了。

英伟达制造的计算机也是如此，极致的运算速度让所有问题都变得更容易被解决。就像 OpenAI 的研究人员曾经说的：“为什么不把整个互联网的数据都喂给计算机呢？” 因为在算力爆发之后，全球互联网的数据量，突然就显得微不足道了。现在我们看互联网数据，也会觉得体量很小，原因就在这里。这种心态，未来会渗透到几乎所有的科学领域。过去人们会说 “这是个无解的难题”，未来大家只会觉得 “这事儿很简单”。五年后，每一位科学家、工程师、企业家和创新者，都会抱着这样的心态。曾经的难题变得简单，我们就能解决更多的问题。这是第一个必然结果。

第二个结果，就是企业的生产效率会实现质的飞跃。今天的难题变成明天的小事，供应链管理会变得无比顺畅，浪费现象基本消失；计算机的设计流程也会简化，我们可以尝试更多的方案。这并不是说我们会每年推出更多的产品，我们还是保持一年一款的节奏，但每一款产品都会经过更多次的迭代优化，最终呈现的成品会比现在好得多。这样一来，公司的效率会更高，利润会更丰厚，所有企业都会变得更赚钱，整个社会的财富也会随之增长。但还有一个值得深思的点：当所有我们能想到的问题都变得可以解决时，我们就会去探索更多新的问题。

所以，未来的趋势不会是就业岗位减少，反而是大家会变得比现在更忙碌。因为以前那些被认为 “不可能完成” 的任务，现在都摆上了台面；那些因为成本太高而无法开展的实验，现在都可以去尝试，AI 还会帮我们推进这些实验。只要我们有足够的想象力，所有搁置的难题，都会找到解决的路径。我可以做一个思想实验。现在我工作时，身边围绕着 60 位顶尖人才，而他们每个人又带着数千名精英。这些人在各自的领域里，能力都远超于我，对我来说，他们就像是 “领域内的人工超级智能”。但和他们合作，我完全没有障碍。现在我使用的 OpenAI、Gemini、Grok、Perplexity、Anthropic 这些 AI 工具，在很多方面也已经比我聪明了，但我每天都在和它们高效协作。

不过有一个很有意思的变化：以前我给团队布置一个问题，需要等两三天才能得到反馈和答案，这段时间里我可以思考下一步的计划，因为我的决策需要基于这些中间结果。但如果这些答案能在一秒钟内就反馈给我，会发生什么？我的工作节奏会变得无比紧凑，因为我会成为所有事情的关键节点。刚得到一个答案，立刻就要推导下一步，马上启动新的实验。你不觉得吗？现在信息技术的提速，已经让我们变得更忙碌了。信息、知识和答案的获取速度越来越快，我们作为决策节点，自然会比以往更忙。我觉得未来很多人都会有这种感受。

最后一点，对于那些没能赶上之前科技浪潮的人来说，AI 会填平技术鸿沟。我特别喜欢 “氛围编程” 这个概念，现在任何人都可以成为软件程序员，借助 AI 写出的代码，甚至比很多专业程序员的作品还要好。我很欣赏 Cursor 这家公司的成果，前几天还见到了 Lovable 的 CEO，他是个很厉害的人，他们的公司在瑞典。AI 会帮助那些在自己的领域很有天赋，但不懂如何用技术放大自身能力的人实现能力的跃迁。Lovable 的 CEO 就跟我说过，很多人用他们开发的软件创办了小公司，现在每年能赚 2300 万美元。这太不可思议了。这些人终于能融入全球经济体系，不再被技术门槛挡住去路，这一切都是 AI 的功劳。

五年后的世界，大家会拥有更有价值的工作，经济效率会大幅提升，GDP 有望实现增长，劳动力短缺的问题会得到缓解，通货膨胀也会回落。更多的科学领域会被开拓，更多的难题会被解决。当然，也有一些悲观的论调，认为 AI 会让一半的人失去工作。但我觉得，更可能发生的情况是：100% 的工作岗位都会发生变化，但不会有 50% 的岗位消失。而且，那些现在没有工作的人，很可能会因为 AI 获得谋生的手段。

当然，我们的技术会发生翻天覆地的变化，但这些技术层面的革新，反而不是最有意思的。五年后，计算机还是计算机，只是应用变得更智能了，本质上还是软件。我们依然会做电商，只是可能不用自己逛网站了，会有智能代理帮我们购物，但商品还是来自亚马逊这些平台。很多事情，其实都会保持原样。最后我还有一个小小的愿望或者说期待：希望我们在机器人和人形机器人领域的研究能结出硕果，希望未来每个人都能拥有属于自己的 R2-D2 和 C-3PO，它们可爱又贴心。就像在 GTC 大会上，我每次都会邀请迪士尼的机器人上台，那些机器人真的太萌了。

为什么不让每个人都拥有一个呢？我还希望迪士尼能把这些机器人做成周边商品，它们真的值得。我的宠物猫莫莫和库玛，也需要这样的 “宠物玩伴” 不是吗？我真心希望这个愿望能实现。现在有很多孤独的人，已经有不少人联系过我，希望能拥有可以在家陪伴自己的机器人，尤其是那些独居的老人。机器人能给他们带来陪伴和帮助，而且它们本身又那么可爱，这绝对是我们技术发展带来的意外之喜。

Jodi Shelton：如果以后有机器人帮我们做饭、打扫卫生，你还会像现在这样，饶有兴致地看着别人做饭吗？

黄仁勋：当然会。原因很简单，我现在完全有能力不用自己做饭，但我还是会选择下厨。我们完全可以雇很多佣人，但我们没有这么做。我和洛里一直都是两个人自己过日子。昨晚她做了墨西哥辣椒肉酱，味道棒极了，全程都是她一个人忙活的。以后我们大概率还会保持这样的生活。对我来说，最幸福的时刻，就是孩子们回家来，我们一起下厨做饭，喝喝小酒，这就是最完美的时光。

Jodi Shelton：一家人在厨房里忙活，这种亲密感真的太美好了。

黄仁勋：是啊，人生的幸福莫过于此。我们打拼奋斗，不就是为了这样的时刻吗？

“不爱演讲的黄仁勋”：CEO 是公司里最脆弱的一群人

Jodi Shelton：当一切尘埃落定，你希望后人如何记住你？

黄仁勋：首先，能被人记住，本身就是一件很幸运的事。我很庆幸，凭借英伟达的成就，凭借我们打造的事业，凭借我们在全球最重要的科技产业：人类最核心的工具 “计算机” 领域留下的印记，英伟达很可能会在我离开这个世界很久之后，依然对这个世界有着重要的意义。我很庆幸自己能和克里斯、柯蒂斯一起创立这家公司，很庆幸自己能一路学习成长，没有成为拖垮公司的那个短板，反而常常是推动公司走下去的一份力量。我们打造的这家企业，对整个世界都有着深远的影响，而不只是局限于某个行业或某个群体。

能做到这一点的人，在这个世界上并不多。我很庆幸自己作为创始人，能亲身参与并见证这一切，见证英伟达成长为如今的模样，见证它对全球各行各业产生实实在在的影响。公司里有很多已经工作了 33 年的老员工，他们的人生因为英伟达变得更加丰盈；现在甚至已经有第二代、第三代员工加入我们。我们在全球各地建立了自己的团队，我很荣幸能和这些员工并肩作战，分享他们一路走来的绝望与喜悦、希望与悲伤。这样的经历，并不是每个人都能拥有的。我为我们在中国的团队感到骄傲，为我们在印度的员工们由衷赞叹，也为欧洲、加拿大的团队感到欣慰。我们在加拿大的团队正在不断壮大。

我还希望有朝一日，英伟达能把业务拓展到南半球，让更多地区的人们，也能享受到我们今天所拥有的技术成果。昨天我还和人聊起我们在非洲开展的工作，聊到我们应该在拉美和东南亚投入更多精力。我真的为我们公司带来的这些影响感到自豪。所以，人们会怎么记住我？或许，他们会记得我是英伟达的创始人之一，是这家公司的缔造者之一。或许，还会记得我是个好人。

Jodi Shelton：这是毋庸置疑的。

黄仁勋：他们或许还会觉得，我是个风趣幽默的人，不喜欢端着架子。其实在很多方面，我都算是一个 “不情愿的 CEO”。比起待在公司外面抛头露面，我更喜欢扎根在公司内部；比起发表演讲，我更喜欢安静做事；我甚至一点都不喜欢做主题演讲，但为了公司，我必须去做这些事。我确实是个不太情愿的 CEO，但我绝对是个满腔热忱的英伟达建设者。只要是为了公司发展必须做的事，我都会全力以赴。说了这么多，其实我也不知道，人们最终会如何记住我。

Jodi Shelton：我觉得，看到好人获得成功，总是一件令人开心的事。这么多年来，看着你一路打拼，经历起起落落，最终收获成功，我真的由衷地为你高兴。你这一路走来，见过了形形色色的人。

黄仁勋：是啊，真的见过了太多人。我想提醒所有的 CEO，没有人能单枪匹马地成功。

Jodi Shelton：确实如此。

黄仁勋：我们虽然是 CEO，但这个位置总需要有人来坐。如果不是早年大家对我的提携与帮助，比如你一直不遗余力地宣传英伟达还有张忠谋奖带来的认可，这些都对我意义重大。张忠谋奖大概是我人生中获得的第一个真正有分量的奖项，直到今天，它对我来说依然意义非凡。这个奖项以他的名字命名，而且他还亲自参与了评选，这份认可真的让我铭记于心。还有那些和我们合作的企业，他们的慷慨相助，我也一直记在心里。

其实 CEO 这个角色，很多时候都需要寻求帮助。我已经记不清有多少次，我是这样开启一段对话的：“我需要你的帮助。” 很多时候，我是真的需要帮助，而且对方往往是唯一能帮到我的人。一路走来，很多人都慷慨地伸出援手，分享他们的知识，教我做事的方法，帮我解决棘手的难题。这或许才是 CEO 这个角色带给我的真正启示，这个职位远比人们想象的要脆弱得多。

Jodi Shelton：而且还是一个很孤独的职位，对吧？

黄仁勋：确实可能会感到孤独。但我想说，这种孤独更多是存在于我们的内心世界。当你试图解决一些棘手的难题时，往往需要长时间独自思考，自己跟自己对话。公司发展的每一次转型、每一次跨越，每一次我推动公司自我革新的时刻，我都不知道自己独自思考了多少个小时。在那些时刻，你会真切地感受到孤独。但我们也要明白，其实有很多人都希望我们能成功。就像你之前说的，你很乐意看到我成功，我知道你是真心希望我好，而我也同样希望你能越来越好。从这个角度来说，我们其实并不孤单。

所以说，CEO 这个职业，是一份充满脆弱感的工作。你无法单打独斗完成任何事，很多时候都需要依赖别人的帮助与善意。或许在外界看来，我们是强大的领导者，但实际上，我们可能是公司里最脆弱的一群人。我经常说，我是公司里唯一一个离开别人的帮助就寸步难行的人。我想，大多数 CEO 应该都是如此。这或许就是这份职业带给我们的感悟：CEO 们，远比他们愿意承认的要更加脆弱。不过对我来说，承认这种脆弱，并不是什么难事。

“没有终极目标” ，才成就了英伟达？

Jodi Shelton：接下来我们用快问快答收尾。你见过的最聪明的人是谁？

黄仁勋：这个问题我没法回答。我知道大家心里对 “聪明” 的定义，就是智商高、会解决问题、技术能力强。但在我看来，这种能力早已经成了一种 “通用品”。而且我们很快就能证明，AI 处理这类问题是最轻松的，不是吗？举个例子，以前大家都觉得软件编程是最考验智商的工作，结果呢？AI 最先攻克的领域之一就是编程。所以说，“聪明” 的定义，其实和大多数人想的完全不一样。

在我看来，从长远来讲，真正的 “聪明”，是那种兼具技术洞察力与人文同理心的能力，是能够洞察弦外之音、预判未知风险、看透表象背后本质的能力。那些能 “见人所未见” 的人，才是真正的聪明人，他们的价值是无可估量的。这种人能凭借数据、分析、底层逻辑、人生阅历、智慧经验，再加上对他人的感知，敏锐地捕捉到潜在的风险，在问题发生之前就提前规避。我觉得这才是 “聪明”，而且拥有这种能力的人，说不定在学术能力评估测试（SAT）里的分数惨不忍睹。

Jodi Shelton：外界对你有什么误解？

黄仁勋：这些问题都好犀利啊。首先，我都不知道外界对我有什么印象。

Jodi Shelton：比如，大家觉得你喜欢抛头露面，觉得你是个很棒的演讲者，所以肯定很享受做演讲的过程。但你之前已经说了，事实并非如此。

黄仁勋：对，完全相反。公开演讲简直让我怕得要死。不是说站在台上的那一刻害怕，而是现在，想到两周后在华盛顿举办的 GTC 大会，我就焦虑得不行。不，应该说，我已经焦虑一个月了。这种事总是让我心神不宁，脑子里时时刻刻都想着，压力特别大。公司内部的会议演讲也让我紧张到极致。因为台下坐的都是对我而言最重要的人，从某种程度上说，这是我做过的最重要的演讲。但这种演讲根本没法准备，我要讲的所有内容，其实都能在网上的某个视频里找到，他们完全可以自己去看。

我很讨厌把那些内容重复一遍讲给他们听，因为你绝不会回家对着家人做一场 GTC 主题演讲，对吧？我也不想那样做。演讲内容必须是真诚的、独一无二的、对听众有价值的、有意义的，能给他们带来改变。毕竟我还在领导这家公司，我希望通过演讲达成一定的目标。所以我必须拿出全新的内容，但不到演讲结束的那一刻，我永远不知道最终效果会怎么样。大家都觉得财报发布周我会很紧张，但说实话，我一点感觉都没有。真正让我紧张的，是公司的内部会议演讲。所以外界的这个印象，真的大错特错。

Jodi Shelton：你最受不了的事是什么？

黄仁勋：在关键时刻，有人不认真听我说话、不理解我的问题，还胡乱回答。尤其是在我们处理非常棘手、非常困难的问题时，我们需要的是事实，是真相。这个时候我提出问题，如果有人答非所问，我会立刻火冒三丈。我实在无法理解，为什么有人意识不到这场会议的重要性？我们正在为一件至关重要的事努力，我们需要尽快找到真相、解决问题。我到现在都想不通这一点，这种情况每次都会激怒我。谁要是想惹我生气，这招百试百灵。

Jodi Shelton：这下我们知道怎么让黄仁勋发火了。

Jodi Shelton：最后一个问题，是最近有人问我的，我特别喜欢这个问题。如果让你回到 20 岁，你是想回到自己当年的那个年代，还是活在当下的 20 岁？

黄仁勋：我会毫不犹豫地回到自己的那个年代。因为我觉得，我们那一代人的 20 岁，比现在年轻人的 20 岁更快乐。我总觉得，每个人都应该拥有一段 “懵懂无知” 的时光，不必从第一天起就背负着全世界的重担。我坚信这一点，没人能说服我。有时候，“无知” 也是一种快乐，甚至是一种超能力。如果当初我知道创立英伟达是一件 “不可能完成的任务”，那今天的英伟达根本就不会存在。事实就是，创立英伟达这件事，本来就是天方夜谭。但当时的我什么都不懂，所以没人能说服我放弃。

我觉得，乐观的人都这样，你永远没法说服他们 “这件事做不成”。他们就是这么 “无知”，对现实的艰难视而不见，所以才会充满乐观。这难道是坏事吗？现在的年轻人，过早地接触到了太多信息，变得越来越愤世嫉俗。他们并不是天生就这么消极，而是因为看到的东西太多太杂了。其实大可不必如此。人需要培养内心的乐观精神，需要在心里留存一份善意，学会只看到世界美好的一面。我们得锻炼这种能力。我们那一代人，有更多这样的机会。我们 20 岁的时候，就是这样的，乐观得像超人一样，觉得凡事皆有可能。所以，我肯定会选择回到自己的 20 岁。

Jodi Shelton：真是个完美的收尾。无知是福啊。

黄仁勋：没错，无知是福，无知也是一种超能力。任何一个想要开启新征程的人，如果不是因为这份 “无知”，他们一早就会因为觉得事情太难而放弃了。我真的很庆幸，自己当年虽然也算勤奋、也算有一些能力，但那份 “无知” 帮了我大忙。我那时候做任何事都抱着一种心态：“这能有多难？” 结果后来才发现，简直难到超乎想象。你根本没法想象。你看看我今天建立的这一切，如果当初我就知道前路会有这么多艰辛、这么多挫折、这么多失望，把这些困难全都摆在我面前，我绝对不会去做的，绝对不会。所以说，“无知” 真的是一种超能力。

还有一种超能力，就是“没有终极目标”。英伟达就没有什么终极目标。总有人问我：“黄仁勋，你的计划是什么？” 我们没有计划，“活下去” 就是我们的计划。我们对未来的世界有憧憬，我们会畅想技术会如何改变世界，但我们 100% 的计划，就是让公司一直运营下去。以前也有人问我，现在也经常有人问：“黄仁勋，你的人生目标是什么？” 我没有什么人生目标，就是想一直工作，一直有事可做，能和一群优秀的人一起做有意义的事。这就是我的目标。

所以说，从很多方面来讲，“没有终极目标” 这一点，对英伟达的发展真的起到了至关重要的作用。

参考链接：

https://www.youtube.com/watch?v=8FOdAc_i_tM

最烦做演讲！黄仁勋曝英伟达养了 61 个 CEO、从不炒犯错员工：CEO 是最脆弱群体

作者: 纯情
时间: 2026-01-19
分类: 资讯
评论