标签 公司文化 下的文章

Sulaiman Ghori 在一期播客中,用了一个多小时详细讲述了他在 xAI 的经历。他说,在那里“从来没有人对我说不”,每个人都被充分信任去做正确的事;只要是好想法,当天就能落地、当天就能得到反馈。他还提到,马斯克愿意被证明是错的,只要你能拿出实验数据。

 

他也坦言,在上一家公司,很多事情也许他一个人能做得更快;但在 xAI,整体反而更快,因为几乎没有官僚流程。这些话,听起来都是对公司的认同和马斯克的赞扬,实际上他还说自己是马斯克粉丝。

 

然后,播客发出来后第 3 天,他被解雇了。

 

外界猜测是因为他说了太多敏感信息。节目中,他透露了利用闲置特斯拉汽车驱动的人类模拟器 AI 代理的计划、还有马斯克如何快速构建 Colossus 超级集群、xAI 在模型策略上的核心决策,曝光了公司内部部署测试的 AI 虚拟员工等,还有 xAI 也被完全曝光。他坦率地谈到了激进的时间表、马斯克亲自参与的 Cyber​​truck 奖金计划、内部文化和运营方式以及一些非公开的策略,这些言论引发了外界的强烈反响。

经历被玩梗:如何在 1 小时内毁掉你的一生,对应了最近 x 的爆文“如何在 1 小时内修复你的一生”

 

Sulaiman 自 2019 年起持续创业。在德国上大学一个月后退学,为了实现童年创办航天公司的梦想,在自家后院亲手制造过一台液体燃料火箭发动机。创业失败后,他进入 xAI。对于他的经历,有网友表示,“这位兄弟跑去上播客,没拿到明确授权,就顺手把一堆内部敏感信息抖出来,这就是纯纯的新手行为。可以说,这是职业生涯级别的大忌。任何一家严肃的公司都会立刻把你原地开除,更别说是像马斯克这样的人。”

 

我们翻译并整理了他这期“超级爆料”的播客对话,并在不改变原意基础上进行了删减,以飨读者。

 

在 xAI,事情永远是“昨天就该完成”

 

主持人:今天我很高兴能和 Sulaiman Ghori 坐下来聊聊,他是 xAI 的一名工程师。我从 2023 年马斯克刚开始搞 xAI 的时候就一直很关注这家公司,感觉它可能是史上增长最快的公司之一。你能不能跟大家讲讲,现在 xAI 到底在发生什么?

 

Sulaiman:说实话,我们几乎没有所谓的 deadline,永远都是“昨天就该完成”。基本没有什么人为障碍。马斯克一直强调要“追根溯源”,找到最底层、最根本的东西,不管是物理层面的还是其他的。我们通常会非常快地深入到那个层面,能多快就多快。

 

这在软件行业其实挺有意思的,因为你平时不太会把硬件这件事放在心上,但我们确实花了很多精力去考虑这些。而且严格来说,我们现在也不完全算是一家纯软件公司了,毕竟基础设施的建设占了很大一部分。

 

主持人:对,现在明显是被硬件限制住的。

 

Sulaiman:没错。硬件可能是我们最大的优势之一,因为在部署能力上,几乎没有其他公司能接近我们。不过,软件方面的人才密度也高得惊人,我从来没在任何地方见过这样的团队。

 

主持人:我觉得马斯克有一点特别厉害:他很擅长提前判断未来几个月、甚至几年后会出现什么瓶颈,然后从那个未来的瓶颈反推,确保自己现在就站在一个很好的位置上。这种思维方式在日常工作中是怎么影响普通工程师、AI 开发者的?

 

Sulaiman:通常我们一旦要快速启动一个新项目,不管是我们还是他自己,都会先定一个指标。这个指标一般都非常核心,要么直接关系到财务回报,要么关系到硬件层面的产出,有时候两者都有。之后,所有事情都会围绕着这个指标来推进。而且我们不太接受那种“这事本来就不可能”的说法,就算真有极限,那也必须是一个扎根在最底层的、本质性的限制,而不是人为的。

 

软件行业里,尤其是过去十年做 Web 开发的人,往往会默认、接受很多所谓的限制,比如速度、延迟之类的。但实际上这些限制很多都是假的。技术栈里有大量没必要的开销和“蠢东西”,如果你能把这些清掉,很多系统都能直接提升 2 到 8 倍,至少是那些相对比较新的东西。当然,也有些老东西确实不好动。

 

主持人:你最近一次真正感受到“传统认知被彻底打碎”的经历是什么?

 

Sulaiman:最近一次就是我们在 Macrohood 上做模型迭代。我们同时在做几种全新的架构,而且是并行推进的。现在我们几乎每天都会出新版本,有时候一天不止一次,有些甚至是从预训练阶段就开始重新来。这在业内其实非常少见。

 

这背后有几个原因:第一,我们有一支非常强的超算团队,他们解决了很多训练过程中常见的障碍。即便我们的硬件环境变化很大,但通常一个机架搭好后,一天之内就能开始训练,有时候甚至几个小时就可以。

 

主持人:这真的很不正常,一般不是都要好几天吗?

 

Sulaiman:甚至好几周。过去十年里,大多数人都是把这些事情抽象掉,交给 Amazon、Google 去管,他们给你多少算力你就用多少。但在 AI 时代,这种方式是行不通的。要么你死掉,要么你自己把这些东西建出来。

 

入职初体验:没人管,做模型和产品默认资源到位

 

主持人:当初为什么加入 xAI,以及前几周入职体验怎样?

 

Sulaiman:我当时刚搬到湾区,在做自己的创业项目。那段时间,xAI 的联合创始人之一 Greg Yang 主动联系了我。他真的很会招人。

 

我一开始收到邮件的时候还以为是垃圾邮件,因为那时候我经常收到那种“嘿,想聊聊吗”“我很欣赏你做的事情”之类的邮件。正准备删掉的时候,看到发件人的域名是 xAI,我一下反应过来:等等,这不是那帮人吗?当时他们大概成立了八个月左右,我就答应先聊聊。我们聊了好几次,我本来还想再试试别的机会,但后来发现时机不太对。

 

那个项目最后也没做下去,原因很明显:用一百万美元是不可能把 Macrohard 这种东西做出来的,但想法本身是对的。接下来六七个月,我基本是在烧钱,做各种航天相关的小项目,还试过一个“空气空间”相关的概念,后来也发现大概率行不通,但至少试过了。于是,我又给 Greg 发邮件,说能不能再聊聊。他直接回我:要不要明天面试?我说“好”。

 

面试还算顺利,我周一就搬家,直接入职了。第一天真的没人管我,就给了我一台电脑和工牌。我当时想:那现在怎么办?我去找 Greg,说我连团队都没有,也没人告诉我该干嘛。他当初招我进来,更多是因为他认可我之前做的事情,也觉得和 Macrohard 的长期方向相关,但那时候 Macrohood 甚至还算不上一个正式项目。

 

后来正好 Ask Grok 要启动,做和 X 的集成,他们问我能不能帮忙,我说当然可以。第一周我基本就是和另外一个人一起干活。但我很快意识到,在 xAI,你坐在工位上,甚至站起来一看,就能指着某个东西说:哦,这是那个人做的。这种感觉非常酷。而且我连固定工位都没有,就坐在当天没来的人桌子旁。

 

主持人:那时候公司里人其实也不多吧?

 

Sulaiman:对,大概也就几百人,工程团队一百来号人。基础设施团队具体多少人我也说不太清,因为有些人是从其他团队慢慢转到我们正式编制里的。但整体规模确实比其他实验室小个数量级。当时我们刚做完 Grok 3。

 

主持人:真的很酷。我特别喜欢的一点是,xAI 从成立到现在的速度实在太夸张了。我记得马斯克一开始还说,不确定在别人已经领先好几年的情况下能不能成功。结果你们第一个 Colossus 数据中心 122 天就建完了,这在行业里几乎是不可想象的。这种速度塑造了一种怎样的文化?

 

Sulaiman:他让我们在做模型和产品的时候,可以默认资源是到位的。事实也确实如此,我们并没有被资源严重卡住。

 

当然,我们还是会把资源用到极限,但那是因为同时在推进二三十个、甚至更多事情。有大量训练任务并行跑着,通常是由少数几个人在推动。这也是为什么我们在模型和产品迭代上能这么快。而且这种速度让我们可以更长期地去思考。比如 Grok 4、Grok 5,其实在我加入之前、甚至 Grok 3 落地之前,规模和预期就已经设计好了。

 

主持人:也就是说,至少提前一年在规划?

 

Sulaiman:对,而且你能感觉到,这些预期大概率是能实现的,因为团队整体非常可靠。这就极大地解放了你的思维,让你不用老是纠结“我会不会做不到”。举个例子,我们之前假设的最低延迟,其实比真正需要的高了大概三倍,而基础设施的建设让我们可以做到这一点。

 

主持人:这是什么意思?

 

Sulaiman:我们在做的一种新架构,如果没有足够高的实验频率,基本是不可能推进的,因为它完全不建立在现有研究基础之上。你需要全新的预训练体系,也需要新的数据集。这本身并不完全受制于硬件资源,虽然也有一些因素,比如 Tesla 计算平台的问题。这个其实已经是公开的了。

 

我们现在在想一件事:如果我们用 Macrohard 去做“人类模拟器”,那要怎么部署?如果要部署一百万个“人类模拟器”,就需要一百万台计算机,这怎么可能?

 

结果两天后答案就出现了:Tesla 车载计算机。它的资本效率非常高,我们可以在上面跑模型,甚至跑一个完整的人类工作环境,成本比在 AWS、Oracle 的虚拟机上,甚至直接买 Nvidia 硬件都要低得多。这让我们可以假设:我们能以更快的速度、在更大的规模上部署。所以我们也相应调整了预期。

 

主持人:也就是说,你们基本上可以直接利用汽车网络?

 

Sulaiman:所以这其实是一种潜在的解决方案。简单来说,我们想要一百万个虚拟人(VMs)。仅在北美,就已经有大约 400 万辆特斯拉汽车。假设其中有三分之二,或者哪怕一半,已经配备了 Hardware 4。而且在 78% 到 80% 的时间里,这些车基本都是停在那里,要么闲置、要么在充电。那我们完全可以付费,让车主把车的算力时间“租”给我们。车本身已经有网络、有散热、有电力。我们可以直接在车上运行一个“人类模拟器”,也就是 Digital Optimus。这样一来,车主的租赁费用能被覆盖,我们这边则得到一个可以投入工作的完整人类模拟器。整个过程几乎不需要额外的基础设施建设,基本就是一个纯软件层面的方案。

 

主持人:对,这个资产本来就放在那里,你们只是把它用起来了,太厉害了。那从宏观层面看,这种“人类模拟器”规模化到几百万个,它的目的是什么?

 

Sulaiman:其实核心概念非常简单。Optimus 就是把人类能做的任何物理任务,让机器人自动完成,成本更低,而且可以 24×7 全天候运行。

 

我们现在做的,是把这个逻辑复制到“数字世界”。凡是人类需要通过键盘、鼠标、看屏幕、做决策来完成的数字化工作,我们都可以直接去模拟人类的操作过程。完全不需要软件方做任何适配,也不需要改系统。只要现在有一个岗位是人类在用电脑做的,我们理论上都可以直接部署。

 

主持人:挺有意思的。那具体会怎么推进、怎么落地呢?

 

Sulaiman:我们还没公开详细的落地计划,整体来说会是先慢后快。对我们来说在于,要么基础设施已经建好了,要么我们可以直接用特斯拉的网络,或者自己扩数据中心、测试算力。实际上,从一千个“人类模拟器”扩展到一百万个,差别对我们来说并没有想象中那么大,这反而不是最难的部分。

 

马斯克一个电话“救火”,个人“生死自负”

 

主持人:马斯克最擅长的一件事,就是在公司里不断“救火”,哪里有问题就冲到哪里把问题解决掉。你有没有见过那种,本来是个大问题,但被他非常快地解决掉的情况?

 

Sulaiman:有,最典型的就是基础设施建设,这是最大的一个。模型这边也有过一些小波折,但整体还算顺利。在模型侧,因为涉及很多非常底层、非常具体的算子,每一代 ASIC、CPU 都是为特定操作优化的,当我们引入新硬件,比如从 Nvidia 或其他厂商拿到新产品时,往往不是所有东西都能直接跑起来。

 

去年年初有几次内部会议,他听到这些问题之后直接打了一个电话,第二天软件团队就给我们交付了补丁。我们几乎是并肩作战,直到问题解决,然后就能很快在新硬件上跑模型或训练任务,否则这种来回沟通可能要拖上好几周。

 

所以很多这种“卡点”,真的就是一个电话就解决了。要么是我们主动提出来,要么他自己会问。经常在会议快结束、或者讨论暂时停顿的时候,他会突然来一句:“我能怎么帮忙?怎么能把这件事再加快一点?”然后就有人把问题抛出来。

 

主持人:我知道你们在并行做很多不同的产品,这在一定程度上是必须的。但在大多数组织里,同时推进多个目标,其实很难保持专注。你们是怎么做到多线并行还能高效执行的?

 

Sulaiman:说实话,很多时候,是在全员会议或者大家私下聊天时,我们才真正搞清楚每个人在做什么、各个项目进展到哪一步。

 

比如,我们当时做语音模型和语音部署,其实很多极低延迟的端到端能力早就已经在系统里了,从数据包发到客户端那一整套链路都准备好了。后来只是把正确的开关打开、解决一些冲突,延迟就直接降了两三倍。

 

这种情况非常常见:在软件或硬件某个角落里,存在一个“很蠢”的问题,而恰好已经有人想好了方案。你可能是在翻代码库的时候发现,或者随口问一句,有人就会说:“哦,这个 XYZ 已经搞定了,你去找他就行。”基本不需要花太多时间对齐、同步、请示。提出一个想法,反馈要么是“这想法不行”,要么是“那为什么还没做完?”然后你就直接去做,事情就这么推进了。

 

主持人:在马斯克的公司里,好像你只要主动要责任,就得“生死自负”。事情做成了就担负更多责任,做不成可能就出局。你的体验是这样吗?

 

Sulaiman:是的,基本就是这样。我参与过很多不同的项目,大多只是因为有人找我帮忙,我就一直帮下去。结果到最后,我就成了某个模块、甚至一大块系统的负责人。

 

对所有人来说都是这样。如果你在某个领域有经验,或者能非常快地推进事情,几天之内,这个组件就归你负责了。从“正式流程”上看其实挺混乱的。我在 HR 系统里可能还是挂在 voice 和 iOS 名下,安全系统甚至还以为我在做 X 的集成,从来没人更新这些信息。

 

主持人:也就是说,你进公司时并没有一个非常清晰的工作方向,就是先开始干活,然后不断在不同项目之间流动,谁需要你你就去哪?

 

Sulaiman:差不多是这样,会有很多重叠和流动。入职之后,我通常同时参与两三个项目,哪个最紧急、或者我能帮上最多忙,就会占用我大部分时间。然后项目之间会像瀑布一样自然切换。

 

主持人:那从入职到现在,你大概都做过哪些项目?

 

Sulaiman:一开始我做的是 Ask Grok 以及相关集成,也和后端团队一起处理过可靠性和扩展性问题,当时系统规模增长得很快;之后我独立承担了桌面端套件的开发,把它做到内部可用的完整状;接着又被拉去帮做 Imagine 的发布,以及 iOS 相关工作。说真的,iOS 团队小得离谱,和用户规模完全不匹配,你绝对猜不到有多少人。

 

主持人:五个?

 

Sulaiman:三个。当时推出时,我正好是第三个。但大家都非常强。这是我第一次感觉到,自己必须拼命跑才能跟上整体的节奏和人才密度。

 

主持人:那你第一次真正感觉到“自己被充分使用”的时刻是什么?

 

Sulaiman:肯定是 Imagine 的那次发布。我们基本是 24 小时一个迭代周期:晚上收到反馈,当晚就改;第二天早上再看新一轮反馈,接着马上修 bug、加大家想要的新功能。模型这边有新变化,我们也立刻跟进。整个节奏非常快,那可能是我连续每天都在办公室待着时间最长的一段时期。

 

主持人:那段时间持续了多久?

 

Sulaiman:大概两三个月。那段时间几乎没有周末,但我反而挺开心的,也算验证了自己能扛住这种强度。之后我就被调去做 Macrohard 产品了,当时那边只有另一个人,一开始就我们俩。我从项目启动一直做到现在。

 

疯狂推进度,马斯克直接送 Cybertruck

 

主持人:关于 Colossus 的建设,我不知道你了解多少。早期 xAI 团队为了把 Colossus 跑起来,在供电、算力、各种基础条件上都做了很多“疯狂”的事。到现在,其实还是到处是瓶颈,总觉得还需要更多芯片、更多 GPU、更快的速度。你当时的感受是什么?

 

Sulaiman:这一路上有太多“战争故事”,也下过不少赌注。

 

主持人:挑几个讲讲吧。

 

Sulaiman:好。我记得 Tyler 当时和马斯克打了个赌。我们在上新机柜的时候,具体是哪一代 GPU 我都忘了。马斯克说,“如果你能在 24 小时内用这些 CPU 跑起来一次训练,我今晚就送你一辆 Cybertruck。”结果那天晚上我们真的把训练跑起来了。

 

主持人:他拿到了吗?

 

Sulaiman:拿到了。现在从我们午餐的窗户望去就能看到那辆车,马斯克人挺酷的。

 

说到供电,其实我们必须和市政、电力公司还有州一级的电力机构高度协同。因为当他们那边负载飙升时,我们就得立刻切断公共电网,全部切到自备电源上——大概是八十台,甚至可能更多,用卡车拉来的移动发电机。

 

整个切换过程必须无缝完成,不能影响任何正在跑的训练任务。你要知道,那些训练极其不稳定,GPU 和硬件的功耗可以在毫秒级别上下波动,动辄就是几兆瓦。这件事本身就非常夸张。

 

主持人:那是不是也是为什么你们会把巨型电池组直接放在数据中心旁边?这样负载上下波动就能更快响应?

 

Sulaiman:对。没有电池的话,很难这么快地调整负载,发电机毕竟是物理设备,你是在让一个真实旋转的东西加速或减速,它天然就有时间延迟,电池的反应速度要快得多。从物理层面看,整个链路是:本地电容、数据大厅侧的电容、电池、发电机,最后才是公共电网。当然,这套架构我们现在可能也在不断调整,尤其是散热这块,反应速度必须非常快。

 

主持人:你还有没有那种“本来不可能,但最后居然成了”的故事?

 

Sulaiman:有。比如我们这块地的租约,从法律意义上讲其实是临时的。这样做是为了最快通过审批、尽快开工。我猜以后会转成永久的,但现在确实是短期租约。对数据中心来说,这是目前能把事情推进得最快的方式。

 

主持人:他们是怎么允许这种操作的?

 

Sulaiman:算是一种地方和州政府层面的特殊豁免。你只是“临时”改造这块土地,类似嘉年华那种用途。

 

主持人:所以 xAI 本质上就是个要来的“嘉年华”?

 

Sulaiman:差不多就是这个意思(笑)。但正因为这样,事情推进得特别快。内部规划加建设,全程不到一个月就搞定了。

 

主持人:规模接下来肯定会继续疯狂扩张。马斯克 也说过,能源会是最大的瓶颈,其次才是芯片。在这种很难预测未来一到两年项目和资源需求的情况下,你们是怎么做规划的?

 

Sulaiman:我们会尽量从“杠杆率最高的目标”倒推。先想清楚:在某个时间点之前,我们最值得做的事情是什么。比如,如果我们想在某个日期前做到一千万甚至一亿美元收入,那从经济和系统设计角度,最有效的事情是什么?然后再倒推:需要什么软件、什么物理基础设施,最后一步步拆解。所以我们几乎不会从“硬件需求”开始,那通常是最后才考虑的。

 

主持人:那是不是也有一套类似 SpaceX 的“让事情发生”的算法?

 

Sulaiman:你是说那种“先删掉,再加回来”的逻辑?那确实一直都在用。我们经常先把某个东西砍掉,等确认必须要的时候再加回来。

 

主持人:你最近一次这么干是什么时候?

 

Sulaiman:今天(指录制当天)。Macrohard 上部署大量变化极快的物理硬件,让测试变得很难,所以我们尽量减少下游的“特殊情况”。比如,我们要让三十年前的老显示器到最新的 5K Apple 显示器,全都跑在同一套技术栈上,结果发现并不是所有系统在任何时候都能愉快地配合。比如视频编码器,在某些层级上就得反复调。

 

我之前不知道,后来才发现,有些编码器对“最大像素数”是有硬上限的。所以我们一开始删掉了多编码器的特殊分支,后来在 5K 分辨率上撞墙了,又不得不把这个特殊逻辑加回来。

 

“优秀的人太多了,反而变得很难判断”

 

主持人:在你看来,xAI 本身有哪些特别值得讲的地方?

 

Sulaiman:首先是人,这里的角色非常多样;其次是我们的招聘方式也挺“怪”的。有些我原本觉得很蠢的做法,结果发现居然行得通,那我们就直接试。比如搞 hackathon,如果能从五百个人里挑出五个顶级选手,这件事就非常划算。他们未来给公司带来的预期价值,远远高于这次活动的成本。

 

我们前几天还算了一笔账,现在主仓库里,每一次 commit 的“价值”大概是 250 万美元。我今天提交了五次。

 

主持人:那你今天直接加了差不多一千两百万美元?

 

Sulaiman:轻轻松松的一天(笑)。确实不错,杠杆效应非常强。你用更少的努力和时间就能做更多事,因为身边的人和内部工具都很棒。还有我的老板。

 

主持人:那什么样的人会想来这里工作?我听你描述,感觉第一天来的人就已经准备好周末、熬夜、全天候投入了。

 

Sulaiman:大家刚来的时候都非常兴奋,非常有热情。

 

主持人:使命感驱动?

 

Sulaiman:是的,但野心的类型不一样。有些人想往管理层走,看有多少人向自己汇报;也有人想“拥有”一大块技术栈。比如现在,我们在重构核心生产 API,基本上是一个人+20 个 Agent 在做,而且做得非常好。你完全可以独立拥有代码库中的很大部分。

 

主持人:有点像 X 被收购之后那样,人很少,但每个人负责的范围巨大。

 

Sulaiman:没错。

 

主持人:除了 hackathon,你们在招聘上还有什么不太常规的做法?

 

Sulaiman:我们在 Macrohard 上推得非常猛。有两、三周的时间,我每周面试 20 多个人。有的只聊十五分钟,有的就是一整小时的技术面。优秀的人太多了,反而变得很难判断。

 

主持人:那你怎么判断?

 

Sulaiman:我有一道自己解决过的、非常具体的问题,是几年前在创业时遇到的一个计算机视觉问题。我会给候选人半小时去实现解决方案。

 

这个问题本身其实很简单,但“简单得很有欺骗性”,大多数人都会想复杂。我特别看重一点:你能否不过度思考,给出一个朴素但有效的方案。因为我们的系统要跑在跨三、四十年的各种硬件、操作系统上,如果不保持简单,下周代码量就能膨胀到一千万行。

 

主持人:你还会看重哪些杠杆能力?

 

Sulaiman:我喜欢会质疑需求、也会质疑我的人。这个方法我从 Chester Ford 那里学来的。

他在招聘时,常常会故意在题目里塞一个错误的需求、不可能的条件,期待候选人指出来。如果对方没发现,他就不招。我现在也这么干,效果非常好。

 

主持人:你们的节奏真的快到离谱。你自己也在做很多不同的事情,面对新任务时,怎么最快上手?

 

Sulaiman:要看具体是什么。如果是代码多,那就老老实实读代码,反复跳转定义,很快就能摸清楚。很多时候,实现代码比想象的要少。只有在高度活跃开发的模块里,才会同时存在二十个版本,你根本不知道哪个是主线,这时候就只能去问人。

 

让我惊喜的是,这里的人都非常开放、友好。我原本以为大家会很聪明、也很傲慢,但事实是:大家都很聪明,而且非常乐于帮忙。

 

我们不怎么写文档,因为写文档的速度跟不上开发速度(笑)。现在我们也在尝试用 AI 自动生成文档。好处是,我们有几乎无限的算力和很聪明的 AI,可以大胆试各种“蠢办法”。在别的创业公司,这可能要烧掉几十万、上百万美元,但我们几乎是零成本。结果就是:实验更多、失败更多,但成功也更多。

 

马斯克极限压缩时间,“办法总会有的”

 

主持人:在实验这件事上,你们是怎么最大化“尝试次数”的?

 

Sulaiman:通常都会有时间限制。我们经常在模型侧同时跑两、三个实验。有时候不是因为时间紧,而是因为两周后某个前置条件才会就绪:可能是硬件,也可能是数据。但今天你必须上线一个东西,那就先跑几种方案,看哪个今天就能交付、能产生收入或客户效果,两周后条件成熟了再切换。这种做法在 Macrohard 里是常态。

 

主持人:你有没有遇到过这种情况:按理说一个项目的周期应该拉得很长,但你们却压缩后提前了好几周甚至几个月完成?这种事经常发生吗?

 

Sulaiman:每次都是这样,无论是跟马斯克的会议,还是内部讨论,只要有人强力推动一件事,或者有外部的人——哪怕他并不对这件事负责——提出了新的需求、要求你把某件事做出来。我们一开始都会觉得,这个时间要求太离谱了。通常会花两分钟想一想、抱怨几句,然后剩下的时间就全部用来想:怎么在这个时间内把事情做完。

 

说到底,对完成时间的预估,永远建立在一堆假设之上。一旦时间被压到原来的二分之一、甚至十分之一,你就会回头看这些假设并问自己:这些假设对时间的影响到底有多大?然后你要么把它们砍掉,要么调整掉。这样一来,时间线立刻就能快一倍。你多做几次这样的优化,基本上任何要求都能满足。当然,最终还是会撞上物理极限,但一开始的时候,你离那个极限其实远得很。

 

主持人:我知道像完全自动驾驶、SpaceX 的火箭也是类似的情况。马斯克给的时间线通常都比实际要长得多,所谓的 “马斯克时间” 可能只有真实周期的四分之一或者一半。但正因为一开始把时间线定得这么激进,事情反而真的快了好几倍。xAI 这边是不是也差不多?虽然现在更多是软件,但哪怕在数据中心这类硬件侧,感觉进展也快得离谱,而且基本都落在他最初说的那个时间范围内。

 

Sulaiman:我觉得他自己也在不断校准他的时间判断。毕竟现在马斯克已经在大规模部署各种各样的硬件了,所以他的估算明显比以前准很多。而且他更新时间线的频率也更高了,有时候甚至每天都在变。他会跟我们不断沟通,根据不同的参数来调整进度。

 

有些变化甚至是他那边直接带来的,尤其是在基础设施层面。比如某个交易提前敲定了,或者某批设备可以提前排进生产,那就可能直接省下一个月、两个月,甚至更多,具体要看部署的情况。软件这边其实也是一样。

 

他一直说的一句话是:你完全可以试着用一个月去做一件原本要一年才能做完的事,最后你可能两个月就搞定了,但那也已经快得多了。

 

主持人:我记得在 SpaceX 的早期,有一种内部共识:马斯克说每拖延一天,就相当于损失一千万美元的收入。我不知道在 xAI 是什么感觉,你心里会不会也有一种直觉:如果今天没有再 push 一点、没有把事情往前拱一步,就等于损失了多少本可以创造的价值?

 

Sulaiman:有的。至少在 Macrohard 这个项目上,我们确实有一些非常明确的收入目标。具体数字我不能说,但在我脑子里,只要一件事被延迟或者被加速,我几乎立刻就能算出来:我们刚刚是多赚了多少钱,或者少赚了多少钱。

 

主持人:这也太夸张了。

 

Sulaiman:是的,数字会非常大。一方面是因为预期回报本身就极高,另一方面是时间线实在太短了。所以哪怕只是几天的变化,按比例来看,对收入的影响都已经非常可观了。

 

主持人:马斯克一直以“快速下重注”闻名。有没有那种在一次会议里,就做出了投入巨大资本、时间或者承诺的决定?

 

Sulaiman:有一个非常典型的决定,就是在 Macrohard 上,我们选择了一条路线:模型的速度至少要比人类快 1.5 倍,而现在看起来,实际速度远远不止如此。

 

在其他实验室,类似“人类模拟器”的尝试,更多是走“更强推理能力、更大的模型”这条路。但我们当时的这个决定,几乎是完全走在了和所有人相反的方向上。之后我们做的几乎所有事情,基本都是这个决定的下游结果。虽然不能说百分之百,但它影响了绝大多数事情,而且这个决定是在非常早期就定下来的。

 

这在某种程度上也是一种共识,尤其是类比完全自动驾驶就很容易理解。没有人会等电脑花十分钟去做一件自己五分钟就能做完的事。但如果电脑十秒就能搞定,那我愿意为此付出任何价格。这其实是个非常直观的判断。

 

正常情况下,我们这些工程师可能会站出来反对,有二十个理由说明事情不能这么做。但当一个决定已经被拍板了,你只能从结果倒推路径,办法总会有的。

 

没有 AI 研究员, 就是工程师

 

主持人:我记得马斯克之前说过一次,好像是在 YC 的活动上,他和 Gary Tan 做问答。Gary 提到 AI 研究员这件事,结果马斯克说不存在什么 AI 研究员了,现在全都是 AI 工程师。

 

Sulaiman:对,我们跟他开过一次关于招聘的会,也有人提到过类似的话题,比如岗位描述之类的。然后他大概讲了十分钟,核心就一句话:工程师,就是工程师,别的都不重要。只要是好工程师,本质上是个会解决问题的人就行。不管你以前是做哪一块的,用过什么架构、做过哪种基础设施,这些都不重要。

 

主持人:为什么“工程师”这么重要?

 

Sulaiman:因为这样边界就被拉得很宽。意味着我们可以从很多不同背景的人里招人,现实中也确实是这样。AI 领域可能还不算特别明显,但 SpaceX 有很多这样的故事:有人来自你完全想不到的背景,按传统眼光根本不可能进来,但最后却在工程上做成了非常大的事情。所以定义宽一点,就等于给这些人留了一条路,也能帮助我们整体跑得更快。

 

“没人指挥你干这个、干那个”

 

主持人:那对你个人来说,在那工作最有意思的地方是什么?

 

Sulaiman:没人管我。真的,没人指挥你干这个、干那个。如果我有个好想法,通常当天就能自己动手把它做出来,然后拿去展示。看看合不合理,跑个评估,或者直接给客户看,给马斯克看,给相关的人看,一般当天就能知道这个方向对不对。

 

没有冗长的讨论,也不用等各种流程和官僚审批,我特别喜欢这一点。说实话,我从非常小的创业公司来更大的公司,本以为会牺牲一些自由度。我加入时公司 100 人,是我之前公司的 10 倍。但对马斯克的公司来说算小的,确实感觉很小的公司,没有什么繁文缛节。

 

主持人:你进去之前,有没有什么特别大的预期,结果后来发现完全不是那么回事的?

 

Sulaiman:我原来以为会更“自上而下”一些,结果发现有一些,但不多。管理层级非常少,基本就三层:最底下是 IC,中间是联合创始人和一些新晋的经理,再往上就是马斯克,没有了。

 

现在每个经理下面的人都很多,事情反而很少是自上而下推动的。通常是我们自己先想出解决方案,跟经理对一下,马斯克点头,就直接干了。有反馈就再调整。整体比我想象中要“自下而上”得多。

 

主持人:感觉就是在刻意设计一种状态,让所有人都在做东西,管理者更少,真正的“建造者”更多。

 

Sulaiman:对。我刚加入的时候,几乎所有经理都还在写代码。现在有些人下面管着上百号人,写得少了一点,但总体上,大家还是工程师。

 

我记得第一周,有天吃晚饭,一个人坐我旁边。我就随口问他在哪个团队。他说他是做销售的,主要负责企业客户。我当时还想,“哦,原来是销售。”结果,他接着跟我讲他最近在训练的模型。

 

没错,销售也是工程师。销售团队全是工程师,几乎每个人都是工程师。那会儿公司里,可能真正不算工程师的人不到八个。即便如此,大家也都是在为同一台“机器”做贡献。

 

主持人:所以是不是更像这样:一个工程师负责一个项目,可以直接面对客户,理解他们的问题,然后快速实现解决方案?

 

Sulaiman:是的,而且层级越少,信息损失就越小。本质上是信息压缩的问题。语言本身就是有损的。如果信息要从客户脑子里变成语言,再进销售脑子,再变成语言、再到经理、再到工程师,每过一层,就像传话游戏一样丢一大截。如果你能尽量减少层级,那就只剩下一次压缩:客户直接告诉你他们要什么、体验是什么,然后工程师直接去解决。

 

主持人:有没有什么你以前在别的公司从没见过,但 xAI 在做的事情,能让事情推进得特别快?

 

Sulaiman:最让我意外的是团队之间、职责之间的“模糊性”。这在其他大公司,甚至规模差不多的公司里,都很少见。

 

比如我要修虚拟机基础设施的一个问题,我就直接修,修完给负责那块的人看一眼,对方说 OK,马上合并、上线。几乎没有那种严格的边界,大家基本都可以改任何东西。当然,危险的操作还是有检查的,但总体上,公司是信任你的,默认你会把事情做对。这种感觉真的很不一样。

 

主持人:我记得之前马斯克在搞 DOGE 的时候,删掉了一些防控措施然后又很快加回来了。在这种高速试错的过程中,有没有什么东西被删掉、又重新做回来的?

 

Sulaiman:几乎没有那种不可逆的破坏。我想不起来有什么东西是真的被永久性毁掉的。但像你说的,删掉、移除某个东西,然后有人说“我需要这个”,这种情况非常常见。可能一个小时后就回滚了。

 

也有那种情况,一个项目做了好几个月,依赖某块基础设施,结果等你真要上线的时候,那块基础设施已经被重构过三次了。那就再适配一次,继续往前走。

 

主持人:你觉得工程团队人这么少是件好事吗?

 

Sulaiman:绝对是。人越多,反而越慢。一个人能做完的事,两个人来做,往往要花两倍时间,这在任何规模下都成立。尤其是现在,你已经不需要像以前那样写那么多代码了,更多是在做决策、做架构设计。每个人都可以是架构师,不需要那么多“手”,一个大脑能做的事情多得多。

 

主持人:你之前自己也尝试过创业,做过很多不同的项目。是什么让你决定来这里?使命感也好,文化也好,哪一点真正打动了你?

 

Sulaiman:说实话,我一直是马斯克的粉丝。小时候第一次看到猎鹰火箭回收着陆,那种震撼真的忘不了。我后来还专门跑去看了 星舰的第五次发射,那次是第一次成功“接住”,真的值回票价,是我这辈子见过最酷的事情。所以只要能参与任何跟这些事情沾点边的东西,对我来说就已经非常有吸引力了。

 

主持人:那你当初为什么选择这家公司,而不是 SpaceX 或特斯拉?

 

Sulaiman:主要还是因为我骨子里就是个创业者吧。xAI 是这几家公司里规模最小、也最新的一家。我当时的一个判断,就是在这种体量的公司里,个人能产生的杠杆和改变会最大,事实也基本验证了这一点。因为从比例上看,你在公司里的“占比”更大。不是说其他公司不酷、或者个人不重要,而是这种比例带来的影响力不一样。

 

主持人:也就是说,对决策产生影响的可能性要大得多。

 

Sulaiman:甚至不只是决策,而是从想法到落地、到看到结果,速度都非常快。我之前以为很多事情自己单干会更快,比如自己做某个功能、跑某个实验。但现实是,在 xAI 反而更快,因为已经有现成的基础设施和团队,很多我本来要手动完成的步骤,他们早就做过了,而且基本没人会对你说“不”。

 

内部 AI 虚拟员工

 

主持人:你之前提到,公司里不同人、不同事情之间的边界其实挺模糊的。那你能不能随时去找其他同事帮忙?

 

Sulaiman:经常啊。基本就是走到别人桌前,直接说:“我有个问题。你现在在做什么?我能不能帮你一点?你能不能帮我这个?”大家都在同一栋楼里,这种事非常自然。

 

挺有意思的是,我们后来在公司内部测试“虚拟员工”(human emulator),有时候甚至没提前告诉大家,所以就会出现这种情况:有个真人员工在干活,突然有人找他说“你能不能帮我做这个”,虚拟员工就回:“行啊,来我工位吧。”结果那人真的走过去,发现什么都没有。

 

好几次我收到消息说:“组织架构里这个人向你汇报,他今天是不是没来?”但其实他是个 AI,是虚拟员工。

 

不过整体来说,大家默认都是在同一栋楼、随时能联系到的。所以互相求助这件事非常频繁。我可以找别人帮忙,别人也经常来找我。

 

主持人:那在这些过程中,最容易“翻车”或者最让你意外的点是什么?

 

Sulaiman:主要发生在“人类行为模拟”这块,尤其是和客户一起做的时候。我们会尽量全面地理解客户的工作内容:先聊天、访谈,让他们讲,或者写下来他们是怎么做这份工作的。再过一周,我们回头看虚拟员工犯的错误,发现它总是在某些特定场景出问题。

 

这时候我们就去观察真人是怎么做的,结果发现真实流程里其实有二、三十个步骤,对方之前完全没提。我们一问,他们就说:“哦对,这一步我们是这么做的,刚才忘了说,不好意思。”这种情况太常见了。

 

很多事情在人脑里是默认存在的,全靠“自动驾驶模式”在跑。就像你开车开了一小时,完全不记得自己刚才是怎么开的。人类对任何重复性的工作都是这样,而我们想解决的正是这些问题:把人类现在反复做、其实根本不需要人来做的“蠢活”,全部替掉。

 

主持人:那你是怎么决定“先解决哪一类问题”的?除了开车以外,人类还有哪些事情是天天在做、但其实没必要继续做的?

 

Sulaiman:只要是电脑上的重复性工作,基本都在这个范围内。比如客服就是一个特别典型的场景:不断接收各种格式、各种内容的用户输入,然后把它们转化成一个标准化的处理流程。这样人类就可以去做更有创造性、更需要大脑的事情。

和编程领域发生的变化几乎是完全平行的:以前你要把同样的实现写二十遍,现在你用三句话描述一下,它就帮你搞定了,这是一次巨大的“压缩”。我们做的,其实就是把这种“压缩”,应用到所有数字化工作流上。

 

主持人:在公司内部推这些“虚拟员工”的时候,除了“人不存在但被叫去工位”这种情况,还有什么让你觉得意外的吗?

 

Sulaiman:意外的一点是,它的泛化能力比我们预期的强很多。有很多测试案例,模型根本没针对这个任务训练过,但表现却非常完美,远远超出我们的预期。因此,可以很确定地说,泛化效果真的比想象中好,而且我们现在还处在非常早期的阶段,之后只会越来越强。

 

这点其实和完全自动驾驶很像:有些场景并不在训练数据里,但车就是能正确应对。这本质上是一个“权重效率”的问题。

 

马斯克给反馈,要么宏观、要么细节

 

主持人:你参加过几次和马斯克的会议?那种会议一般是什么样的?

 

Sulaiman:说实话都挺简单的,而且我运气不错,大多数都进行得很顺利。

 

主持人:在 SpaceX 这种地方,成本和零部件细节特别重要。但在你们这里,他给反馈时会不会不太一样?比如不会去抠每个流程的细节?

 

Sulaiman:他的反馈通常要么非常宏观,要么非常微观,很少停在中间。

 

宏观层面上,可能是产品方向、客户判断,比如“只专注这个细分市场”“这件事完全不要做”。微观层面,尤其是算力效率、延迟这些问题,他往往会给出非常具体的建议,比如“试试这个方案”。而且他是愿意被证明错的,但前提是要有证据,必须做实验、看结果,而不是靠观点对喷。有些实验的结果甚至会出乎所有人的意料,然后我们就顺着那个方向继续走。

 

主持人:所以你们后来选择小模型,而不是一味堆大模型。

 

Sulaiman:对,小模型在算力效率上的选择,带来了很多改进。有些是直接的,有些是间接的。最直观的当然是响应更快。但更重要的是,特斯拉在自动驾驶上也发现了同样的事:模型小了,迭代速度就快得多。

 

不仅模型对环境反应更快,部署新版本的速度也快了。以前可能四周一次,现在一周一次。这又反过来影响了实验方式:为什么我们能同时跑二十个实验,其实就是源于这个早期决策。

 

主持人:那一开始的设想,是不是想直接上大模型?

 

Sulaiman:算是吧。我们确实想比所有人都快,但后来发现,“快”这件事的效果,被放大了很多倍。

 

“war room”真实存在

 

主持人:维基百科一直被诟病有偏见,马斯克也很关注构建一个“更接近真实”的替代体系。那你们怎么看待清理互联网来找到真相这件事?

 

Sulaiman:这是个极其困难的问题,因为互联网本身往往并不是所谓的“事实真相”。我们能做的,是尽可能往“底层原理”去钻,但这本身也很难。比如你问“宪法在物理意义上的底层原理是什么”,这其实很难有人真正给出一个严谨的答案。

 

但思路是类似的:尽量往下挖,再从那里往上构建。问题是真正这样写、这样做的资料并不多。比较接近的一个例子,是 James Burke 的《Connections》系列,他会把看似完全不相关的概念,通过物理和发明串联起来,非常有意思。我们想做的,其实是类似的事情,只不过这条路还很新。

 

主持人:你们是怎么找到更好的数据的?

 

Sulaiman:数据并不是决定结果的唯一因素。

 

主持人:我有时候会在 X 上看到有人贴出 Grok 的输出,说“这明显不对”,然后马斯克直接回复说“我们会修”,接着可能过了十二个小时、一天,他又说“好了,已经修好了”。这种事情发生时,内部一般是怎么运作的?

 

Sulaiman:通常是他把哪里出问题了直接指给我们看,然后当时还醒着的人就会马上拉一个线程开始解决问题,一般先是个人处理,如果需要就再拉几个人。之后我们会做一次复盘,把到底哪里出了问题、以后怎么避免都讲清楚。原则上,犯一次错是可以接受的,但同样的错误犯第二次就很严重了。

 

主持人:在 SpaceX 的历史里,包括特斯拉,其实有过很多这种“冲刺时刻”。比如马斯克半夜突然出现,发一封全公司邮件,说大家都来公司干活。你们也有这种情况吗?

 

Sulaiman:这种更多发生在做大模型的时候。就 Macrohard 这个项目来说,我们已经在“作战室”里连续干了四个月了,基本一直就是这种状态。

 

主持人:你们门口是不是还真挂着一块牌子写着“war room”?

 

Sulaiman:是的,真的。最早那个作战室后来扩张了,我们就把东西全搬走了。有一次马斯克走进作战室,发现里面空无一人,就问“人呢?怎么回事?”然后他又走到我们现在待的地方,其实就是健身房,我们把健身器材全清掉,把人都塞进来了——然后他就在那儿开始一连串追问到底发生了什么。

 

主持人:在那种很多事情被打乱又被迅速推进的夜晚,或者经历那种大规模冲刺时,是什么感觉?

 

Sulaiman:我最近正好看到 xAI 的一位联合创始人 Igor 发的一条内容。他人特别好,我也很喜欢跟他一起工作。他以前在 StarCraft AI 工作,大概十年前吧,是我高中时尝试复现过的最酷的机器学习项目之一,难得要命,所以后来能和他一起共事真的挺神奇的。

 

他说的一句话我特别有共鸣:有些时间里,感觉只过去了几天;但有些夜晚里,仿佛发生了几个月的事情。那天晚上就是这样。说“几个月”可能有点夸张,技术结果我们本来也可能几周内做到,但一晚上把它搞出来,冲击感非常大,而且真的熬了一个通宵。

 

主持人:有没有那种情况,大家连续五天、甚至一整周都没怎么离开过办公室?

 

Sulaiman:有的。模型冲刺的时候,经常会有很多人直接在公司过夜。

 

主持人:之前提到你们有五、六个睡眠舱,大家轮着用?

 

Sulaiman:对,有睡眠舱,现在还有一些上下铺,条件差点,但至少能睡。后来帐篷那张照片传出来后,很多人都发给我。我只能说确实有帐篷,但我从没见过一次搭那么多。反正……确实挺极端的。

 

成长经历:从小不服权威

 

主持人:我知道你小时候做过很多不同的项目,好像还做过指尖陀螺。可能是在你房间里搞的?这种折腾、动手的心态,对你现在的工作影响大吗?

 

Sulaiman:影响挺大的。我很小就开始学编程,大概十一岁的时候,我爸给我买了一本书。我一开始觉得还行,但真正开始喜欢是在我意识到它能赚钱之后。我在网上认识了一些人,他们给游戏写脚本、外挂,然后卖一点钱。对我来说,能在网上赚到几百美元已经是天大的事了。

 

主持人:第一次有人给你钱,那种感觉真的很奇怪。

 

Sulaiman:太疯狂了。我还记得当时得让我爸帮我弄一个 PayPal 的托管账户之类的,然后钱真的打进来了。对我来说,那简直是世界上最酷的事情。我干了几个月,攒了点钱,当时我对 3D 打印特别着迷,RepRap 那套体系正火。

 

那其实就是一群大学生搞的项目,目标是造一台能打印出自己大部分零件的机器,所以才叫 RepRap。他们在不同大学里搞了一些实验室,从一台打印机开始,让它打印下一台的零件,一步步扩展。当然,这里面问题很多,他们也一直在解决,但那确实推动了后来的 3D 打印浪潮。我当时特别痴迷,就照着他们的零件清单,在阿里巴巴上把东西全买齐了。

 

主持人:然后呢?

 

Sulaiman:一个月后东西到齐了,我一晚上把它装起来,但过程其实挺惨的。我在拆电源的铜线,那是个非常不靠谱的电源,结果真的着火了。铜线全散开,有一根直接扎进我拇指里,大概有五厘米深。

 

主持人:去医院了吗?

 

Sulaiman:没有。那是个上学的夜晚,已经凌晨了。我十三岁,动手能力也不行,在卫生间用镊子折腾了一个小时也没拔出来,最后我干脆把露在外面的剪掉了。接下来几周,它一点点往外长,我每天早上再剪一点。现在想想还挺离谱的。

 

不过打印机最后还是装好了。那时候正好赶上指尖陀螺爆火。我从中国买了一千个滑板轴承,在自己卧室里搞了个小工厂。晚上每隔两个小时起来一次清理打印平台,重新打印一批陀螺。白天上学前,我在车库里装轴承、喷漆、晾干,然后跑去其他学校的公交站,把货卖给“分销商”,其实就是别的学校的学生。他们白天卖,我放学后收钱,线上也卖、发货。

 

生意做了两个月,最后被叫停了。官方理由是,学校餐饮公司有独家销售权,不能在校园里卖东西。但我觉得,他们主要是不爽我一边分散大家注意力,一边还赚钱。这事让我学到了一种“健康的不服从权威”。

 

主持人:这种对权威保持距离,好像一直贯穿你的经历。你提到你不太信任机构,这种态度是怎么形成的?在你的人生里具体体现在哪?

 

Sulaiman:我从很小就知道,我想要的是一种不寻常的结果,而走一条常规路径,基本不可能得到。于是我本能地抗拒一切“惯例”,而机构的本质就是维护惯例。我觉得,几乎所有真正有创造力、有意思的成果,都是来自自由的人。至少在我看到的世界里是这样。所以,忠于这一点,对我来说才是正确的选择。

 

主持人:我很喜欢 John Carlson 的一个观点:所有东西都这么难造、难实现。看看周围,世界就是充满人们的激情项目。

 

Sulaiman:对,完全就是个奇迹。每一样东西背后都有故事,比你想象的要多得多。我记得以前读过 YKK 拉链的故事。你会发现,全世界真正做得好的拉链厂商就两、三家。拉链看起来很便宜,但机械结构其实挺复杂的。之所以能这么便宜、这么可靠,是因为有极少数公司、甚至可以说是极少数人,花了几十年把这件事做到极致。

 

这几乎适用于所有东西。任何特别具体、又能大规模生产的东西,背后通常只有几家公司、甚至几个人在做。就像有时候你会听说,德国某个不起眼的小公司一停产,大众汽车整条产线都得停。疫情期间这种事就更明显了。

 

主持人:在我们见面之前,你还做了一个液体燃料火箭发动机,我记得很小一个,你说是临时起意,二十四小时内点火的?

 

Sulaiman:整个项目其实前后做了大概四周。一开始我就是买了一堆教材,研究火箭发动机的设计原理。和软件完全不一样,软件你可以上 GitHub 看别人的代码,但火箭没有现成文件。你得搞清楚材料特性、化学性质、怎么加工、参数怎么定,推力怎么估算,怎么避免超压。还有喷注器的设计,这个特别难,大概占了一半时间。

 

主持人:这是最难的部分吗?

 

Sulaiman:是的,喷注器最难,也是最后问题最大的地方。我花了三、四周时间,找中国工厂加急做了很多零件。那时候正好感恩节,我准备飞回东海岸看家人。我当时想,要么今晚把它装好、点火,要么就拖两周,然后我决定不能拖,就现在干。我早上灌了很多咖啡,一整天都在干活,搭测试架、装发动机,当晚就点火了。当然,为了能当晚完成,做了不少妥协。

 

主持人:我真的觉得特别好笑,你当时离它其实就几步远?

 

Sulaiman:对。我其实设计了远程点火,但问题是,用来给板载计算机供电的电源还没到,只能用笔记本通过 USB 供电。而我最长的 USB 线只有一米多,所以我只能站在旁边点火。我心里估计,大概有三成概率它会炸,或者喷得到处都是火。

 

视频里其实能看到,我的外套着火了。因为喷注器设计不好,产生了很多超压,没完全燃烧的乙醇直接喷出来,溅到我身上就点着了。那件烧焦的外套现在还留着,当纪念品了。

 

参考链接:

https://www.youtube.com/watch?v=8jN60eJr4Ps&t=41s

整理 | 华卫

 

“世界上不会再出现第二个我这样的 CEO 了。”近日,英伟达联合创始人兼首席执行官黄仁勋(Jensen Huang)在一场私人访谈中这样说道。

 

据称,这场深度对话已经酝酿了三十年,将黄仁勋鲜为人知的一面展现在大众眼前。主持人 Jodi Shelton 与黄仁勋的职业交集始于三十余年前,彼时,图形处理器(GPU)尚未掀起席卷全球的 AI 革命。从加速计算的源头到生成式 AI 的前景,这场对话堪比一堂远见大师课。

 

在访谈中,黄仁勋表示,从某种意义上说,英伟达其实有 61 位 “CEO”。过去这些年,包括他在内,很多人都犯过严重的错误,但在英伟达,从来没有人因为犯错而被解雇。“我们打造了一个足够安全的环境。”他还透露,CEO 这个职位,远比人们想象的要脆弱得多。“实际上,我们可能是公司里最脆弱的一群人。不过对我来说,承认这种脆弱,并不是什么难事。”

 

有意思的是,他提到,在很多方面,自己都算是一个 “不情愿的 CEO”。“公开演讲简直让我怕得要死。比起待在公司外面抛头露面,我更喜欢扎根在公司内部;比起发表演讲,我更喜欢安静做事;我甚至一点都不喜欢做主题演讲,但为了公司,我必须去做这些事。”

 

此外,黄仁勋称,英伟达的成功,绝不是靠产量取胜。“虽然是英伟达发明了 GPU,但从产量来看,我们其实是全球最小的 GPU 制造商。很多不知名的厂商,GPU 产量都比我们高。”而“没有终极目标” 这一点,对英伟达的发展真的起到了至关重要的作用。

 

对于五年后的世界,黄仁勋断言,英伟达和整个行业在 AI 领域的投入,必将彻底改变计算机的运作模式,未来的计算机,将从 “由人类编程” 进化为 “在人类引导下自主学习编程”。并且,100% 的工作岗位都会发生变化,但不会有 50% 的岗位消失。未来的趋势不会是就业岗位减少,反而是大家会变得比现在更忙碌。并且,那些现在没有工作的人,很可能会因为 AI 获得谋生的手段。

 

网友们纷纷就此次访谈对黄仁勋评价道,“我从未见过他如此坦诚直率,真是不可思议。”

 

以下是详细对话内容,我们在不改变原意的基础上进行了翻译和删减,以飨读者。

“走了整整 33 年才看到成果”

Jodi Shelton:大众其实特别好奇像你这样的人,毕竟你们正在定义科技的未来,而科技的未来就是整个世界的未来。所以我们想做的,是挖掘你成功光环背后的个人经历以及支撑你走到今天的价值观。你对这个定位怎么看?

 

黄仁勋:说实话,不太喜欢。

 

Jodi Shelton:真的不喜欢吗?可你现在是名人啊,大家都想了解名人的故事。

 

黄仁勋:我从不觉得自己是名人,也根本不是什么名人。我只是恰好执掌着一家举足轻重的企业,是这家堪称史上最成功的科技公司之一的 CEO。很早以前,我们就做了一些正确的决策。回溯到 1993 年,我们就立志要重塑计算行业,而且对于计算机的架构,我们有着自己独到的见解。在很长一段时间里,这个观点都不被看好,甚至颇具争议。要知道,当时整个行业的焦点都在微处理器和 CPU 上。说起来,我和你就是在那个时期认识的。我们早在 1993 年底或者 1994 年就相识了,对吧?从那时起,英伟达就在做我们现在依然在做的事:重塑计算。

 

Jodi Shelton:没错,我记得很清楚。那时候的硅谷,正处在 CPU 为王、摩尔定律大行其道、个人电脑革命如火如荼的年代。

 

黄仁勋:是啊。而且我们早期的客户,全都是 PC 芯片组领域的初创公司。这些企业可以说是半导体行业辉煌版图的奠基者,像 Cirrus Logic、S3 Graphics、Western Digital、Trident Microsystems,你还记得这些名字吗?

 

Jodi Shelton:当然记得。

 

黄仁勋:这些公司,称得上是英伟达的 “前辈”。而现在,我们依然在这条路上前行,致力于打造一种全新的计算模式。这条路,我们走了整整 33 年才看到成果。我只是恰好成为了这家公司的 CEO,仅此而已。

 

Jodi Shelton:可能对你来说,这一切是水到渠成,但对整个世界而言,英伟达的崛起堪称横空出世。大概从 2023 年 11 月起,整个世界的科技格局都因你们而改变。你是怎么看待这次转型的?

 

黄仁勋:要知道,想要创造未来,就必须在未来到来之前,先置身于未来之中。坦诚地说,从我们发明 CUDA 技术、推出相关产品的那一刻起,就已经踏上了通往未来的道路。英伟达最让我骄傲的一点是:我们不仅擅长技术发明,更擅长把技术转化为产品推向市场。世界上有太多的公司、科研人员和发明家,他们确实创造出了先进的技术,但最后往往只能感慨 “这个技术我早就做出来了”、“这个想法我早就有了”。每次听到这种话,我都觉得很惋惜。这些优秀的发明家,遗憾的是没能遇上同样优秀的产品创新者。

 

所谓产品创新者,就是能把一项技术发明转化为一款能推向市场的成熟产品的人。而这还不够,你还得为产品制定精准的市场策略,甚至需要亲手培育出一个全新的市场,让市场能够接纳你研发的产品和制定的策略。英伟达就是这样一家公司,我们具备技术发明、产品创新、策略制定、生态构建乃至市场培育的全链条能力,而且我们已经多次成功做到了这一点。所以对我来说,这种 “身处未来” 的状态,已经持续了很长时间。

 

Jodi Shelton:确实如此。

 

黄仁勋:很久以前,我们有一个战略,现在已经不怎么提了,叫 “CUDA 无处不在”。很多人都听过我当年四处推广 CUDA 的故事,跑遍各大高校、初创企业和成熟企业。有时候,台下听众加起来也就三个人,但我还是会掏出笔记本电脑,为他们演示 CUDA,告诉他们这项技术将如何改变世界。我走访了无数科研机构和实验室,参加了数不清的行业会议,推广 CUDA 的次数,估计比世界上任何人都多。长久以来,我一直沉浸在这样的 “未来图景” 里,讲的故事多了,甚至会产生一种 “未来已经到来” 的错觉。

 

Jodi Shelton:确实有这种感觉。

 

黄仁勋:所以现在看到这一切成为现实,我依然满心欢喜。而且在我看来,这一切其实并不意外,因为支撑英伟达发展的是计算机科学领域最根本的底层逻辑,不是靠一时的直觉,也不是凭主观的喜好。从很多方面来说,如今的成果是一种必然。但我想说的是,当你把一件事物的速度提升一千倍,或者规模扩大一千倍、体积缩小一千倍时,无论这件事物原本是什么,都会发生质的飞跃。而这种质变最终带来的结果,往往是超乎想象的。

 

我们早就预见到深度学习技术有着巨大的扩展潜力,这也是我们举全公司之力押注这一领域的原因。我们知道,AlexNet(深度卷积神经网络)绝不会是深度学习的终点,这种技术架构天生具备极强的可扩展性,再加上全球海量的数据资源,深度学习的爆发是水到渠成的事。不过我当时也清楚,有一项技术会成为我们前进路上的障碍,那就是无监督学习,或者说自监督学习,也就是让计算机摆脱人工标注数据的束缚,实现自主学习。因为人工标注数据的效率,迟早会成为技术发展的瓶颈。而当无监督学习技术取得突破的那一刻,我就知道,我们的时代来了。

 

就在不久前的投资者路演上,还有人跟我说,我当时就明确跟他们提过这场 “质变”。如果你去回看当时的财报电话会议,就会发现每当谈到对世界至关重要的技术话题时,我都会把这一点讲得非常透彻。在每一场投资者路演,在每一个我演讲的场合,我都会强调这个观点。如今,无监督学习技术确实取得了重大突破,深度学习的规模效应也彻底释放出来,我们才算真正驶入了发展的快车道。但即便如此,这项技术如今能解决的问题,依然让我感到惊喜。我们早就预料到技术会发生质变、计算平台会迎来变革,但我们没想到,变革的成果如此丰硕。

 

我们现在能够解读蛋白质的 “语言”、细胞的 “语言”、量子的 “语言”,能够读懂世间万物的各种表征形式。过去我们用来描述信息的方式,如今正在被彻底重塑。从几何图形、纹理材质到如今的 3D 高斯和 3D 点云,信息的呈现形式日新月异。这种感觉就好像人类突然变得无比聪慧,连英语这种语言体系都随之改变了。我们不再沿用过去的词汇、语法和句式,因为我们的智慧已经进化到了一个全新维度,能够用一种全新的方式进行交流。或许未来人类的交流方式会变成简单的 “嘀嘀嗒嗒” 的信号声。这让我想起了电影《降临》里的场景,人类突然开始用抽象的图形进行沟通,仅仅通过图形就能传递海量的信息,实现更深层次、更高效率的交流。

 

最不可思议的是,我们现在解决的很多问题在过去是完全无法想象的,而且解决问题的速度也远超以往。过去我们常说摩尔定律,而现在英伟达的发展速度完全可以用 “英伟达定律” 来形容,比过去快了整整一千倍。未来十年必将是波澜壮阔的十年,光是想想就让人无比兴奋。

 

Jodi Shelton:要做到你所做的这些事,要能够预见未来,并且坚信未来一定会到来,需要何等强大的自信啊。就像你之前说的,我们 1994 年就认识了,这么多年来,你一直都是这个样子。

 

黄仁勋:是啊,我记得很清楚。

 

Jodi Shelton:那时候我才二十几岁。你应该比我大一点吧?

 

黄仁勋:当时我差不多 29 岁,快 30 岁了。

英伟达有 61 位“CEO”,从没有人因犯错而被解雇

Jodi Shelton:我还记得我们第一次见面的场景,当时我是为了给杂志写稿采访你。我问你:“黄仁勋,硅谷人才流动频繁,很多人来了又走,你会担心这个问题吗?” 毕竟当时很多 CEO 都在抱怨这件事。而那时你才 29 岁或 30 岁,你是这么回答我的:“英伟达既不是教堂,也不是监狱。想来的人可以来,想走的人也可以走。” 我当时听完特别震撼,心里想着:“这个人到底是谁啊?” 年纪轻轻,却有着如此的自信和智慧。我还听过一个类似的故事,张忠谋( Morris Chang)第一次见到你的时候,你当场就说:“我会成为你最大的客户,至少也是最大的客户之一。” 他当时的反应是:“哇,这小伙子可真有魄力。” 所以我很好奇,你这么年轻的时候,这份自信是从哪里来的?

 

黄仁勋:哈哈,你要知道,什么都懂其实也挺痛苦的,我开玩笑的。对了,张忠谋要是知道英伟达现在是台积电最大的客户,一定会很开心的。

 

Jodi Shelton:那是肯定的,他肯定会为你感到骄傲。

 

黄仁勋:我也为他感到骄傲。要知道,在个人电脑革命时期,英伟达就曾是台积电最大的客户。如今,我们再次成为了他们最大的客户,对此我感到非常欣慰。言归正传,我觉得一个人必须坚信自己所相信的东西。而且这份信念,不能建立在道听途说之上,不能因为别人说了什么,你就去相信什么。你必须认真思考,梳理出自己相信这件事的逻辑,并且把这些逻辑拆解成可靠的底层原则。之后,你还需要定期检验这些原则,确保你所秉持的信念、所付诸的行动,都是建立在坚实的基础之上的。

 

如果这个基础不够稳固,或者因为某些原因发生了变化,那就说明它可能并非真正的底层原则 ,也许它并没有锚定在物理规律或客观事实之上。一旦出现这种情况,你就要重新评估,然后及时调整方向。我一直都是这样做的。而且,如果你真心相信一件事,就应该付诸行动去实现它。我从 1993 年起就坚信我们正在做的事情,直到今天,这份信念依然没有改变。正因为坚信不疑,所以我才会不断地推演,不断地在脑海里进行逻辑梳理。我会持续复盘过去的决策,也会不断预判未来的趋势。

 

就像昨天我们开了那么多场会议,每场会议上,我都会重新梳理我们一路走来的逻辑。你会发现,过去的那些假设,有些是正确的,但也有些是错误的。正是因为我们足够灵活,能够根据实际情况及时调整方向,才最终走到了今天。所以,时常回头复盘、重新推演过往的决策,是一件很有意义的事,它能帮你更好地锻炼向前推演的能力。正因为我一直坚持这样做,所以我始终活在自己认定的真相里。直到现在,我依然觉得自己只是英伟达的一名员工。我非常在乎这家公司,但公司里有很多人都和我一样,对这家公司倾注了深厚的感情。

 

在一家治理完善的公司里,CEO 的角色定位是很明确的。CEO 需要向董事会汇报工作,而董事会则要对股东负责。如果 CEO 的工作表现没有达到董事会的预期,不管董事会有 12 位、13 位还是 15 位成员,他就会被解雇。所以说,CEO 其实也是公司这个组织里的一名员工。这就是为什么我说,英伟达既不是教堂,不是想来就能来;也不是监狱,不是想走都走不了。这种心态能让你始终保持脚踏实地,保持谦逊,保持锐意进取的状态,因为你必须每天都努力,才能对得起自己的这份工作。

 

有时候会有人问我:“黄仁勋,你热爱自己的工作吗?” 我会告诉他们,我并非每天都热爱这份工作,但我每天都会全力以赴去做好它。我觉得,这种态度源于两个方面:第一,我坚信自己是这份工作的最佳人选;第二,我必须每天都努力,才能配得上 “最佳人选” 这个身份。

 

Jodi Shelton:在大家眼里,你就是英伟达的代名词,英伟达就是你。这么多年下来,你已经和这家公司深度绑定了。

 

黄仁勋:我应该是英伟达内部被拍照最多的人吧。

 

Jodi Shelton:没错。不过,要是将来换了新的 CEO,这个人真的能接好你的班吗?

 

黄仁勋:世界上不会再出现第二个我这样的 CEO 了。原因很简单,我是被这家公司一步步培养起来的。刚创立英伟达的时候,我对怎么当 CEO、怎么做战略规划、怎么打造产品、怎么开创一个全新的行业,一窍不通。我只知道怎么融资,却不懂怎么和股东沟通,不了解股东、政策制定者、各国领导人以及企业管理者的想法,也不知道该如何把握员工的心态、如何打造企业文化,甚至连 “企业文化” 这个词到底意味着什么,我都无法准确界定,让我制定公司战略那更是天方夜谭。这就是我第一天接手工作时的真实状态。而在过去的 33 年里,我在这些领域都一步步做到了得心应手。

 

如果说这个世界上有谁能称得上是 “企业战略宗师” 或者 “行业开创者”,那这个人大概就是我这样一个小个子。我把自己的整个职业生涯都投入到学习这些能力上,而且我本身就是个好学生。除此之外,我对这份工作的投入程度和深厚感情,是很难通过招聘来复制的。在我心里,英伟达就像我的孩子一样,我对它倾注了全部的心血。我的家人也陪着我一起,为这家公司的成长付出努力。这种对公司的特殊情感,是很难被替代的。毕竟 33 年来,我见证了英伟达的每一次成功、每一次失败、每一次挫折,亲历了它做过的所有明智决策,也目睹了它犯下的各种错误。这种对公司的深刻理解和情感联结,不是随便招一个能力出众的人就能替代的。

 

不过从另一方面来说,英伟达的管理团队架构其实早就做好了准备。我现在有将近 60 位直接下属,他们中的每一个人,放到其他公司都能胜任世界级 CEO 的职位。我总是当着他们的面推演各种决策逻辑,我的每一个决定,都是在他们的注视下做出的,我会把背后的思考过程原原本本地讲给他们听。公司的每一次成功、每一次挫折、每一个挑战、每一场困境,我都会和他们一起复盘。所以从某种意义上说,英伟达其实有 61 位 “CEO”。他们每个人都对这家公司饱含深情,很多人已经在这里奋斗了 33 年。我认为,英伟达的成长模式是独一无二的,这也造就了它无可比拟的韧性。

 

Jodi Shelton:显然,你搭建的这套管理架构在行业内已经成了一段传奇,所有人都在谈论你这近 60 位直接下属。要让这样的架构顺畅运转,这些人肯定都得是万里挑一的顶尖人才。

 

黄仁勋:没错。

 

Jodi Shelton:他们不光要头脑聪明,毕竟硅谷从来不缺聪明人,更得是适配英伟达的顶尖人才。

 

黄仁勋:确实如此。

 

Jodi Shelton:那你能不能跟我说说,你是怎么筛选和培养这些人才的?另外,我记得你有个原则,找不到合适的人,就宁可让职位空着。我想到了 Colette Kress 的例子,你当时面试了 22 位首席财务官候选人,最终才选定了她。现在她在华尔街已经是一位传奇人物了。你当初是怎么选中她的?你选拔这类核心人才的标准是什么?

 

黄仁勋:在我看来,宁让职位空着,也不能让不合适的人占着位置,所以我从来不会急于招人。就算 CEO 的位置暂时空缺,或者某个副总裁职位没人接任,公司的运转也不会停滞。只要你坚信这一点,坚信 “空位胜于错配”,你就有足够的时间去寻找那个真正合适的人。这个合适的人选,需要满足很多条件,其中很重要的一点,就是你得发自内心地欣赏他、认可他。

 

我记得 Colette Kress 入职第一周的时候,就问过我:“黄仁勋,你希望我在首席财务官这个岗位上干多久?” 我告诉她:“只要我们还活着,只要死亡不将我们分开,你就一直干下去。” 因为任何其他答案都是没有意义的。这份工作没有所谓的 “截止日期”,唯一的终点,就是当她觉得英伟达不再适合自己的时候。这个原则不仅适用于 Colette,也适用于我那 60 位直接下属。我愿意为了等待合适的人,让职位空很久。而在这个过程中,公司依然会稳步向前。无论这个空缺的职位对应着什么使命、什么工作,大家都会主动顶上。退一步说,就算没人接手,我也会尽全力扛起这份责任,保证公司正常运转。

 

这就是我的用人哲学,永远不要让不合适的人占据岗位,耐心等待那个对的人出现。经常有人问我,什么样的员工才算优秀员工,什么样的管理者才算卓越管理者。说来奇怪,我其实没有标准答案。因为能走到我面前的人,都足够聪明、足够能干。你随便找一个首席财务官,我敢保证他绝对胜任本职工作。其他岗位的候选人也是如此。在我看来,英伟达之所以能创造奇迹,关键不在于单个人的能力有多强,而在于团队成员之间的 “化学反应”。更重要的是,这源于我们的企业品格。这种品格,才是一家伟大公司的核心竞争力。市面上有很多公司都在做芯片,虽然是英伟达发明了 GPU,但从产量来看,我们其实是全球最小的 GPU 制造商。

 

这话听起来可能有点不可思议,但事实就是如此,很多不知名的厂商,GPU 产量都比我们高。很明显,英伟达的成功,绝不是靠产量取胜。我认为,真正的秘诀在于我们独特的企业文化和企业品格、团队在逆境中凝聚在一起的力量。在外人看来,我们似乎总是一帆风顺,但其实研发 Grace Blackwell 芯片的过程,差点拖垮了整个公司。但我们硬是咬牙扛了过来。这个项目的复杂度和规模都是前所未有的,外界对我们的期望也高得离谱。我们最终不仅达标,甚至超出了所有人的预期,而支撑我们做到这一点的,100% 是企业品格。这不是靠智商,也不是靠勤奋就能实现的,毕竟这个世界上,聪明又努力的人太多了。

 

这种企业品格,是没法通过面试来筛选的。但我始终相信一件事:几乎任何人进入英伟达之后,都会被这种品格所感染、所塑造。这就是我们公司最神奇的地方:我们能够承受挫折,能够直面各种艰巨的挑战,并且一次次从困境中突围。很少有公司的团队能做到这一点。通常来说,当公司遭遇重大挑战后,总会有人因为心存不满离开,或者因为被当成 “背锅侠” 而被解雇。在团队合作中,出了问题总要有人承担责任,这是毋庸置疑的,就像一场球赛输了,我们必须清楚是谁失误丢了球。

 

在英伟达,我们打造了一个足够安全的环境。过去这些年,包括我在内,很多人都犯过严重的错误,这些失误大家都看在眼里,但从来没有人因为犯错而被解雇。久而久之,英伟达就形成了自己独有的文化和特质。这种文化的核心,就是包容、宽恕,以及从错误中学习。对我来说,有两件事至关重要:只要团队里的每一个人,都为了共同的目标拼尽了全力,这就足够了。

敢叫板 20 岁新锐的黄仁勋,也有至暗时刻?

Jodi Shelton:刚才聊到 “痛苦与磨砺” 的理念,你可以再深入谈谈吗?我最近听 Andy Karp 在播客里说,“人生的二十几岁,要么用来享乐,要么用来打拼事业”。你认同这个观点吗?当然,不是每个人都能成为帕兰提尔或者英伟达的 CEO,但对年轻人来说,想要在事业上有所成就,到底需要付出什么?你想给年轻人传递怎样的职业与成功之道?

 

黄仁勋:Andy 很睿智,总能说出一些深刻的人生哲理。不过我对这类说法,倒没那么执念。我一直很佩服张忠谋先生,他一直工作到 80 多岁,思维依然敏锐得像一把刀。如果要在维基百科里查 “大器晚成” 这个词,配图说不定就是他。能在人生最具创造力的阶段,持续奋斗 50 年,这难道不是一件幸事吗?我自己也倾向于这种人生轨迹。对我而言,投身于有价值的事业,远比用后 20 年的时间环游世界更有意义,当然,环游世界本身也没什么不好,只是我现在就已经在满世界奔波了。

 

不得不承认,二十几岁的我,确实更聪明、专注力更强、思维速度也更快。但那个年纪的人,往往缺少一样至关重要的东西,阅历沉淀出的智慧、处理复杂问题的分寸感、制定长远战略的眼光,以及长线思维的能力。这些能力,光靠读书是学不来的。现在的年轻人可以刷短视频,通过共情去感受别人的经历,算是一种间接的经验积累,这种模仿式学习确实有价值。但还有一样东西,是无法通过旁观习得的,那就是坚韧的意志,是直面痛苦与挫折时,懂得如何应对的底气;是熬过精神内耗、挺过煎熬时刻、战胜内心恐惧的勇气。

 

经营公司的过程中,恐惧是真实存在的。我们的决策,关乎数万人的生计。当公司发展不顺时,一个感受不到恐惧、焦虑和脆弱的领导者,反而是不合格的。如果对结果毫不在意,那未免也太冷漠了。而这些真切的感受和应对的能力,只有亲身经历过,才能真正掌握。所以我觉得,两种人生选择没有绝对的对错。年轻时打拼,确实精力充沛,可以熬夜加班,可以付出十倍的努力,更容易早早取得成功。但我现在身上拥有的东西,是三十岁时的我完全不具备的。

 

如今的我,思维速度虽然慢了,但依靠智慧和经验积累的思维模型,能更快地找到正确答案。就算和二十岁的年轻人同台竞争,我也有信心不输给他。他们未必能胜过现在的我。

 

Jodi Shelton:那我们来聊点更私人的话题吧。能不能说说你的童年?哪些高光或至暗的经历,对你如今的性格特质产生了直接影响?

 

黄仁勋:我从来不觉得自己是天赋异禀的人,智商也算不上出众。小时候入学需要参加考试,我当时的成绩确实很不错,那会儿的考试还是全国性的。我记得母亲总是逢人就说,我是个非常聪明的孩子。不管这话是不是真的,她反复的肯定,无形中给了我一种压力,我必须变得足够聪明。这件事让我意识到,无论是为人父母还是做管理,给身边的人或者整个公司设定一个超出常理的高目标,往往能激发他们的潜能,让他们迎难而上。当然,也有人会被这样的目标吓退,但对我而言,这种激励起到了积极的作用。这是我第一个想到的童年片段。

 

另一件事,是关于我母亲的。当年我们学习英语的时候,她其实根本不懂英文,而且我觉得她可能连高中都没毕业。但这丝毫没有妨碍她每天教我们学英语。你可能会觉得不可思议,一个完全不懂英语的人,怎么教孩子学英语?她的方法很简单:买一本韦伯斯特词典,照着单词的拼写规律,写下英文单词,再标注上中文释义,把纸对折做成单词卡,然后逼着我们背下来。我们的发音准不准确,她其实也无从判断。但这件事,让我学到了一个道理:一个人只要有足够坚定的意志,就算暂时不知道该怎么做,也不该停下脚步。很多事情,其实并没有想象中那么难。小时候的这段记忆,我一直记到现在。

 

还有一段经历,是我们搬到肯塔基州之后。我当时是学校里年纪最小的孩子,就读的奥尼塔浸会学院坐落在山顶。每天上学,我都得走下山坡,穿过一条河,再走过一片广阔的田野,才能到达那所小小的学校。那是 1973 年,我是整个镇上第一个出现的中国孩子。镇上的那些孩子都很野,每次我过吊桥的时候,他们都会找我的麻烦。那座吊桥的桥面是木板铺的,有些木板已经缺失了,桥下的河水很深。而那些孩子,就守在桥的另一头等我。那时候我才 9 岁。

 

Jodi Shelton:天哪,才 9 岁。眼前是一条河,一座破吊桥,桥对面还有等着找麻烦的孩子,这简直太糟糕了。

 

黄仁勋:是啊,但我每天都得走这条路去上学。这大概就是童年时期的 “痛苦与磨砺” 吧。每天早上都是这样。下午放学回家后,我还有任务:打扫卫生间。那时候家里的每个孩子都有分工,我哥哥当时 11 岁,他的活儿是去烟草农场干活,而我的工作就是打扫卫生间,每天都要做。

 

Jodi Shelton:你觉得当年那些找你麻烦的孩子,知道你现在的成就吗?

 

黄仁勋:奥尼塔浸会学院的校长最近还发邮件给我呢。他们每年都会给我寄圣诞礼物,知道我喜欢吃肯塔基风味的香肠肉汁配饼干。

 

Jodi Shelton:这个爱好是在肯塔基养成的吧?

 

黄仁勋:没错。我记得我 45 岁生日的时候,家人带我回了一趟母校。当年食堂里做饭的阿姨们居然还健在,特意回来给我做了一顿饭。

 

Jodi Shelton:天哪,这也太暖心了。

 

黄仁勋:真的特别感动。她们给我做了正宗的肯塔基香肠肉汁配饼干,味道还是小时候的样子。

 

Jodi Shelton:你的父母见证了你的成功吗?

 

黄仁勋:当然,他们现在身体还很好,特别为我骄傲。他们对我的事情了如指掌,我父亲会读所有和我相关的报道。要是看到有人说我的坏话,他还会生气。我总劝他别什么都看,不然天天都得生气,别理会那些负面新闻。

 

Jodi Shelton:挺有意思的。现在功成名就了,你会怀念那些还没这么受关注的日子吗?会想念那些平凡的小事吗?比如你很爱车,现在却没什么机会开车了吧?我记得你是我认识的人里,第一个也是唯一一个拥有柯尼赛格跑车的人。

 

黄仁勋:克里斯蒂安・冯・柯尼赛格真是个天才设计师,那辆车太棒了。启动的时候,引擎声和蝙蝠侠的座驾一模一样。而且启动它得按七个步骤,因为动力实在太强劲了,不能随便让别人碰。不过我现在已经没有那辆车了,也确实很少开车了。

 

Jodi Shelton:会想念开车的感觉吗?

 

黄仁勋:有一点吧。我现在还是会关注新车,比如新款的法拉利,每次看到都觉得很惊艳,这些车真的是工程学的杰作。

 

Jodi Shelton:确实很厉害。我去过法拉利的工厂,亲眼看到一辆车从工业器械一步步变成顶级消费品,现在甚至成了艺术品,这个过程太震撼了。

黄仁勋眼中五年后的世界

Jodi Shelton:如果五年后我们再坐在这里,你觉得到那时的世界会是什么样子?哪些变化会让我们最惊讶?

 

黄仁勋:如果我们回归底层逻辑,再结合现实的实用性和技术落地的规律来判断,有几件事是可以预见的。首先,英伟达和整个行业在 AI 领域的投入,必将彻底改变计算机的运作模式 ,未来的计算机,将从 “由人类编程” 进化为 “在人类引导下自主学习编程”。过去我们是手把手教计算机学日语,未来我们只需要告诉它 “去学日语” 就够了。未来的计算机,将能够处理比现在大十亿倍的问题规模。这个变化的影响之大,我们现在甚至无法完全想象,因为提出解决方案是一回事,而能否构想出需要解决的问题,就是另一回事了。很多问题之所以无法被解决,往往是因为我们连如何定义和描述它们都做不到。

 

未来,无论是数字生物学、物理科学、量子物理还是材料科学的复杂难题,都会变得容易攻克。就算是交通拥堵这种日常问题,也能得到极大改善。就拿智能电网来说,现在的电网存在大量能源浪费,AI 会精准计算出所需的能源量,实现按需分配,从根本上避免过度供应造成的损耗。AI 解决这些日常难题的能力,会让人惊叹不已。到那时,每一个科学领域都会被重塑,当下所有的难题都会被技术赋能、迎刃而解。工具的速度提升了,难题自然就显得 “渺小” 了。举个例子,如果飞机的速度能达到 10 马赫,整个世界就会变得 “小” 很多, 喷气式飞机的出现,其实已经让世界变小了。

 

英伟达制造的计算机也是如此,极致的运算速度让所有问题都变得更容易被解决。就像 OpenAI 的研究人员曾经说的:“为什么不把整个互联网的数据都喂给计算机呢?” 因为在算力爆发之后,全球互联网的数据量,突然就显得微不足道了。现在我们看互联网数据,也会觉得体量很小,原因就在这里。这种心态,未来会渗透到几乎所有的科学领域。过去人们会说 “这是个无解的难题”,未来大家只会觉得 “这事儿很简单”。五年后,每一位科学家、工程师、企业家和创新者,都会抱着这样的心态。曾经的难题变得简单,我们就能解决更多的问题。这是第一个必然结果。

 

第二个结果,就是企业的生产效率会实现质的飞跃。今天的难题变成明天的小事,供应链管理会变得无比顺畅,浪费现象基本消失;计算机的设计流程也会简化,我们可以尝试更多的方案。这并不是说我们会每年推出更多的产品,我们还是保持一年一款的节奏,但每一款产品都会经过更多次的迭代优化,最终呈现的成品会比现在好得多。这样一来,公司的效率会更高,利润会更丰厚,所有企业都会变得更赚钱,整个社会的财富也会随之增长。但还有一个值得深思的点:当所有我们能想到的问题都变得可以解决时,我们就会去探索更多新的问题。

 

所以,未来的趋势不会是就业岗位减少,反而是大家会变得比现在更忙碌。因为以前那些被认为 “不可能完成” 的任务,现在都摆上了台面;那些因为成本太高而无法开展的实验,现在都可以去尝试,AI 还会帮我们推进这些实验。只要我们有足够的想象力,所有搁置的难题,都会找到解决的路径。我可以做一个思想实验。现在我工作时,身边围绕着 60 位顶尖人才,而他们每个人又带着数千名精英。这些人在各自的领域里,能力都远超于我,对我来说,他们就像是 “领域内的人工超级智能”。但和他们合作,我完全没有障碍。现在我使用的 OpenAI、Gemini、Grok、Perplexity、Anthropic 这些 AI 工具,在很多方面也已经比我聪明了,但我每天都在和它们高效协作。

 

不过有一个很有意思的变化:以前我给团队布置一个问题,需要等两三天才能得到反馈和答案,这段时间里我可以思考下一步的计划 ,因为我的决策需要基于这些中间结果。但如果这些答案能在一秒钟内就反馈给我,会发生什么?我的工作节奏会变得无比紧凑,因为我会成为所有事情的关键节点。刚得到一个答案,立刻就要推导下一步,马上启动新的实验。你不觉得吗?现在信息技术的提速,已经让我们变得更忙碌了。信息、知识和答案的获取速度越来越快,我们作为决策节点,自然会比以往更忙。我觉得未来很多人都会有这种感受。

 

最后一点,对于那些没能赶上之前科技浪潮的人来说,AI 会填平技术鸿沟。我特别喜欢 “氛围编程” 这个概念,现在任何人都可以成为软件程序员,借助 AI 写出的代码,甚至比很多专业程序员的作品还要好。我很欣赏 Cursor 这家公司的成果,前几天还见到了 Lovable 的 CEO,他是个很厉害的人,他们的公司在瑞典。AI 会帮助那些在自己的领域很有天赋,但不懂如何用技术放大自身能力的人实现能力的跃迁。Lovable 的 CEO 就跟我说过,很多人用他们开发的软件创办了小公司,现在每年能赚 2300 万美元。这太不可思议了。这些人终于能融入全球经济体系,不再被技术门槛挡住去路,这一切都是 AI 的功劳。

 

五年后的世界,大家会拥有更有价值的工作,经济效率会大幅提升,GDP 有望实现增长,劳动力短缺的问题会得到缓解,通货膨胀也会回落。更多的科学领域会被开拓,更多的难题会被解决。当然,也有一些悲观的论调,认为 AI 会让一半的人失去工作。但我觉得,更可能发生的情况是:100% 的工作岗位都会发生变化,但不会有 50% 的岗位消失。而且,那些现在没有工作的人,很可能会因为 AI 获得谋生的手段。

 

当然,我们的技术会发生翻天覆地的变化,但这些技术层面的革新,反而不是最有意思的。五年后,计算机还是计算机,只是应用变得更智能了,本质上还是软件。我们依然会做电商,只是可能不用自己逛网站了,会有智能代理帮我们购物,但商品还是来自亚马逊这些平台。很多事情,其实都会保持原样。最后我还有一个小小的愿望或者说期待:希望我们在机器人和人形机器人领域的研究能结出硕果,希望未来每个人都能拥有属于自己的 R2-D2 和 C-3PO,它们可爱又贴心。就像在 GTC 大会上,我每次都会邀请迪士尼的机器人上台,那些机器人真的太萌了。

 

为什么不让每个人都拥有一个呢?我还希望迪士尼能把这些机器人做成周边商品,它们真的值得。我的宠物猫莫莫和库玛,也需要这样的 “宠物玩伴” 不是吗?我真心希望这个愿望能实现。现在有很多孤独的人,已经有不少人联系过我,希望能拥有可以在家陪伴自己的机器人,尤其是那些独居的老人。机器人能给他们带来陪伴和帮助,而且它们本身又那么可爱,这绝对是我们技术发展带来的意外之喜。

 

Jodi Shelton:如果以后有机器人帮我们做饭、打扫卫生,你还会像现在这样,饶有兴致地看着别人做饭吗?

 

黄仁勋:当然会。原因很简单,我现在完全有能力不用自己做饭,但我还是会选择下厨。我们完全可以雇很多佣人,但我们没有这么做。我和洛里一直都是两个人自己过日子。昨晚她做了墨西哥辣椒肉酱,味道棒极了,全程都是她一个人忙活的。以后我们大概率还会保持这样的生活。对我来说,最幸福的时刻,就是孩子们回家来,我们一起下厨做饭,喝喝小酒,这就是最完美的时光。

 

Jodi Shelton:一家人在厨房里忙活,这种亲密感真的太美好了。

 

黄仁勋:是啊,人生的幸福莫过于此。我们打拼奋斗,不就是为了这样的时刻吗?

“不爱演讲的黄仁勋”:CEO 是公司里最脆弱的一群人

Jodi Shelton:当一切尘埃落定,你希望后人如何记住你?

 

黄仁勋:首先,能被人记住,本身就是一件很幸运的事。我很庆幸,凭借英伟达的成就,凭借我们打造的事业,凭借我们在全球最重要的科技产业:人类最核心的工具 “计算机” 领域留下的印记,英伟达很可能会在我离开这个世界很久之后,依然对这个世界有着重要的意义。我很庆幸自己能和克里斯、柯蒂斯一起创立这家公司,很庆幸自己能一路学习成长,没有成为拖垮公司的那个短板,反而常常是推动公司走下去的一份力量。我们打造的这家企业,对整个世界都有着深远的影响,而不只是局限于某个行业或某个群体。

 

能做到这一点的人,在这个世界上并不多。我很庆幸自己作为创始人,能亲身参与并见证这一切,见证英伟达成长为如今的模样,见证它对全球各行各业产生实实在在的影响。公司里有很多已经工作了 33 年的老员工,他们的人生因为英伟达变得更加丰盈;现在甚至已经有第二代、第三代员工加入我们。我们在全球各地建立了自己的团队,我很荣幸能和这些员工并肩作战,分享他们一路走来的绝望与喜悦、希望与悲伤。这样的经历,并不是每个人都能拥有的。我为我们在中国的团队感到骄傲,为我们在印度的员工们由衷赞叹,也为欧洲、加拿大的团队感到欣慰。我们在加拿大的团队正在不断壮大。

 

我还希望有朝一日,英伟达能把业务拓展到南半球,让更多地区的人们,也能享受到我们今天所拥有的技术成果。昨天我还和人聊起我们在非洲开展的工作,聊到我们应该在拉美和东南亚投入更多精力。我真的为我们公司带来的这些影响感到自豪。所以,人们会怎么记住我?或许,他们会记得我是英伟达的创始人之一,是这家公司的缔造者之一。或许,还会记得我是个好人。

 

Jodi Shelton:这是毋庸置疑的。

 

黄仁勋:他们或许还会觉得,我是个风趣幽默的人,不喜欢端着架子。其实在很多方面,我都算是一个 “不情愿的 CEO”。比起待在公司外面抛头露面,我更喜欢扎根在公司内部;比起发表演讲,我更喜欢安静做事;我甚至一点都不喜欢做主题演讲,但为了公司,我必须去做这些事。我确实是个不太情愿的 CEO,但我绝对是个满腔热忱的英伟达建设者。只要是为了公司发展必须做的事,我都会全力以赴。说了这么多,其实我也不知道,人们最终会如何记住我。

 

Jodi Shelton:我觉得,看到好人获得成功,总是一件令人开心的事。这么多年来,看着你一路打拼,经历起起落落,最终收获成功,我真的由衷地为你高兴。你这一路走来,见过了形形色色的人。

 

黄仁勋:是啊,真的见过了太多人。我想提醒所有的 CEO,没有人能单枪匹马地成功。

 

Jodi Shelton:确实如此。

 

黄仁勋:我们虽然是 CEO,但这个位置总需要有人来坐。如果不是早年大家对我的提携与帮助,比如你一直不遗余力地宣传英伟达还有张忠谋奖带来的认可,这些都对我意义重大。张忠谋奖大概是我人生中获得的第一个真正有分量的奖项,直到今天,它对我来说依然意义非凡。这个奖项以他的名字命名,而且他还亲自参与了评选,这份认可真的让我铭记于心。还有那些和我们合作的企业,他们的慷慨相助,我也一直记在心里。

 

其实 CEO 这个角色,很多时候都需要寻求帮助。我已经记不清有多少次,我是这样开启一段对话的:“我需要你的帮助。” 很多时候,我是真的需要帮助,而且对方往往是唯一能帮到我的人。一路走来,很多人都慷慨地伸出援手,分享他们的知识,教我做事的方法,帮我解决棘手的难题。这或许才是 CEO 这个角色带给我的真正启示,这个职位远比人们想象的要脆弱得多。

 

Jodi Shelton:而且还是一个很孤独的职位,对吧?

 

黄仁勋:确实可能会感到孤独。但我想说,这种孤独更多是存在于我们的内心世界。当你试图解决一些棘手的难题时,往往需要长时间独自思考,自己跟自己对话。公司发展的每一次转型、每一次跨越,每一次我推动公司自我革新的时刻,我都不知道自己独自思考了多少个小时。在那些时刻,你会真切地感受到孤独。但我们也要明白,其实有很多人都希望我们能成功。就像你之前说的,你很乐意看到我成功,我知道你是真心希望我好,而我也同样希望你能越来越好。从这个角度来说,我们其实并不孤单。

 

所以说,CEO 这个职业,是一份充满脆弱感的工作。你无法单打独斗完成任何事,很多时候都需要依赖别人的帮助与善意。或许在外界看来,我们是强大的领导者,但实际上,我们可能是公司里最脆弱的一群人。我经常说,我是公司里唯一一个离开别人的帮助就寸步难行的人。我想,大多数 CEO 应该都是如此。这或许就是这份职业带给我们的感悟:CEO 们,远比他们愿意承认的要更加脆弱。不过对我来说,承认这种脆弱,并不是什么难事。

“没有终极目标” ,才成就了英伟达?

Jodi Shelton:接下来我们用快问快答收尾。你见过的最聪明的人是谁?

 

黄仁勋:这个问题我没法回答。我知道大家心里对 “聪明” 的定义,就是智商高、会解决问题、技术能力强。但在我看来,这种能力早已经成了一种 “通用品”。而且我们很快就能证明,AI 处理这类问题是最轻松的,不是吗?举个例子,以前大家都觉得软件编程是最考验智商的工作,结果呢?AI 最先攻克的领域之一就是编程。所以说,“聪明” 的定义,其实和大多数人想的完全不一样。

 

在我看来,从长远来讲,真正的 “聪明”,是那种兼具技术洞察力与人文同理心的能力,是能够洞察弦外之音、预判未知风险、看透表象背后本质的能力。那些能 “见人所未见” 的人,才是真正的聪明人,他们的价值是无可估量的。这种人能凭借数据、分析、底层逻辑、人生阅历、智慧经验,再加上对他人的感知,敏锐地捕捉到潜在的风险,在问题发生之前就提前规避。我觉得这才是 “聪明”,而且拥有这种能力的人,说不定在学术能力评估测试(SAT)里的分数惨不忍睹。

 

Jodi Shelton:外界对你有什么误解?

 

黄仁勋:这些问题都好犀利啊。首先,我都不知道外界对我有什么印象。

 

Jodi Shelton:比如,大家觉得你喜欢抛头露面,觉得你是个很棒的演讲者,所以肯定很享受做演讲的过程。但你之前已经说了,事实并非如此。

 

黄仁勋:对,完全相反。公开演讲简直让我怕得要死。不是说站在台上的那一刻害怕,而是现在,想到两周后在华盛顿举办的 GTC 大会,我就焦虑得不行。不,应该说,我已经焦虑一个月了。这种事总是让我心神不宁,脑子里时时刻刻都想着,压力特别大。公司内部的会议演讲也让我紧张到极致。因为台下坐的都是对我而言最重要的人,从某种程度上说,这是我做过的最重要的演讲。但这种演讲根本没法准备,我要讲的所有内容,其实都能在网上的某个视频里找到,他们完全可以自己去看。

 

我很讨厌把那些内容重复一遍讲给他们听,因为你绝不会回家对着家人做一场 GTC 主题演讲,对吧?我也不想那样做。演讲内容必须是真诚的、独一无二的、对听众有价值的、有意义的,能给他们带来改变。毕竟我还在领导这家公司,我希望通过演讲达成一定的目标。所以我必须拿出全新的内容,但不到演讲结束的那一刻,我永远不知道最终效果会怎么样。大家都觉得财报发布周我会很紧张,但说实话,我一点感觉都没有。真正让我紧张的,是公司的内部会议演讲。所以外界的这个印象,真的大错特错。

 

Jodi Shelton:你最受不了的事是什么?

 

黄仁勋:在关键时刻,有人不认真听我说话、不理解我的问题,还胡乱回答。尤其是在我们处理非常棘手、非常困难的问题时,我们需要的是事实,是真相。这个时候我提出问题,如果有人答非所问,我会立刻火冒三丈。我实在无法理解,为什么有人意识不到这场会议的重要性?我们正在为一件至关重要的事努力,我们需要尽快找到真相、解决问题。我到现在都想不通这一点,这种情况每次都会激怒我。谁要是想惹我生气,这招百试百灵。

 

Jodi Shelton:这下我们知道怎么让黄仁勋发火了。

 

Jodi Shelton:最后一个问题,是最近有人问我的,我特别喜欢这个问题。如果让你回到 20 岁,你是想回到自己当年的那个年代,还是活在当下的 20 岁?

 

黄仁勋:我会毫不犹豫地回到自己的那个年代。因为我觉得,我们那一代人的 20 岁,比现在年轻人的 20 岁更快乐。我总觉得,每个人都应该拥有一段 “懵懂无知” 的时光,不必从第一天起就背负着全世界的重担。我坚信这一点,没人能说服我。有时候,“无知” 也是一种快乐,甚至是一种超能力。如果当初我知道创立英伟达是一件 “不可能完成的任务”,那今天的英伟达根本就不会存在。事实就是,创立英伟达这件事,本来就是天方夜谭。但当时的我什么都不懂,所以没人能说服我放弃。

 

我觉得,乐观的人都这样,你永远没法说服他们 “这件事做不成”。他们就是这么 “无知”,对现实的艰难视而不见,所以才会充满乐观。这难道是坏事吗?现在的年轻人,过早地接触到了太多信息,变得越来越愤世嫉俗。他们并不是天生就这么消极,而是因为看到的东西太多太杂了。其实大可不必如此。人需要培养内心的乐观精神,需要在心里留存一份善意,学会只看到世界美好的一面。我们得锻炼这种能力。我们那一代人,有更多这样的机会。我们 20 岁的时候,就是这样的,乐观得像超人一样,觉得凡事皆有可能。所以,我肯定会选择回到自己的 20 岁。

 

Jodi Shelton:真是个完美的收尾。无知是福啊。

 

黄仁勋:没错,无知是福,无知也是一种超能力。任何一个想要开启新征程的人,如果不是因为这份 “无知”,他们一早就会因为觉得事情太难而放弃了。我真的很庆幸,自己当年虽然也算勤奋、也算有一些能力,但那份 “无知” 帮了我大忙。我那时候做任何事都抱着一种心态:“这能有多难?” 结果后来才发现,简直难到超乎想象。你根本没法想象。你看看我今天建立的这一切,如果当初我就知道前路会有这么多艰辛、这么多挫折、这么多失望,把这些困难全都摆在我面前,我绝对不会去做的,绝对不会。所以说,“无知” 真的是一种超能力。

 

还有一种超能力,就是“没有终极目标”。英伟达就没有什么终极目标。总有人问我:“黄仁勋,你的计划是什么?” 我们没有计划,“活下去” 就是我们的计划。我们对未来的世界有憧憬,我们会畅想技术会如何改变世界,但我们 100% 的计划,就是让公司一直运营下去。以前也有人问我,现在也经常有人问:“黄仁勋,你的人生目标是什么?” 我没有什么人生目标,就是想一直工作,一直有事可做,能和一群优秀的人一起做有意义的事。这就是我的目标。

 

所以说,从很多方面来讲,“没有终极目标” 这一点,对英伟达的发展真的起到了至关重要的作用。

 

参考链接:

https://www.youtube.com/watch?v=8FOdAc_i_tM