时间: 2026-01-18

Meta 的 AI 堡垒：高风险技术转型中的创新封锁

在飞速迭代的人工智能领域，Meta 平台公司（Meta Platforms Inc.）做出了惊人转变 —— 摒弃开源根基，转向严密管控的闭源模式。这一战略调整于 2026 年初宣布，背后是其 LLaMA 模型表现不及预期，以及来自 OpenAI、谷歌等竞争对手的压力日益加剧。据《24/7 华尔街》（24/7 Wall St.）近期分析，Meta 的闭源决策被视为 “关键制胜之举”，有望帮助这家社交媒体巨头在 AI 军备竞赛中重新站稳脚跟。

这一转变背离了 Meta 此前的开放理念 —— 过去，该公司一直以普惠 AI 技术的倡导者自居。多年来，Meta 通过开源许可发布了 LLaMA 等模型，培育了庞大的开发者和研究社区。然而，内部评估显示，这种模式并未为 Meta 带来渴望的竞争优势。有消息称，LLaMA 在关键基准测试中未能达到预期，促使高管们重新审视战略。这一举措也契合了行业大趋势：如今，闭源系统越来越被视为保护知识产权、创造营收的核心保障。

Meta 首席执行官马克・扎克伯格亲自主导了此次变革，强调必须打造用户愿意付费的 AI 模型。据彭博社（Bloomberg）报道，扎克伯格的亲力亲为包括组建史上最昂贵的 AI 团队，目前该团队正专注于开发可直接商业化的闭源系统。

开源野心背后的不满根源

行业内批评者认为，Meta 的开源战略在无意间助力了竞争对手。通过免费开放先进模型，该公司可能在自身难以从创新中获利的同时，加速了他人的技术进步。科技圈内人士在社交平台 X（前推特）上的帖子流露出不满情绪，部分用户指出，Meta AI 部门的招聘冻结和裁员是内部动荡的信号。这些社交媒体讨论凸显出一个日益普遍的共识：开源举措削弱了 Meta 的竞争优势。

此外，此次战略转型还伴随着大规模的基础设施投资，包括一项重大核能合作。据《财经内容》（FinancialContent）的深度报道，2026 年 1 月 9 日，Meta 宣布与奥克洛公司（Oklo Inc.）等企业达成合作，为其数据中心获取千兆瓦级核能。这一 “核能驱动的 AI 转型” 旨在满足闭源模型训练所需的巨大能源需求，彰显了 Meta 在摆脱开放协作脆弱性的同时，实现规模扩张的决心。

这一能源战略不仅关乎电力供应，更是一场地缘政治布局。Meta 全球事务总裁乔尔・卡普兰在接受《福克斯商业新闻》（Fox Business）采访时表示，这些投资将帮助美国在与中国的 AI 竞赛中 “胜出”。通过掌控本土核能资源，Meta 有望确保下一代 AI 所需的计算能力不受国际供应链风险影响，实现持续获取。

内部动荡与领导层变动

Meta 内部的转型之路并非一帆风顺。在 AI 领域的全面改革过程中，公司遭遇了员工离职和士气低落等问题。《商业内幕》（Business Insider）的一篇文章将 2025 年描述为 Meta 的 “高压之年”—— 文化变革、裁员和绩效整顿引发了内部冲突。据美国全国广播公司财经频道（CNBC）报道，Meta 前首席 AI 科学家杨立昆（Yann LeCun）公开批评这一新方向，称这位 29 岁的 AI 负责人 “缺乏经验”，并预测将出现员工大规模流失。

杨立昆的离职凸显了更深层的 “研究者与执行者” 分歧。他在采访中指责 Meta 篡改 LLaMA 4 的基准测试结果，并拒绝 “世界模型” 等创新方案，转而执着于更大规模的语言模型。行业观察人士在 X 上的帖子也呼应了这一观点，认为 Meta 陷入了传统思维的循环，而竞争对手却在投资突破性理念。这种内部分歧让人质疑，闭源战略是否能孕育出真正 AI 突破所需的创造力。

尽管面临这些挑战，分析师仍持乐观态度。杰富瑞（Jefferies）在《雅虎财经》（Yahoo Finance）的报道中列出了 Meta 2026 年可能表现出色的五大原因，包括其 AI 能力和广告技术的进步。该公司重申了 “买入” 评级，目标价定为 910 美元，押注 Meta 能够利用闭源 AI 实现营收增长。

驱动变革的盈利迫切性

Meta 战略转型的核心是对盈利能力的追求。开源模型虽具创新性，却未能转化为直接收入来源。通过转向闭源 AI，Meta 可以提供高端服务，例如向企业用户收费开放集成于 Facebook、Instagram 等平台的先进模型。这与竞争对手的策略不谋而合 —— 闭源技术是其高利润企业解决方案的核心支撑。

这一举措还回应了监管与伦理层面的担忧。借助闭源系统，Meta 能更好地掌控其 AI 的使用场景，潜在降低诈骗、虚假信息等滥用风险。路透社（Reuters）的一项调查披露了 Meta 应对诈骗压力的内部 “操作手册”，包括加大欺诈广告的识别难度。在闭源生态中，此类管控措施的实施效率将大幅提升。

此外，该战略与 Meta 逐步退出元宇宙投资的大方向相一致。X 上的帖子显示，Meta 计划将元宇宙部门成本削减高达 30%，并将资源重新投向 AI 领域。这种重心调整有望精简运营流程，提升投资者信心 —— 此前元宇宙的低迷表现曾导致公司股价大幅波动。

竞争压力与市场影响

在更广阔的科技领域，Meta 的转型可能标志着行业向闭源 AI 靠拢的大趋势。《街报》（TheStreet）的分析指出，这一变化将赋予谷歌新的优势，同时给英伟达投资者带来不确定性，因为专用硬件的需求格局正在演变。Meta 对闭源模型的重视可能会给开源倡导者带来压力，重塑全球 AI 的发展模式。

财务层面，此次转型得到了巨额资金支持。据彭博社报道，Meta 的核能合作使其成为全球最大的企业级核能采购商之一，目标是到 2035 年获取高达 6.6 千兆瓦的核能。这一基础设施投资凸显了其中的高风险：AI 训练需要消耗海量能源，而 Meta 正豪赌核能能支撑其雄心。

然而，挑战依然存在。X 上的批评者认为，Meta 的模式缺乏吸引顶尖人才的声誉，部分帖子质疑其推出突破性产品的能力。埃里克・梅耶尔（Erik Meijer）在平台上的相关讨论中提出，仅靠资金无法解决 Meta 的人才困境，因为有些文化问题是金钱难以弥补的。

不确定性中的战略优势

潜在的优势十分诱人。通过闭源模式，Meta 可以在无需担心模仿的情况下加速创新，有望实现更精准的广告定向和更优质的用户体验。《AI 日报》（AI Daily）的一篇文章将 Meta 列为 2026 年顶级 AI 股票之选，重点关注其 LLaMA 4 的进展 —— 尽管战略已转向闭源。这可能使其在个性化广告这一核心收入来源上超越竞争对手。

地缘政治层面，该战略增强了美国的技术主权。卡普兰在《福克斯商业新闻》中的言论强调，核能自主将对抗中国的 AI 进步，确保 Meta—— 进而确保美国科技 —— 保持主导地位。

但前路充满荆棘。X 上的报道显示，Meta 对 AI 部门的裁员等内部重组表明，调整仍在持续。Axios 指出，Meta 正努力精简官僚机构，力求在这个速度至关重要的领域保持灵活性。

长期愿景与行业涟漪

展望未来，Meta 的闭源 AI 战略可能会重新定义其在科技生态系统中的角色。将闭源 AI 整合到其庞大的用户基础中，将带来独特优势 —— 从强化内容审核，到在剩余的元宇宙愿景中打造沉浸式体验。

包括 X 平台用户在内的行业观察家推测了其连锁反应。Polyhedra 的帖子讨论了 Meta 转向闭源训练的举措，认为这将限制外部可见性，可能抑制协作进展。这或许会导致 AI 开发环境更加碎片化，巨头企业囤积技术进步成果。

归根结底，Meta 的转型反映了 AI 战略的成熟 —— 将可持续性和盈利置于理想主义之上。在公司应对这些变革的过程中，其成功将取决于能否平衡创新与执行、人才留存与伦理治理。以核能为动力，Meta 正定位自身不仅是社交媒体巨头，更是一座坚不可摧的 AI 强国，准备在未来十年占据主导地位。

篡改模型测试结果后，小扎边缘化所有参与员工

作者: 纯情

时间: 2026-01-04

分类: 资讯

整理｜华卫

去年这个时候，外界普遍传言：图灵奖得主、Meta 前首席科学家 Yann LeCun 将主动离开 Meta，寻求新的研究机会。如今，LeCun 也已官宣离职开启创业之路。

而刚刚公开的一场对 LeCun 的专访，却呈现了另一番截然不同的故事。这场对话长达三小时，期间 LeCun 曝出了不少 Meta 的猛料，并勾勒出了这一残酷现状：组织运转失灵、基准测试结果造假，以及一位拒绝为自己认定存在科学缺陷的方案背书的研究员的出走。

篡改模型测试结果后，小扎边缘化所有参与员工

首先，LeCun 透露了一个 Meta 本不愿公之于众的惊人细节：Llama 4 的基准测试结果是人为操纵的。

“这些结果有几分掺假，”他解释道，工程师针对不同的基准测试采用了不同的模型变体，目的是优化分数，而非展示真实的能力。

这绝非一场单纯的产品失利。2022 年 11 月 ChatGPT 的问世打了 Meta 一个措手不及，公司领导层陷入慌乱。Meta 随即围绕生成式 AI 业务进行重组，相继推出了 Llama 2 和 Llama 3。Meta 将自身定位为开源领域的领军者，是对抗 OpenAI 封闭模式的一方。单看 Llama 3 的下载量和生态系统渗透率，Meta 的布局相当成功，这包含渠道分发、品牌塑造和生态引力所带来的效果。

这一系列势头最终促成了 2025 年 4 月 Llama 4 的发布。这款模型虽斩获亮眼的基准测试分数，却因实际表现问题饱受诟病。此前也有独立报道证实了 LeCun 所描述的“数据作弊”行为，针对不同测试，专门挑选对应的模型变体。

LeCun 在采访中表示，这一事件让 Mark Zuckerberg 对公司现有 AI 团队彻底失去了好感。

据称，这位首席执行官当时震怒不已，“基本上对所有参与此事的人都失去了信任”。“也正因为如此，整个生成式 AI 团队都被边缘化了。”LeCun 表示，“很多人已经离职，还有不少没走的人也即将离开。”

随后，Meta 针对 Llama 4 失利所做出的一系列应对举措，折射出其管理层当时的窘迫处境。据路透社报道，2025 年 6 月，该公司斥资约 150 亿美元收购了数据标注初创企业 Scale AI 的大量股份。与此同时，Meta 聘请了 Scale 年仅 28 岁的首席执行官 Alexandr Wang，牵头组建一个名为 TBD 实验室的全新研究部门，负责前沿 AI 模型的研发工作。

该公司还展开了声势浩大的挖人行动，据称向竞争对手旗下的顶尖研究员开出了 1 亿美元的签约奖金。

通常，健康的研究机构不会因为一次挫折就动辄斥资 150 亿美元收购初创企业的大量股份。这些举动，似乎亦在展露这家公司正面临战略押注摇摇欲坠的危机。

LeCun 锐评 Alexandr Wang：毫无经验、休想对我指手画脚

对 Wang 的任命，造成了公司架构上一次令人错愕的上下级反转。身为图灵奖得主、卷积神经网络发明者、深度学习革命联合发起人的 LeCun，如今竟要向一位主业为训练数据标注的人汇报工作。在任何一家研究机构，这样的身份倒置都堪称骇人。这位领域奠基人端坐会议桌前，听着一位年龄不及自己一半的后辈，为那些对方既未参与创造、也未完全理解的技术规划发展蓝图。

LeCun 在采访中直接表示，此人“毫无研究经验，既不懂研究该如何开展，也不知道研究该如何落地”。“他学得很快，也清楚自己的短板所在……但他毫无研究经验，既不懂研究该如何开展、如何落地，也不知道什么样的东西能吸引研究员，什么样的东西会让研究员反感。”LeCun 如此说道。

当就这一汇报层级向 LeCun 追问时，他的回应措辞谨慎却一针见血：“没人能对研究员指手画脚。尤其像我这样的研究员，更是绝无可能。”LeCun 表示，尽管在 Zuckerberg 主导的 AI 业务重组后，这位 28 岁的年轻人曾短暂担任自己的上司，但实际上并没有对他发号施令。

实际上，双方更深层的矛盾似乎并非源于层级，而是源于理念分歧。Wang 代表的是 Meta 押注语言模型规模化的战略方向，而 LeCun 则认为这一范式从根本上就误入了歧途。让奉行这一理念的人身居管理要职，让他的留任变得绝无可能。

“我敢肯定，Meta 内部有不少人，或许也包括 Alex，都巴不得我不要对外宣称，在通往超级智能的道路上，大语言模型本质上已是一条死胡同。”LeCun 强调，“但我不会因为某个家伙说我错了，就改变自己的想法。我没有错。作为一名科学家，我的职业操守不允许我做出这种违心之举。”

“语言模型已经达到瓶颈”

如今 Meta 的 AI 战略，核心是沿用 OpenAI 联合创始人声称已触及天花板的架构方案，与 OpenAI 展开竞争。

然而，作为这家公司最具声望的 AI 研究员，LeCun 认为，这种方案根本无法实现 Meta 宣称要追逐的智能目标。据其透露的内容，负责 Meta 旗舰模型的团队交出的成果可信度极低，致使管理层对整个团队都丧失了信任。

事实上，LeCun 对大型语言模型的批判，早已超越 Meta 此次的具体失利事件。LeCun 一直以来都在强调，大型语言模型的局限性过大，若要释放 AI 的真正潜力，必须另辟蹊径。

过去数年间，他在公开演讲与技术论文中阐释的核心论点，本质上是一个数学层面的结论：语言这一载体，对于培养真正的智能而言，存在着根本性的带宽不足问题。

参与 Lex Fridman 播客节目时，LeCun 曾测算过一组数据：若要通读互联网上的全部文本（体量约为 2×10¹³字节），人类需要耗费 17 万年的时间。而一个四岁孩童，单是通过视觉输入接收的信息体量就约达 10¹⁵字节。也就是说，在幼儿阶段，孩子吸收的信息量，就比大型语言模型从人类全部书面语料库中提取的内容多出 50 倍。

这一数据背后，潜藏着更为深刻的启示。训练大型语言模型，就如同试图通过阅读所有与木材相关的书籍来学习木工手艺：你自始至终都没有碰过一把锤子。诚然，你能掌握相关的专业词汇，但却无法真正理解背后的物理原理。LeCun 的判断很简单：要学好木工，你必须亲手挥起锤子。

这一点恰好解释了 AI 能力上长期存在的短板。青少年只需 20 小时就能学会开车，幼儿第一次尝试就能擦干净桌子，家猫能轻松穿梭于复杂的三维空间。然而，即便投入了数十亿美元的研究经费，在万亿级别的语料库上训练出来的 AI 系统，却在这些任务面前束手无策。

2025 年 11 月，OpenAI 前首席科学家、规模化范式的缔造者 Ilya Sutskever 在接受 Dwarkesh Patel 采访时也抛出了这样一个振聋发聩的观点。他表示，该领域正从“规模化时代”迈向“研究时代”，单纯依靠算力规模的扩张，只会产生边际效益递减的结果。

当这一范式的开创者都如此表态时，其分量不言而喻。ChatGPT 问世后形成的、围绕大语言模型规模化的行业共识正在瓦解。

新架构一年内有雏形？

在接受采访的午餐会上，LeCun 用一个具体的例子阐释了他提出的另一种技术路径。当他掐别人一下时，对方会感到疼痛，其心智模型随即发生更新，下次当他再抬手靠近时，对方会本能地退缩。这种基于预判产生的反应，以及随之触发的情绪，才构成了对因果关系的真正理解。而大型语言模型并不具备这样的机制。它们只是基于统计规律来预测语言符号，而非通过因果模型去判断行为会引发何种后果。

为此，LeCun 提出了一套名为联合嵌入预测架构（JEPA）的世界模型架构，以此弥补现有技术的缺陷。该架构通过对视频与空间数据进行训练，培养系统基于物理原理的认知能力。它让系统学习与行为相关的抽象表征，而非执着于符号层面的预测；同时，它还融入了能随经验不断进化的持久记忆，而非在每次对话时都重置记忆。

采访中，LeCun 给出了该架构的落地时间表：12 个月内推出雏形版本，数年内实现更大规模的部署应用。

据称，他创办的这家初创公司命名为“先进机器智能”，其技术路径正是他所主张的、比大型语言模型更具优势的方案。在这家新公司里，他将出任执行董事长，而非首席执行官。

“我是一名科学家，一个有远见的人。我能激励人们去做有趣的事情。我很擅长预测哪种技术会成功，哪种会失败。但我当不了 CEO。”LeCun 说，“我既太缺乏条理，也太老了！”

世界模型能否后来居上，目前尚无定论。LeCun 预测，具备动物级智能水平的 AI 将在五到七年内实现，而达到人类级智能则需要十年时间。

这位曾助力构建当前 AI 范式的领军人物，如今正孤注一掷地押注：要实现超越，必须依托截然不同的技术路径。绝非细枝末节的渐进式改良，而是彻底颠覆式的全新架构。

参考链接：

https://www.ft.com/content/e3c4c2f6-4ea7-4adf-b945-e58495f836c2

标签 AI战略下的文章