2025 人工智能大事件回顾丨科技巨头篇
本文转载自:清华大学人工智能国际治理研究院微信公众号
AI
2025 人工智能大事件回顾
科技巨头篇
-2025 Annual Major Events-
1 月
中国 DeepSeek 发布 R1 推理模型,震动全球 AI 市场
1 月 20 日,中国 AI 初创公司 DeepSeek 发布了开源推理模型 DeepSeek-R1,宣称其性能与 OpenAI 的 o1 模型相当,但训练成本仅为约 600 万美元 —— 远低于 OpenAI GPT-4 约 1 亿美元的训练成本。该模型采用 MIT 许可证开源发布,引发全球科技界震动。1 月 27 日,DeepSeek 的消息导致英伟达市值单日蒸发约 6000 亿美元,创下美国公司史上最大单日市值损失纪录。DeepSeek 证明了即使在美国芯片出口限制下,中国仍能开发出具有竞争力的 AI 模型,这一事件也推动了开源 AI 模型的发展浪潮。
2 月
特朗普宣布 Stargate 项目,5000 亿美元投资 AI 基础设施
1 月 21 日,美国总统特朗普在白宫宣布了名为 "Stargate" 的 AI 基础设施投资计划。该项目由 OpenAI、软银和甲骨文联合发起,计划在四年内投资高达 5000 亿美元,用于在美国建设 AI 数据中心。软银 CEO 孙正义担任项目主席,OpenAI 负责运营。项目首批 1000 亿美元将立即投入使用,首个数据中心已在德克萨斯州阿比林开工建设。特朗普称这是 "史上最大的 AI 基础设施项目",将创造超过 10 万个美国就业机会。马斯克对此表示质疑,声称 "他们实际上没有这笔钱",但 OpenAI CEO 阿尔特曼进行了反驳。
3 月
Anthropic 完成 35 亿美元融资,估值达 615 亿美元
3 月 3 日,Anthropic 宣布完成 35 亿美元融资,投后估值达到 615 亿美元。本轮融资由 Lightspeed Venture Partners 领投,Salesforce Ventures、思科投资、富达等机构参与。Anthropic 由前 OpenAI 高管创立,其 Claude AI 助手已成为 ChatGPT 和 Google Gemini 的主要竞争对手。截至年初,公司年化收入已达 10 亿美元。融资将用于推进下一代 AI 研发,特别是在机制可解释性和对齐研究领域。
3 月
谷歌发布 Gemini 2.5,引入 "思考" 能力
3 月 25 日,谷歌发布了其最智能的 AI 模型 Gemini 2.5,首个版本为 Gemini 2.5 Pro 实验版。这是谷歌首款具备 "思考" 能力的模型,能够在回答前进行推理过程,在数学、科学、编程等领域的基准测试中达到最先进水平,并在 LMArena 排行榜上以显著优势位居第一。
4 月
Meta 发布 Llama 4 系列模型,首次采用 MoE 架构
4 月 5 日(周六),Meta 发布了全新的 Llama 4 模型系列,包括 Llama 4 Scout 和 Llama 4 Maverick,以及仍在训练中的 Llama 4 Behemoth。这是 Llama 系列首次采用混合专家(MoE)架构和原生多模态设计。Scout 拥有 17B 活跃参数、109B 总参数和 10M token 上下文窗口;Maverick 同样拥有 17B 活跃参数,但总参数达 400B,拥有 128 个专家。Meta 声称其教师模型 Behemoth(约 2 万亿参数)在 STEM 基准测试中超越了 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。当被问及为何选择周六发布时,CEO 扎克伯格简单回应:“准备好了就发了。”
5 月
Anthropic 正式发布 Claude Code,编程助手市场爆发
5 月,Anthropic 正式发布了 Claude Code 开发工具,专为软件工程师设计。该工具通过命令行和编辑器插件(VS Code、JetBrains 等)集成,提供 AI 驱动的结对编程、调试和多文件代码编辑功能。凭借在 SWE-bench 上 72.5% 的成绩,Claude Code 被认为是市场上最强大的编程助手之一。该产品迅速获得市场认可,到 8 月已产生超过 5 亿美元的年化收入,三个月内使用量增长超过 10 倍。
7 月
英伟达成为全球首家市值突破 4 万亿美元的公司
7 月 10 日,英伟达收盘市值首次突破 4 万亿美元大关,成为史上第一家达到这一里程碑的上市公司。在 AI 芯片需求持续火爆的推动下,英伟达的市值此时已超过英国所有上市公司的总和。从 2023 年 6 月的 1 万亿美元,到 2024 年 2 月的 2 万亿美元、6 月的 3 万亿美元,英伟达仅用了约一年时间就实现了市值的四倍增长。
8 月
OpenAI 发布 GPT-5,整合推理与通用能力
8 月 7 日,OpenAI 通过直播活动正式发布了 GPT-5。这是继 GPT-4 之后的第五代生成式预训练变换器模型,首次将推理能力与非推理功能整合到统一接口中。发布时,GPT-5 在数学(AIME 2025 达 94.6%)、编程(SWE-bench Verified 达 74.9%)、多模态理解等多项基准测试中达到最先进水平。据 OpenAI 表示,GPT-5 的响应速度更快、编程和写作能力更强、健康问题回答更准确、幻觉率也大幅降低。然而,部分用户反映 GPT-5 的语气较 GPT-4o 显得 "平淡" 和 "缺乏创意",OpenAI CEO 阿尔特曼随后表示将优化模型的个性化表现。
8 月
OpenAI 发布首个开源模型 GPT-OSS,应对中国开源浪潮
8 月 5 日,在 GPT-5 发布前两天,OpenAI 发布了 GPT-OSS,这是自 2019 年 GPT-2 以来该公司首次发布开放权重模型。阿尔特曼在后来的采访中承认,来自中国开源模型(尤其是 DeepSeek)的竞争影响了这一决定,他表示:"很明显,如果我们不这样做,世界将主要建立在中国的开源模型之上。" 这标志着 OpenAI 战略方向的重大转变。
9 月
Anthropic 完成 130 亿美元融资,估值跃升至 1830 亿美元
9 月 2 日,Anthropic 宣布完成 130 亿美元 F 轮融资,投后估值达 1830 亿美元,较 3 月估值增长近三倍。本轮融资由 ICONIQ 领投,富达和 Lightspeed 联合领投,Altimeter、General Catalyst、Coatue 等参与。公司表示,年化收入已从年初的约 10 亿美元飙升至 8 月的超过 50 亿美元,成为史上增长最快的科技公司之一。Anthropic 服务超过 30 万企业客户,包括 Netflix、Spotify、Salesforce 等知名企业。
10 月
英伟达成为全球首家市值突破 5 万亿美元的公司
10 月 29 日,英伟达股价上涨超过 3%,收盘市值突破 5 万亿美元,成为人类历史上首家达到这一里程碑的公司。从 4 万亿到 5 万亿,英伟达仅用了约三个月时间。当天,特朗普总统表示将与黄仁勋讨论 Blackwell 芯片对华出口事宜,为股价注入额外动力。英伟达 CEO 黄仁勋在此前一天披露,公司已获得 5000 亿美元的芯片订单,并宣布与诺基亚合作开发 6G 技术、与 Uber 合作开发自动驾驶汽车。此时,英伟达的市值已超过除美国和中国以外所有国家的 GDP。
11 月
谷歌发布 Gemini 3,开启智能新时代
11 月,谷歌发布了 Gemini 3,这是其有史以来最强大的 AI 模型。据报道,Gemini 3 Pro 的发布让 OpenAI 进入 "红色警戒" 状态,该模型迅速占据 AI 排行榜榜首位置。在 LMArena 排行榜前 10 名中,谷歌独占 4 席,是表现最好的公司;OpenAI 唯一进入前 10 的模型排名第 8。Gemini 3 被引入 Google 搜索的 AI 模式,标志着首次在发布当天就将最新模型应用于搜索产品。谷歌还宣布在德克萨斯州投资 400 亿美元用于 AI 和云基础设施建设。
11 月
谷歌宣布 400 亿美元德克萨斯州 AI 基础设施投资
11 月,谷歌和 Alphabet CEO 桑达尔・皮查伊与德克萨斯州州长格雷格・阿博特共同宣布了 400 亿美元的 AI 和云基础设施投资计划。这是谷歌 2025 年 AI 投资推进计划的收官之作,该计划旨在释放经济机遇、推进科学突破,投资范围覆盖美洲、欧洲、非洲和亚太地区。计划还包括培训 10 万名电气工人和创造 3 万个新学徒岗位的美国劳动力发展计划。
12 月
特朗普政府允许英伟达 H200 芯片出口中国
12 月,特朗普总统宣布允许英伟达向中国出口 H200 芯片,但需向美国财政部缴纳 15% 的销售收入作为费用。这是继禁止最先进 Blackwell 芯片出口后的政策调整。H200 是英伟达上一代 Hopper 架构中最强大的 AI 芯片,其性能约为中国国产最先进加速器的 2-3 倍。消息传出后,阿里巴巴、字节跳动等中国科技巨头立即联系英伟达下单,据报道订单量已达 200 万片,远超英伟达当前 70 万片的库存。英伟达已开始与台积电协商增加 H200 产能。
12 月
谷歌发布 Gemini 3 Flash,以速度和效率取胜
12 月 17 日,谷歌发布了 Gemini 3 Flash,这是其旗舰模型的更高效、更经济版本,旨在帮助用户更快速地处理复杂查询。Gemini 3 Flash 将取代 Gemini 应用中的 2.5 Flash,并成为 Google 搜索 AI 模式的默认模型。该模型结合了前沿模型的速度与改进的推理能力,为博士级推理能力提供了堪比大型模型的表现,同时在多模态理解方面实现了重大飞跃。















