标签 Meta Llama 下的文章

2025 人工智能大事件回顾

科技巨头篇

-2025 Annual Major Events-

1 月

中国 DeepSeek 发布 R1 推理模型，震动全球 AI 市场

1 月 20 日，中国 AI 初创公司 DeepSeek 发布了开源推理模型 DeepSeek-R1，宣称其性能与 OpenAI 的 o1 模型相当，但训练成本仅为约 600 万美元 —— 远低于 OpenAI GPT-4 约 1 亿美元的训练成本。该模型采用 MIT 许可证开源发布，引发全球科技界震动。1 月 27 日，DeepSeek 的消息导致英伟达市值单日蒸发约 6000 亿美元，创下美国公司史上最大单日市值损失纪录。DeepSeek 证明了即使在美国芯片出口限制下，中国仍能开发出具有竞争力的 AI 模型，这一事件也推动了开源 AI 模型的发展浪潮。

2 月

特朗普宣布 Stargate 项目，5000 亿美元投资 AI 基础设施

1 月 21 日，美国总统特朗普在白宫宣布了名为 "Stargate" 的 AI 基础设施投资计划。该项目由 OpenAI、软银和甲骨文联合发起，计划在四年内投资高达 5000 亿美元，用于在美国建设 AI 数据中心。软银 CEO 孙正义担任项目主席，OpenAI 负责运营。项目首批 1000 亿美元将立即投入使用，首个数据中心已在德克萨斯州阿比林开工建设。特朗普称这是 "史上最大的 AI 基础设施项目"，将创造超过 10 万个美国就业机会。马斯克对此表示质疑，声称 "他们实际上没有这笔钱"，但 OpenAI CEO 阿尔特曼进行了反驳。

3 月

Anthropic 完成 35 亿美元融资，估值达 615 亿美元

3 月 3 日，Anthropic 宣布完成 35 亿美元融资，投后估值达到 615 亿美元。本轮融资由 Lightspeed Venture Partners 领投，Salesforce Ventures、思科投资、富达等机构参与。Anthropic 由前 OpenAI 高管创立，其 Claude AI 助手已成为 ChatGPT 和 Google Gemini 的主要竞争对手。截至年初，公司年化收入已达 10 亿美元。融资将用于推进下一代 AI 研发，特别是在机制可解释性和对齐研究领域。

3 月

谷歌发布 Gemini 2.5，引入 "思考" 能力

3 月 25 日，谷歌发布了其最智能的 AI 模型 Gemini 2.5，首个版本为 Gemini 2.5 Pro 实验版。这是谷歌首款具备 "思考" 能力的模型，能够在回答前进行推理过程，在数学、科学、编程等领域的基准测试中达到最先进水平，并在 LMArena 排行榜上以显著优势位居第一。

4 月

Meta 发布 Llama 4 系列模型，首次采用 MoE 架构

4 月 5 日（周六），Meta 发布了全新的 Llama 4 模型系列，包括 Llama 4 Scout 和 Llama 4 Maverick，以及仍在训练中的 Llama 4 Behemoth。这是 Llama 系列首次采用混合专家（MoE）架构和原生多模态设计。Scout 拥有 17B 活跃参数、109B 总参数和 10M token 上下文窗口；Maverick 同样拥有 17B 活跃参数，但总参数达 400B，拥有 128 个专家。Meta 声称其教师模型 Behemoth（约 2 万亿参数）在 STEM 基准测试中超越了 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。当被问及为何选择周六发布时，CEO 扎克伯格简单回应：“准备好了就发了。”

5 月

Anthropic 正式发布 Claude Code，编程助手市场爆发

5 月，Anthropic 正式发布了 Claude Code 开发工具，专为软件工程师设计。该工具通过命令行和编辑器插件（VS Code、JetBrains 等）集成，提供 AI 驱动的结对编程、调试和多文件代码编辑功能。凭借在 SWE-bench 上 72.5% 的成绩，Claude Code 被认为是市场上最强大的编程助手之一。该产品迅速获得市场认可，到 8 月已产生超过 5 亿美元的年化收入，三个月内使用量增长超过 10 倍。

7 月

英伟达成为全球首家市值突破 4 万亿美元的公司

7 月 10 日，英伟达收盘市值首次突破 4 万亿美元大关，成为史上第一家达到这一里程碑的上市公司。在 AI 芯片需求持续火爆的推动下，英伟达的市值此时已超过英国所有上市公司的总和。从 2023 年 6 月的 1 万亿美元，到 2024 年 2 月的 2 万亿美元、6 月的 3 万亿美元，英伟达仅用了约一年时间就实现了市值的四倍增长。

8 月

OpenAI 发布 GPT-5，整合推理与通用能力

8 月 7 日，OpenAI 通过直播活动正式发布了 GPT-5。这是继 GPT-4 之后的第五代生成式预训练变换器模型，首次将推理能力与非推理功能整合到统一接口中。发布时，GPT-5 在数学（AIME 2025 达 94.6%）、编程（SWE-bench Verified 达 74.9%）、多模态理解等多项基准测试中达到最先进水平。据 OpenAI 表示，GPT-5 的响应速度更快、编程和写作能力更强、健康问题回答更准确、幻觉率也大幅降低。然而，部分用户反映 GPT-5 的语气较 GPT-4o 显得 "平淡" 和 "缺乏创意"，OpenAI CEO 阿尔特曼随后表示将优化模型的个性化表现。

8 月

OpenAI 发布首个开源模型 GPT-OSS，应对中国开源浪潮

8 月 5 日，在 GPT-5 发布前两天，OpenAI 发布了 GPT-OSS，这是自 2019 年 GPT-2 以来该公司首次发布开放权重模型。阿尔特曼在后来的采访中承认，来自中国开源模型（尤其是 DeepSeek）的竞争影响了这一决定，他表示："很明显，如果我们不这样做，世界将主要建立在中国的开源模型之上。" 这标志着 OpenAI 战略方向的重大转变。

9 月

Anthropic 完成 130 亿美元融资，估值跃升至 1830 亿美元

9 月 2 日，Anthropic 宣布完成 130 亿美元 F 轮融资，投后估值达 1830 亿美元，较 3 月估值增长近三倍。本轮融资由 ICONIQ 领投，富达和 Lightspeed 联合领投，Altimeter、General Catalyst、Coatue 等参与。公司表示，年化收入已从年初的约 10 亿美元飙升至 8 月的超过 50 亿美元，成为史上增长最快的科技公司之一。Anthropic 服务超过 30 万企业客户，包括 Netflix、Spotify、Salesforce 等知名企业。

10 月

英伟达成为全球首家市值突破 5 万亿美元的公司

10 月 29 日，英伟达股价上涨超过 3%，收盘市值突破 5 万亿美元，成为人类历史上首家达到这一里程碑的公司。从 4 万亿到 5 万亿，英伟达仅用了约三个月时间。当天，特朗普总统表示将与黄仁勋讨论 Blackwell 芯片对华出口事宜，为股价注入额外动力。英伟达 CEO 黄仁勋在此前一天披露，公司已获得 5000 亿美元的芯片订单，并宣布与诺基亚合作开发 6G 技术、与 Uber 合作开发自动驾驶汽车。此时，英伟达的市值已超过除美国和中国以外所有国家的 GDP。

11 月

谷歌发布 Gemini 3，开启智能新时代

11 月，谷歌发布了 Gemini 3，这是其有史以来最强大的 AI 模型。据报道，Gemini 3 Pro 的发布让 OpenAI 进入 "红色警戒" 状态，该模型迅速占据 AI 排行榜榜首位置。在 LMArena 排行榜前 10 名中，谷歌独占 4 席，是表现最好的公司；OpenAI 唯一进入前 10 的模型排名第 8。Gemini 3 被引入 Google 搜索的 AI 模式，标志着首次在发布当天就将最新模型应用于搜索产品。谷歌还宣布在德克萨斯州投资 400 亿美元用于 AI 和云基础设施建设。

11 月

谷歌宣布 400 亿美元德克萨斯州 AI 基础设施投资

11 月，谷歌和 Alphabet CEO 桑达尔・皮查伊与德克萨斯州州长格雷格・阿博特共同宣布了 400 亿美元的 AI 和云基础设施投资计划。这是谷歌 2025 年 AI 投资推进计划的收官之作，该计划旨在释放经济机遇、推进科学突破，投资范围覆盖美洲、欧洲、非洲和亚太地区。计划还包括培训 10 万名电气工人和创造 3 万个新学徒岗位的美国劳动力发展计划。

12 月

特朗普政府允许英伟达 H200 芯片出口中国

12 月，特朗普总统宣布允许英伟达向中国出口 H200 芯片，但需向美国财政部缴纳 15% 的销售收入作为费用。这是继禁止最先进 Blackwell 芯片出口后的政策调整。H200 是英伟达上一代 Hopper 架构中最强大的 AI 芯片，其性能约为中国国产最先进加速器的 2-3 倍。消息传出后，阿里巴巴、字节跳动等中国科技巨头立即联系英伟达下单，据报道订单量已达 200 万片，远超英伟达当前 70 万片的库存。英伟达已开始与台积电协商增加 H200 产能。

12 月

谷歌发布 Gemini 3 Flash，以速度和效率取胜

12 月 17 日，谷歌发布了 Gemini 3 Flash，这是其旗舰模型的更高效、更经济版本，旨在帮助用户更快速地处理复杂查询。Gemini 3 Flash 将取代 Gemini 应用中的 2.5 Flash，并成为 Google 搜索 AI 模式的默认模型。该模型结合了前沿模型的速度与改进的推理能力，为博士级推理能力提供了堪比大型模型的表现，同时在多模态理解方面实现了重大飞跃。

📌 转载信息

来源：
https://linux.do/t/topic/1416861

原作者：
wilsons

转载时间：
2026/1/7 18:57:08

标签 Meta Llama 下的文章

2025 人工智能大事件回顾丨科技巨头篇

最新文章

最近回复

分类

归档

其它