标签 自动驾驶 下的文章

前言

注:文中所说观点,系个人胡扯观点。观看如有不适,既可私信阿甘本人删文。

星球同学提问

halo甘哥,想问问

1⃣️双非本适合走自动驾驶的开发方向吗

2⃣️如果想去一个比较知名的车企实习,开发岗如果进不去,投系统研发怎么样。往智能座舱、网关开发、ota或者自动驾驶的中间件深耕的话,会不会35岁之后还能混口饭吃捏

(感觉算法岗招挺多的,论能力和压力感觉还是会吃不消。)

感谢甘哥!!

阿甘回答

双非本走智驾还是难度比较大, 概率极其的小。

像国内智驾比较好的公司无非就是:

卖智驾服务的公司:华为、moment、大疆还有其他等

以及车企自研的

然后针对发展,薪资,年终,福利来说,个人认为能去像这种卖智驾服务的,还是别去那些车企自研的

为什么呢,我们可以想一想。

研发智驾,需要招聘大量的人才,需要大量的研发成本。像自研的这种车企,那它的利润哪里来的,无非就是自家车的销量。

一旦自家车的销量不好,企业现金池减少,研发成本就需要降本增效了。可以理解成,就是智驾的研发成本都分摊在自家销售的每一台车上。高度依赖自己的销量,成本不能分散,有种梭哈的意味

而像华为这种卖服务的呢,不断的向各个车企打单,研发成本分撒在各个车企的销量上,这种风险就会小很多,成功的概率就很大,个人收益就会很明显。

那能不能搞智驾的,就看自己感觉这学历能进去像moment,大疆这样的公司吗

智能座舱,以及新能源整体怎么说呢。目前个人不是特别推荐的,也可能是自己以前也在里面工作过,深刻感觉到这行在逐渐走向末落的。

你可以去看看汽车的一些报告,市场渗透率几乎都不增长了,这行工程师应该目前上百万了吧,极具内卷。

你看看某来年终奖能有多少呢?今年好像某想的也不太行。

智能座舱里的网络开发方向,可以看看星球网络知识的总结,以及那个智能网络检测项目,以及安卓里网络部分代码。基本工作就是这套技术栈。

35岁能不能混口饭吃,这个想的太长远了,没有意义。先想想怎么毕业能找到一个高薪的好工作,然后在工作中怎么快速涨薪把自己的base提升上来吧

本文由mdnice多平台发布

从训练到推理:智算需求正在经历一场结构性转向

过去一年,如果仅从“算力需求增长”来理解中国智算产业的变化,显然是不够的。

 

在 2026 年 1 月 21 日举办的金山云年度 Tech Talk 上,金山云对其过去一年智算业务的演进进行了系统性回顾。从公开财报数据到客户侧真实使用情况,这些信息拼凑出了一幅更清晰的图景:智算需求并非简单放量,而是在训练、推理、应用形态和工程方式等多个层面同时发生结构性变化

 

这场变化的核心,不再只是“谁拥有更大规模算力”,而是围绕模型如何被使用、Token 如何被消耗、算力如何被组织展开。

 

变化首先体现在财务数据上。

 

根据金山云披露的公开财报,其智算云业务在过去一年实现了高速增长。以 2025 年第三季度为例,智算云账单收入达到 7.8 亿元人民币,同比增长接近 120%。这一数据并非孤立,而是延续了此前多个季度的增长趋势,显示智算已成为金山云收入结构中的重要组成部分。

 

金山云高级副总裁刘涛在分享中提到了金山云对这一趋势的判断:智算需求的增长重心,正在从训练侧逐步向推理侧转移。

 

从训练视角看,过去几年国内智算需求的主要推动力,来自少数对算力高度敏感的行业。

 

自动驾驶与具身智能,是其中最典型的代表。这些行业往往需要长期训练模型,并处理视频、点云、传感器等海量多模态数据。在早期阶段,它们对算力的需求更多集中在训练规模本身。

 

但与通用大模型不同,这类行业模型并不一味追求参数规模最大化。刘涛在分享中指出,自动驾驶和具身智能模型在训练阶段,对算力密度的要求并不极端,但对显存容量和数据处理能力要求更高。

 

这意味着,它们对算力平台的诉求,正在从“算力数量”转向“系统能力”——包括数据接入、预处理、多模态调度以及训练全流程的工程化效率。

 

推理侧的变化更加显著。

 

如果说训练侧的变化仍然是渐进的,那么推理侧的变化则更为直接和激烈。

 

一个被反复引用的数据,来自火山引擎在其公开发布会上的披露:平台每日 Token 调用量已达到 50 万亿级别。这是当前国内少数被明确对外公布的 Token 规模数据之一,也成为行业理解推理负载的重要参考。

 

与此同时,多个面向大众或企业的模型产品正在持续扩大推理需求。例如豆包、通义千问以及近期加大投入的腾讯元宝,都在不同程度上推动 Token 消耗快速增长。

 

这些产品并不完全运行在同一云平台上,但它们共同指向一个事实:推理阶段正在成为智算需求增长的主要来源,且这种增长具备明显的外溢性。

 

在所有推理场景中,编程类应用被反复强调。

 

刘涛指出,2025 年一个尤为显著的变化在于:编程相关请求正在成为 Token 消耗的主力场景之一。这一判断并非孤立,而是与海外模型使用结构的统计结果高度一致。

 

“Vibe Coding”成为一个关键词。一个广为流传的事实是,Claude Code 的大量代码本身,正是由 Claude Code 参与生成的。这意味着模型不再只是辅助工具,而是深度介入软件生产过程。

 

从全球 Token 调用结构来看,编程类请求在多家模型服务商中长期占据最高比例。金山云也观察到了同样的趋势:代码生成、重构和理解能力的提升,正在显著改变程序员的工作方式,并直接放大推理侧算力需求。

 

在具体应用层面,互联网客户仍然是智算需求的重要来源,但其需求形态已经发生变化。刘涛提到,当前互联网场景呈现出三个明显特征:

 

其一,多模态需求显著增长。视频生成、视频理解以及复杂推理任务,带动了训练与推理负载的持续上升;

其二,模型参数规模不再单向膨胀,而是围绕具体任务进行结构性调整;

其三,Vibe Coding 在头部互联网公司中已较为普及,使用更强的商用模型进行代码开发,正在成为常态。

 

这些变化意味着,互联网客户对智算平台的期待,已经从“算力服务”升级为对模型生命周期管理和工程体系的整体依赖。

 

为了满足更多元化的需求,刘涛表示,2025 年,智算平台金山云星流已完成从资源管理平台向一站式 AI 训推全流程平台的战略升级。从训推平台、机器人平台到模型 API 服务,升级后的金山云星流平台构建了从异构资源调度、训练任务故障自愈到机器人行业应用支撑、模型 API 服务商业化落地的全链路闭环。

实现三维进阶,智算云 AI 势能全释放

 

尽管各行各业大规模应用 AI 还处于早期探索阶段,但定位行业助力者的金山云,多年来持续打磨全栈 AI 能力。从 2023 年的智算网基础设施,到 2024 年智算云的平台化和 Serverless 化,再到 2025 年的一站式 AI 训推全流程平台,通过提升平台效率、突破行业边界、加速推理布局,金山云为迎接 AI 应用爆发做好了充分准备。

 

在平台效率方面,金山云星流训推平台提供从模型开发、训练到推理的完整生命周期管理,具备开发、训练、推理和数据处理四大模块能力,通过降低多模块协同复杂度,能实现“开箱即用”的 AI 开发体验。自研的 GPU 故障自愈技术结合任务可观测性设计,可实时监控硬件健康状态与任务进程,自动触发故障迁移与任务重调度,降低算力中断风险,保障长周期训练任务稳定运行。

 

作为面向机器人开发与落地的全链路云原生平台,金山云星流机器人平台深度融合数据采集、存储、标注、模型开发、训练、部署与仿真等核心环节,打造具身场景专属的数据、模型、仿真一体化引擎。平台率先实现具身智能数据工程领域采集、标注、管理的全链路闭环,可高效服务具身智能行业模型训练、仿真应用场景分析等核心需求,助力客户快速完成从算法研发到真实场景部署的全流程落地,最终推动机器人产业的智能化升级。

 

面向大模型应用开发者和企业用户,金山云星流平台模型 API 服务提供高可用、易集成的模型调用与管理能力,覆盖模型调用的全生命周期。该服务支持高并发推理与多模型管理,能够帮助用户高效接入多种模型资源,助力大模型应用落地。目前,金山云星流平台模型 API 服务已积累诸多行业客户。

 

同时,金山云星流平台的模型生态也在持续丰富。目前,平台已支持近 40 种不同模型,包括 DeepSeek、Xiaomi MiMo、Qwen3、Kimi 等。客户通过一站式访问,即可高效接入多种模型,在畅享稳定高效云服务的同时,更加聚焦 AI 业务创新和价值创造。

摘要​:若说 2023 年是生成式 AI 的概念启蒙年,2026 年则正式开启了人工智能的“应用元年”与“价值兑现年”。这一年,大模型技术从参数竞赛迈入能力沉淀期,NSP 范式推动 AI 实现从“预测文本”到“理解世界”的认知跨越,具身智能、多智能体系统从实验室走向产业实景,资本市场对 AI 企业的估值逻辑从“技术故事”转向“落地能力”。本文立足 2026 年 AI 产业爆发的核心特征,深度解析技术范式变革的底层逻辑,拆解工业、金融、医疗、出行等领域的商业化落地场景,探讨 AI 对社会生产生活的重构影响,梳理技术落地中的伦理与安全挑战,并结合行业实践给出企业与个人的适配策略,最后通过高频 QA 问答解答核心困惑,为把握 AI 元年的发展机遇提供全景式参考。

关键词​:2026 AI 元年;NSP 范式;具身智能;多智能体系统;AI 商业化落地;自动驾驶;智能体协作;AI 伦理规范

一、为何是 2026?AI 元年的三大核心支撑

“元年”的界定,从来不是单一技术的突发突破,而是技术成熟度、产业需求度与生态完备度的三重共振。2026 年之所以能成为公认的 AI 元年,核心源于三个关键临界点的全面突破,让人工智能彻底告别“实验室阶段”,迈入规模化产业应用的全新周期。

1.1 技术临界点:从“文本预测”到“世界理解”的认知跃迁

北京智源人工智能研究院发布的《2026 十大 AI 技术趋势》明确指出,AI 发展的核心转变已从“预测下一个词(NTP 范式)”迈向“预测世界状态(NSP 范式)”。这一技术范式的革新,让 AI 首次具备了理解物理世界规律的能力,实现了从“感知”到“认知”的本质跨越。不同于传统语言模型仅能生成连贯文本,基于 NSP 范式的世界模型通过多模态数据统一编码,可自主学习物理动态、时空连续性与因果关系,形成“理解-预测-规划”的完整认知闭环。

2026 年,这一技术突破已形成规模化应用基础:海外 OpenAI 的 Sora 2 展现出对真实世界的深度模拟能力,World Labs 的 RTFM 模型可从单幅图像创建 3D 空间;国内智源悟界·Emu3.5 成为 NSP 范式的标杆,蚂蚁百灵大模型在多模态生成、方言识别领域已逼近 GPT-5 水平。这种“世界模拟器”级别的能力,为 AI 从数字空间渗透至物理世界提供了核心技术底座。

1.2 成本临界点:推理成本骤降催生规模化应用

技术普及的前提是成本可控。相比 2023 年,2026 年大模型的 Token 推理成本下降了 99% 以上,这一“摩尔定律式”的成本锐减,让 AI 部署从“高成本试点”变为“全场景可行”。无论是企业级的复杂流程优化,还是个人端的微小服务需求(如自动整理发票、智能回复评论),都具备了经济可行性。

成本下降的背后,是算力架构优化与技术迭代的双重驱动:一方面,专用 AI 芯片的量产降低了硬件门槛;另一方面,模型轻量化技术的突破的,让中小微企业无需搭建高算力集群,通过调用公有云 API 即可享受高阶 AI 能力。成本的“亲民化”,为 AI 元年的全面爆发扫清了最关键的商业障碍。

1.3 生态临界点:资本理性回归与产业需求共振

2026 年初,港股市场的 AI 企业上市潮成为行业转折的重要注脚:智谱 AI 以“全球通用大模型第一股”身份登陆港交所,1164 倍超额认购、首日 528 亿港元市值;仅隔一天,MiniMax 接力挂牌,1837 倍超额认购、盘中涨幅超 109%、市值破千亿港元。短短 48 小时,两家头部企业募资近百亿港元,市值总和逼近 1700 亿港元,这场资本盛宴的背后,是市场对 AI 产业价值的集体押注。

更重要的是,资本逻辑已从“盲目追逐参数规模”转向“聚焦技术落地能力”。与此同时,产业端的需求已进入“爆发期”:全球 AI 市场规模从 2025 年的 7575.8 亿美元增至 9000 亿美元,同比增长 18.7%;国务院“人工智能 +”行动将 AI 定位为新型工业化“必答题”,工业、金融、医疗等领域的智能化需求迫切。资本理性与产业需求的精准对接,构成了 AI 元年的生态基础。

二、AI 元年的核心技术突破:重构智能的底层逻辑

2026 年的 AI 技术突破,不再是单一维度的参数提升,而是从架构设计、能力形态到协作模式的全方位重构,催生出一系列具备“工业化稳定性”的智能形态,为商业化落地提供了多元化支撑。

2.1 NSP 范式主导:AI 成为“世界规律的探索者”

NSP(Next-State Prediction)范式的普及,是 2026 年 AI 技术变革的核心标志。这一范式让 AI 从“文字游戏”升级为“世界模拟器”,其核心价值在于让模型具备了对物理世界的预测与规划能力。在自动驾驶领域,基于 NSP 范式的系统可通过模拟复杂路况,大幅降低实车测试成本;在机器人训练中,虚拟场景预训练让实体机器人的环境适应能力提升 50% 以上;在科研领域,AI 通过模拟分子运动,将新药研发周期从数年缩短至数月。

与传统 NTP 范式相比,NSP 范式的核心优势在于“因果推理能力”——不再是基于概率的文本生成,而是基于对世界规律的理解做出决策。这种能力升级,让 AI 从“辅助工具”向“决策主体”转变,成为 AI 元年技术价值爆发的核心引擎。

2.2 具身智能“出清期”:从技术演示到产业工具

经过 2025 年的“百机大战”,2026 年具身智能行业进入“出清期”:同质化企业因资金断裂或技术不足被淘汰,头部企业凭借订单优势与技术积累形成稳定格局。技术层面,“世界模型 + 强化学习”的闭环进化模式成为主流,智源发布的通用具身大脑 RoboBrain2.0 与小脑基座 RoboBrain-X0,实现了跨场景多任务的轻量化部署;海外 Tesla Optimus 2.5 已应用于工厂生产、农场运营等真实场景。

商业化方面,具身智能正式从“实验室验证”转向“量产交付”。智元、乐聚智能等企业推进上市进程,标志着这一领域已从“技术概念”走向“产业工具”。在工业制造的精密装配、服务业的个性化服务、医疗领域的辅助诊疗等场景,具身智能正逐步替代人工完成高难度、高重复性工作,成为实体产业智能化转型的核心抓手。

2.3 多智能体系统:标准化协议推动“协同作战”

面对日益复杂的任务需求,单智能体的能力天花板逐渐显现,多智能体系统(MAS)成为解决复杂问题的关键路径。2026 年,多智能体发展的核心突破是“协议标准化”——MCP 与 A2A 通信协议被捐赠给 Linux 基金会后实现分层融合,成为 Microsoft、Google 等巨头及 LangChain、AutoGen 等框架的原生支持协议,IBM 计划将 ACP 协议并入 A2A,推动行业标准统一。

协议的统一,让不同企业开发的智能体拥有了“通用语言”,能够跨平台协作完成复杂任务流。在金融领域,由风险评估智能体、投资分析智能体、客户服务智能体组成的团队,可协同完成全流程金融服务;在工业场景中,生产智能体、质检智能体、物流智能体形成协作网络,将全产业链效率提升 30% 以上。多智能体的“协同作战”模式,正在重构企业的生产运营逻辑。

2.4 确定性逻辑回归:AI 从“玩具”走向“生产力”

单纯依赖大模型的概率生成无法满足企业级需求,2026 年的主流架构已演变为“LLM(大脑)+ Code(肌肉)”的混合模式。通过 Python 等确定性代码约束大模型的“幻觉”,让 AI 应用具备了工业级的稳定性。这种确定性逻辑的回归,是 AI 从“娱乐工具”走向“核心生产力”的关键一步。

技术专家金加德指出,企业级应用对错误零容忍,大模型的本质是概率预测,存在幻觉风险,而确定性代码的引入,可为不可控的模型行为加上“护栏”。例如,在财务数据处理场景中,通过 Python 正则表达式精准提取关键信息,再由大模型进行分析总结,既保证了数据准确性,又发挥了模型的分析能力,实现了“精准性”与“智能化”的平衡。

三、AI 元年的商业化落地:ToC 与 ToB 的双轨爆发

技术突破的最终价值,需要通过商业化落地实现闭环。2026 年,AI 应用呈现“ToC 超级应用竞逐 +ToB 垂直突破”的双轨格局,经历早期概念验证的“幻灭期”后,真正可衡量的商业价值集中爆发,印证了 AI 元年的产业价值。

3.1 ToC 端:超级应用重构互联网流量格局

“All in One”的超级应用成为 C 端 AI 竞争的核心战场。这种以单一入口实现信息获取、任务规划、问题解决的闭环模式,依托高算力成本与庞大用户数据迭代,正在重塑互联网流量格局。2026 年,海外 ChatGPT、Gemini 日活均突破 1 亿,Gemini 已取代 Google Maps 原生语音助手,实现功能内化;国内市场同样热闹,蚂蚁“灵光”AI 助手上线 6 天下载量破 200 万,支持 30 秒生成小应用与全模态输出;字节豆包依托抖音生态引流,月活位居全球第二,仅次于 ChatGPT。

超级应用的竞争本质是生态整合能力的较量。字节跳动凭借短视频流量优势,将 AI 助手深度融入内容创作、社交互动、生活服务场景;阿里以千问 App 为核心,整合消费、支付、物流等电商生态资源;蚂蚁集团则依托金融科技优势,让“灵光”助手具备理财咨询、生活缴费、政务办理等复合功能。2026 年,超级应用已进入“生态闭环决战”阶段,能够实现跨场景无缝衔接、个性化精准服务的产品,将定义 AI 时代的“新 BAT”格局。

与此同时,垂直赛道成为中小玩家的突围机会。多模态、大健康、教育等高 ROI 领域呈现“低频高价值”特征,Google Nano Banana Pro 单次调用价格为文本模型的几十倍,但仅需 1.5% 调用量即可实现同等收入。国内,蚂蚁“蚂蚁阿福”健康 App 聚焦慢病管理、健康咨询等场景;MiniMax 的海螺 AI 深耕视频创作赛道,成为自媒体、设计师的必备工具;字节即梦 AI 在教育领域的个性化辅导功能,精准击中用户痛点。这些垂直应用凭借高用户粘性与强付费意愿,构建了可持续的盈利模式,成为 C 端 AI 商业化的重要补充。

3.2 ToB 端:垂直场景突破赋能产业转型

ToB 领域的 AI 落地,呈现“核心行业先行、全链路渗透”的特征,工业、金融、医疗、出行等领域成为 AI 价值兑现的核心阵地,推动产业智能化转型进入深水区。

在工业制造领域,“AI+ 制造”已从单点自动化升级为全流程智能化。通过部署生产智能体、质检智能体与物流智能体,企业实现了从原材料采购到成品交付的全链路优化。某汽车零部件企业引入多智能体协作系统后,生产效率提升 28%,不良率下降 40%,充分验证了 AI 对工业场景的赋能价值。

金融领域是 AI 落地的“高成熟度场景”。多智能体系统在风险评估、投资分析、客户服务等环节的应用,大幅提升了金融服务的效率与精准度。例如,某银行部署的智能风控系统,通过多智能体协同分析企业经营数据、行业趋势、市场风险,将不良贷款识别时间从 3 个月缩短至 1 周,识别准确率提升 55%。

医疗领域的 AI 应用则聚焦“精准诊疗”与“效率提升”。AI 辅助诊断系统通过分析医学影像、病历数据,可快速识别早期病灶,为医生提供精准参考;在新药研发领域,AI 通过模拟分子运动与药物作用机制,大幅缩短了研发周期、降低了研发成本,2026 年已有多款 AI 辅助研发的药物进入临床试验阶段。

出行领域的 L3 级自动驾驶商业化落地,成为 AI 元年的重要里程碑。2025 年底,中国首批 L3 级自动驾驶汽车获得专属牌照,正式从技术测试迈入“持证上路”阶段;2026 年初,元戎启行与国际头部主机厂达成 L3 级自动驾驶合作,力争 2026 年累计交付突破一百万辆。L3 级自动驾驶的核心突破在于责任主体的重构——在系统接管期间,驾驶责任由驾驶员转向系统,这一变化不仅考验技术稳定性,更推动了法规与产业生态的完善。元戎启行采用的 VLA 模型,通过引入语言模型具备“思维链”特点,可实现复杂的语义理解和长时序因果推理,全程可求导,让系统像老司机一样具备经验性判断能力。

四、AI 元年的挑战:技术狂欢背后的伦理与安全考题

AI 元年的全面爆发,不仅带来了技术突破与商业价值,也抛出了一系列伦理与安全考题。如何平衡技术创新与风险管控,成为 AI 可持续发展的关键前提,需要政府、企业与社会共同应对。

4.1 伦理困境:算法偏见与责任界定难题

算法偏见是 AI 落地的“隐性风险”。AI 模型的训练数据源于现实世界,若数据中存在性别、种族、地域等偏见,将导致模型输出带有歧视性的结果,在招聘、信贷、司法等场景中引发公平性问题。2026 年,随着 AI 应用的规模化,算法偏见问题逐渐显现,如何构建“公平、透明”的 AI 模型,成为企业需要解决的核心伦理课题。

责任界定难题则在高风险场景中尤为突出。以 L3 级自动驾驶为例,当系统接管期间发生交通事故,责任应归属驾驶员、车企还是 AI 系统开发商?目前,全球范围内的相关法规尚未形成统一标准,责任界定的模糊性,既影响了企业的技术推进节奏,也制约了消费者的接受度。

4.2 安全风险:数据泄露与系统失控隐患

数据安全是 AI 落地的“生命线”。AI 模型的训练与运行需要大量数据支撑,其中不乏企业商业机密与个人隐私数据。2026 年,多智能体系统的普及让数据流转路径更加复杂,若缺乏完善的权限管控与加密机制,将面临数据泄露、滥用的风险,违反《数据安全法》《个人信息保护法》等相关法规。

系统失控风险则是 AI 发展的“终极担忧”。随着 AI 自主决策能力的提升,尤其是多智能体协同系统的自主规划能力增强,若缺乏有效的“安全护栏”,可能出现超出人类预期的行为,引发安全事故。如何为 AI 系统设置“边界”,确保其始终在人类可控范围内运行,是全球 AI 领域的共同挑战。

4.3 社会影响:就业结构重构与数字鸿沟

AI 技术的规模化应用,必然带来就业结构的重构。重复性、标准化的工作岗位(如流水线工人、数据录入员、基础客服)将面临被 AI 替代的风险,而具备 AI 协作能力、创意能力、战略决策能力的岗位需求将大幅增加。这种结构性变化,需要劳动者提升自身技能以适应新的就业市场,也需要政府与企业共同推进职业培训体系的完善。

数字鸿沟问题也随之凸显。不同地区、不同群体对 AI 技术的掌握程度与应用能力存在差异,若缺乏有效的引导与扶持,可能导致部分群体被技术边缘化,加剧社会不平等。如何推动 AI 技术的普惠化应用,缩小数字鸿沟,是 AI 元年需要关注的社会议题。

五、AI 元年的适配策略:企业与个人的破局之道

面对 AI 元年的技术浪潮与产业变革,企业与个人需要主动适配、积极转型,才能把握发展机遇、规避潜在风险。无论是企业的技术落地,还是个人的职业发展,都需要建立全新的思维模式与能力体系。

5.1 企业适配策略:从“技术跟风”到“价值导向”

企业落地 AI 技术,应摒弃“盲目跟风”的心态,以“价值导向”为核心,从技术选型、场景适配、组织调整三个维度构建适配策略。

在技术选型上,中小企业无需盲目追求自建大模型,可通过调用公有云 API 或使用低代码智能体平台(如 Coze),低成本接入 AI 能力,优先选择标准化场景试点,验证价值后再逐步推广;大型企业可结合自身业务需求,进行定制化模型微调与多智能体系统搭建,构建核心技术壁垒。

在场景适配上,应遵循“先易后难、精准落地”的原则,优先选择痛点突出、数据基础好、ROI 高的场景(如金融风控、工业质检、客服优化),避免“为了 AI 而 AI”的无效投入。同时,要建立“AI+ 人工”的协同机制,在高风险场景中保留人工复核环节,确保安全可控。

在组织调整上,企业需要构建适配 AI 时代的组织架构与人才体系。一方面,通过培训提升现有员工的 AI 协作能力,让员工从重复性工作中解放,聚焦高价值任务;另一方面,引进具备 AI 架构设计、数据工程、业务理解能力的复合型人才,搭建专业的 AI 运营团队,支撑技术的持续落地与迭代。

5.2 个人适配策略:从“技能竞争”到“能力重构”

面对 AI 带来的职业变革,个人需要跳出传统的“技能竞争”思维,从三个维度重构自身能力体系,成为 AI 时代的“不可替代者”。

第一,掌握“胶水语言”能力。Python 作为 AI 时代的通用语,其核心价值不在于写底层算法,而在于数据清洗和逻辑兜底。即使是非技术岗位,掌握基础的 Python 技能,也能提升与 AI 协同工作的效率,例如用简单的脚本解决数据提取、格式转换等问题。

第二,培养“架构师思维”。不要沉迷于具体的工具使用,而要聚焦数据流的设计与问题的定义。能够清晰梳理业务流程、识别核心痛点,并将其映射为 AI 系统的工作流,这种架构设计能力是 AI 时代的核心竞争力。

第三,建立“领域知识壁垒”。AI 可以生成通用内容、完成标准化任务,但缺乏对特定行业的深度理解与业务潜规则的把握。“懂 AI 的业务专家”将比“懂业务的 AI 专家”更具竞争力,深入理解所在行业的痛点与需求,用 AI 优化业务流程,才能构建真正的个人壁垒。

六、行业高频 QA 问答

6.1 2026 年被称为 AI 元年,和 2023 年的生成式 AI 热潮有什么本质区别?

核心区别在于“技术概念”与“商业价值”的落地差异:2023 年的生成式 AI 热潮以技术启蒙和概念验证为主,AI 更多是“娱乐工具”或“辅助工具”,商业化落地处于早期阶段,缺乏可规模化的盈利模式;2026 年的 AI 元年,技术已从参数竞赛迈入能力沉淀期,NSP 范式、具身智能、多智能体等技术实现产业化落地,ToC 超级应用与 ToB 垂直场景均实现商业价值兑现,资本逻辑从“追逐故事”转向“聚焦落地”,AI 正式成为推动产业转型的核心生产力。

6.2 中小微企业在 AI 元年如何低成本落地 AI 技术?

中小微企业无需投入大量资金自建大模型,可通过“轻量化接入、场景化试点”的方式低成本落地:1. 优先选择低代码/零代码智能体平台(如 Coze)或调用公有云 AI API(如文心一言、ChatGPT),降低技术接入门槛;2. 聚焦核心痛点场景(如客服优化、数据统计、文案生成),选择标准化插件或模板,避免定制化开发;3. 采用“小步快跑”的策略,先在单一场景试点验证价值,再逐步推广至其他场景,无需追求全流程覆盖;4. 依托现有员工进行技能升级,通过短期培训提升员工与 AI 协同工作的能力,无需盲目招聘专业 AI 人才。

6.3 L3 级自动驾驶在 2026 年商业化落地,普通消费者需要注意什么?

普通消费者需重点关注三个核心问题:1. 明确责任边界:L3 级自动驾驶仅在特定场景(如高速路、城市快速路)生效,系统接管期间责任由企业承担,但驾驶员需在系统发出接管请求时及时响应,否则仍需承担责任;2. 了解技术限制:目前 L3 级系统仍无法应对极端天气(如暴雨、暴雪)、复杂路况(如无标识道路、施工路段),需提前知晓系统的适用范围;3. 选择合规产品:购买搭载 L3 级自动驾驶的车辆时,需确认车辆已获得官方专属牌照,避免购买未合规的产品,保障自身权益。

6.4 普通职场人如何避免被 AI 替代,提升自身竞争力?

核心策略是“向上生长、向下扎根”:向上生长即提升架构设计能力和业务理解力,从“任务执行者”转变为“系统设计者”,聚焦 AI 无法替代的创意策划、战略决策、客户关系维护等高价值工作;向下扎根即掌握基础的 AI 协同能力,了解 AI 工具的使用方法,用 AI 提升工作效率,同时学习简单的 Python、数据处理等技能,为自身能力兜底。此外,建立跨领域知识体系,培养 AI 难以模拟的沟通协调、团队管理、应急处理能力,也是提升不可替代性的关键。

6.5 2026 年 AI 技术落地面临的最大挑战是什么,如何应对?

最大挑战是“伦理安全管控与商业价值平衡”:一方面,伦理安全问题(如算法偏见、数据泄露、责任界定)制约了 AI 的规模化落地;另一方面,企业需要快速实现商业价值以支撑技术持续投入。应对策略需多方协同:政府层面应加快完善 AI 相关法规与标准,明确责任界定、规范数据使用;企业层面需建立“伦理先行”的研发理念,将安全管控嵌入 AI 系统全生命周期,同时聚焦高 ROI 场景实现价值闭环;社会层面应加强 AI 伦理教育,提升公众对 AI 风险的认知,形成多方共治的格局。

七、结论

2026 年,AI 元年的开启,标志着人工智能从技术狂欢迈入价值共生的全新阶段。NSP 范式的突破让 AI 读懂世界,具身智能与多智能体系统让 AI 走进现实,成本下降与生态完善让 AI 规模化落地成为可能。ToC 超级应用与 ToB 垂直场景的双轨爆发,正在重构产业格局与生活方式,印证了 AI 作为核心生产力的巨大价值。

同时,我们也需清醒认识到,AI 元年并非技术的终点,而是全新的起点。伦理安全挑战、就业结构重构、数字鸿沟等问题,需要政府、企业与社会共同应对。对于企业而言,唯有坚持价值导向、精准落地场景,才能在 AI 浪潮中把握机遇;对于个人而言,唯有主动重构能力体系、与 AI 协同共生,才能实现自我价值的提升。

2026 AI 元年,不仅是技术变革的里程碑,更是人类社会迈向智能时代的重要转折点。在技术创新与风险管控的平衡中,在商业价值与社会价值的统一中,AI 将逐步融入经济社会的每一个角落,推动人类文明迈向更高质量的发展阶段。拥抱 AI、适配 AI、引领 AI,将成为这一时代的核心主题。

八、参考文献

[1] 科技云报到. 2026,AI 开启“共生智能”新纪元[EB/OL]. 2026-01-19.

[2] 金加德. 2026,AI 应用元年——技术人如何跨越“模型”与“落地”的鸿沟[EB/OL]. 阿里云开发者社区, 2026-01-20.

[3] 华夏时报. L3 级自动驾驶商业化落地再提速,元戎启行:2026 年力争累计交付突破一百万辆[EB/OL]. 2026-01-16.

[4] Universitas Muhammadiyah Sidoarjo Repository. Artificial Intelligence in 2026: Predicting Breakthroughs and Challenges[R]. 2026.

[5] 北京智源人工智能研究院. 2026 十大 AI 技术趋势[R]. 2026.

[6] 国务院. 人工智能 + 行动实施方案[Z]. 2025.

摘要
随着自动驾驶技术从原型验证迈向规模化商用,研发范式正经历从“以算法为中心”向“以数据为中心”的根本性转变。海量、高维、多模态的道路采集数据,已不再只是测试过程中的副产物,而是驱动算法持续演进、提升系统安全冗余和泛化能力的核心生产资料。

然而,当前主流的数据处理模式仍以离线存储与批处理为主,数据在“采集—上传—存储—筛选—标注—训练—验证”之间流转缓慢,形成长周期、低反馈的闭环,逐渐成为制约自动驾驶技术迭代效率的重要瓶颈。

Redis 企业版作为一款面向实时与 AI 场景设计的数据平台,凭借其多模型数据结构、亚毫秒级访问延迟、内存计算能力以及 AI 原生扩展机制,为构建新一代“实时数据加速层”与“智能数据筛选平台”提供了坚实的技术基础。

本方案系统性阐述如何基于 Redis 企业版,完成从“数据存储与归档”向“数据理解与智能利用”的跃迁,构建一个能够加速算法创新、提升数据利用率、并在可控成本下实现规模扩展的自动驾驶数据闭环体系。


一、行业趋势与核心技术挑战
自动驾驶系统的成熟度,本质上取决于其数据闭环运行的效率与质量。当前行业普遍面临以下三类挑战:

1.数据规模爆炸与实时性不足
搭载多颗高分辨率摄像头、激光雷达、毫米波雷达与高精定位模块的测试车辆,在真实道路运行中每日可产生 TB 级甚至更高规模的原始数据。
在传统架构下,这些数据往往需要经过集中上传、对象存储落盘、离线处理后,才能被算法与标注团队使用,数据延迟以小时甚至天为单位,难以支撑高频、小步快跑式的算法迭代。

2.高价值“长尾场景”难以被及时发现
真正推动自动驾驶算法性能跃迁的,并非大量常规驾驶场景,而是占比极低却风险极高的长尾与极端场景(Corner Cases),例如:

  • 恶劣天气下的感知退化
  • 非标准交通参与者行为
  • 复杂施工、事故或临时交通组织变化
    在 PB 级数据湖中依赖人工回看或静态规则筛选这些场景,不仅效率低下,且高度依赖经验,成为研发效率的主要瓶颈之一。

3.多模态异构数据协同困难
自动驾驶数据闭环涉及多种数据形态:

  • 非结构化数据:视频、点云
  • 结构化数据:车辆 CAN / 传感器状态
  • 半结构化数据:标注信息、事件日志
  • 模型与版本元数据
    在传统“多系统拼装式”架构下,这些数据分散在对象存储、关系型数据库、搜索系统和消息队列中,跨模态联合查询与关联分析复杂且成本高昂,制约了数据价值的进一步释放。

二、Redis 企业版的核心价值定位
Redis 企业版并非仅用于缓存加速,而是一个面向实时数据与智能应用的统一数据平台(Real-Time Data Platform),在自动驾驶数据闭环中具备独特优势。

1.高吞吐、低延迟的数据流转能力
Redis 的内存计算架构可提供亚毫秒级读写延迟,适合承载高并发、高频率的数据流。

  • Redis Streams 提供持久化、有序的数据流模型与消费者组机制,可用于构建可靠的数据接入与分发管道
  • 在部分自动驾驶数据采集与处理场景中,Streams 可作为传统消息系统的轻量化替代或补充,显著降低端到端延迟与系统复杂度(具体取舍需结合吞吐规模与历史回溯需求评估)

2.多模型数据的统一承载能力
Redis 企业版原生支持多种数据模型:

  • JSON:车辆状态、标注与任务元数据
  • TimeSeries:高频传感器与车辆运行状态
  • Geospatial:轨迹、地图要素与空间查询
  • Vector:场景特征、感知结果向量化表达
  • Graph:数据、模型、标注、测试之间的关系建模
    这些能力使多模态数据得以在同一高性能平台内协同存储与联合查询,显著降低系统集成复杂度。

3.面向 AI 的原生计算与推理能力
通过 RedisAI 模块,可将训练完成的深度学习模型(支持 TensorFlow、PyTorch、ONNX 等主流格式)直接部署在 Redis 集群中,实现:

  • 数据就地推理(In-Data Inference)
  • 特征提取与初步场景理解的实时执行
  • 减少数据在系统间搬运与序列化开销
    这为实时智能筛选、在线预标注等能力提供了关键技术支撑。

4. 企业级可靠性与数据韧性
Redis 企业版提供完善的企业级能力,包括:

  • 持久化机制(RDB + AOF)
  • 跨可用区 / 跨地域的 Active-Active 架构
  • 自动故障转移与在线扩缩容
    确保关键路采数据与生产级服务具备高可用性与业务连续性。

三、总体技术架构:自动驾驶数据闭环的“智能中枢”
下图展示了以 Redis 企业版为核心的自动驾驶实时数据与智能筛选平台总体架构。
image.png
架构要点说明

  • 数据接入与预处理:通过 Redis Streams 接收车辆数据流,结合 RedisGears 在入库阶段完成轻量 ETL、数据校验与初步特征生成
  • 智能存储与索引:

    • 高频状态数据驻留内存
    • 特征向量支持相似度搜索
    • 多条件混合查询(时间、空间、语义、向量)
  • 自动分层存储:通过 Redis 企业版 Auto Tiering,将历史数据透明下沉至 SSD,在性能与成本之间取得平衡

四、典型应用场景与业务价值
场景一:实时长尾场景发现与预警
通过在数据流入口部署轻量化感知或场景识别模型,系统可在数据生成阶段实时识别潜在高风险或高价值场景,并自动标记、优先存储与推送。
价值体现:

  • 关键场景发现从“事后分析”变为“实时捕获”
  • 研发人员可更快聚焦真实风险点
    场景二:高效的训练数据供给与样本挖掘
    将清洗后、高价值的训练样本及其元数据作为热数据缓存于 Redis 中,为分布式训练集群提供低延迟数据访问,并支持向量化困难样本挖掘。
    价值体现:
  • 提升训练资源利用率
  • 缩短模型迭代周期
  • 改善模型在极端场景下的表现

场景三:全链路数据资产可追溯管理
利用 Redis Graph 构建数据、标注、模型与测试结果之间的关系网络,实现端到端的版本追溯与审计。
价值体现:

  • 提升研发过程透明度
  • 支撑 ASPICE、ISO 26262 等质量与安全合规要求

结语
在自动驾驶竞争进入深水区后,真正拉开差距的已不再只是单点算法能力,而是数据被理解、被利用、被反馈的效率与智能程度。
Redis 企业版通过将高速数据处理、多模型数据管理与 AI 原生计算能力融合于一体,为自动驾驶企业提供了一条清晰、可落地的路径,将海量数据从“负担”转化为可持续演进的“核心资产”,为迈向更高级别自动驾驶奠定坚实的数据基础设施。

这里记录每周值得分享的科技内容,周五发布。([通知] 下周元旦假期,周刊休息。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系[email protected])。

封面图

哈尔滨19米大雪人,完工之前的样子。(via cgtn@instagram

《硅谷钢铁侠》摘录

最近,我读了一本十年前的马斯克传记《硅谷钢铁侠》(中信出版社,2016)。

按理说,这本书已经过时了,这十年马斯克发生太多事情了。

我是睡觉前随手拿起来,翻了几页,看得津津有味,就读完了。

这本是马斯克的授权传记,他本人亲自接受了采访,还挺有料的。而且,因为我已经知道后续的发展,所以读到十年前的采访,反而有更多启发。

他的人生确实传奇,白手起家,家里给的最大帮助就是从南非移民到加拿大,后面都是自己奋斗出来的。

他创立了 Paypal,然后把卖掉它的钱拿来又创办了三家公司:特斯拉、SpaceX 和 SolarCity。

这太疯狂了,他一个外行同时进入了三个不同的行业----电动汽车、宇宙航天和太阳能----这些行业都刚萌芽,没有任何个人创业成功的先例。

更疯狂的是,他居然把这三家公司都做成了,而且都做到了世界第一(SolarCity 后并入特斯拉),他也因此变成了世界首富,你说神奇不神奇。

读完全书,我的最大感受是,还是要动手做事,没准真能做成。想他人不敢想,做他人不敢做。即使最狂野的梦想,只要全心投入,用力去做,也是有可能成功的。

下面就是我的一点摘录。

(1)

特斯拉最艰难的时候,非常接近于破产倒闭。

马斯克对外宣传,特斯拉是一家汽车公司,但实际上,他们只是一群年轻人租了一间大厂房,更像是在捣鼓汽车的大型实验室。

(2)

马斯克非常不理解,为什么有人设计了车灯开关。

他说:"真是多此一举。天黑时车灯自动打开,就这么简单。"

(3)

特斯拉的第一版设计稿,因为设计师没想好门把手的形状,就没画上去。

没想到马斯克很喜欢这个没有门把手的车型,就决定门把手应该在有需要的时候自动弹出。

(4)

马斯克认为,未来会有人口危机,主张多生孩子。

他认真考虑了,怎么在特斯拉后排安装婴儿座椅。传统的车门设计,使得把婴儿座椅和小孩安置在后排非常不方便,所以特斯特的车门设计采用了"鹰翼门"。

(5)

特斯拉的第一款车型是跑车,但没有大量生产。真正大量生产的第一款车型是 Model S,最初的名字是 Model Sedan。

Sedan 这个词的意思就是轿车,用来跟跑车相区别。但是马斯克认为这个词太平淡了。英国人习惯称轿车为 Saloon,这听上一样不伦不类。最后,就索性只保留第一个字母,称为 Model S。

(6)

马斯克对员工的要求是,全情投入你的工作,并把事情搞定。

不要等待上级的指导和详细指示,也不要等待别人的反馈意见,你要主动想办法把工作完成。

(7)

他认为,一个人独立工作,是最佳的工作状态。

一个人不需要开会、不需要与谁达成共识,也不需要在项目中帮助其他人。你一个人就可以持续地工作、工作、再工作。

(8)

特斯拉员工最害怕的事情,就是向马斯克申请额外的时间或者经费。

你一定要事先做好详细准备,跟他解释为什么必须招更多的人,以及需要追加的时间和资金预算。如果有招聘目标,还要准备那个人的简历。

(9)

如果你一上来就告诉马斯克,某件事情做不了,他会马上把你轰出办公室,甚至可能当场解雇你。

在马斯克看来,某件事办不成的唯一原因,就是违背了基本的物理原理。但是即使这样,你也必须做足了功课,深入每一个技术环节,向他解释为什么行不通。

(10)

马斯克要求员工,项目没完成之前,周六和周日依然要努力工作,并睡在桌子底下。

有些人反对,表示员工也需要休息,有时间陪陪家人。

马斯克说:"我们破产之后,你们会有大量时间陪家人。"

(11)

马斯克有自己计算时间价值的方法。他预期10年后,公司的日营收可以达到1000万美元,所以进度每拖延一天,就相当于多损失1000万美元。

(12)

马斯克的根本想法是改变这个世界,他总是喜欢谈论人类的生存问题。

早在他开始创业的时候,就已经得出了结论,那就是生命是短暂的。如果你真的意识到这一点,你就会知道,活着的时候工作越努力越好。

科技动态

1、黑色圣诞卡

爱沙尼亚交通警察向800多名危险驾驶者,寄送了黑色圣诞卡,提醒他们新的一年必须安全驾驶。

这些人都是过去违反交通规则的司机,最常见的问题是超速和不系安全带。

圣诞卡上是一起交通事故的现场,黑漆漆的深夜,天空中有明亮的月亮,公路上有交通事故后的车辆残骸,远处还有车灯的亮光。

一个有趣的统计是,虽然人们常说女司机是"马路杀手",但是这800多个危险驾驶者里面,只有33名女性。

2、2025全球互联网报告

世界最大 CDN 服务商 Cloudflare,发布了《2025全球互联网报告》,公布了它的统计数据。

2025年,全球互联网流量上升19%,由于网民数量基本没变,所以多出来的流量来自 AI 爬虫。

流量最大的前10大互联网服务:谷歌、脸书、苹果......

移动流量中,苹果设备占35%,安卓设备占65%。

浏览器排行是,Chrome 66%,Safari 15.4%,Edge 7.4%。

3、违停巡逻车

上海警方启用无人驾驶的违章停车巡逻车。

这辆小车自动在马路上巡逻,对路面进行抓拍。

一旦发现违停车辆,它就会识别车牌,将其上传警务系统,系统后台会发送提醒短信给车主,要求在12分钟内驶离。

12分钟后,小车就会返回点位进行检查,将相关信息回传后台,并经民警审核后开罚单。

据报道,12月18日一天,它共发现违停车辆119辆次。

4、室内过山车

一家瑞典的创意工作室,在他们的办公室建造了世界唯一的室内过山车。

这个过山车途径办公室的各个角落,总长60米,最高的地方距离地面有3米。

坐上这个过山车,你就能游览一圈办公室,看到同事们在干什么。

工作室负责人说,建造它的目的是"促进员工之间的互动,以及打破常规,培养创造力。"

文章

1、分布式架构的演化(英文)

本文将分布式架构分成三种:P2P、联邦式(比如 Mastodon)、中继式(比如 Nostr)。作者认为,对于大型分布式应用,中继式架构才是未来方向。

2、什么是 GitHub 自托管 Runner?(中文)

GitHub Actions 有一个 self-hosted runner 功能,让 action 运行在你自己的服务器。本文详细介绍它的概念、原理,并结合案例进行实践。(@luhuadong 投稿)

3、CSS Grid Lanes 布局(英文)

浏览器开始支持 CSS 的 Grid Lanes 布局了,大大方便了瀑布流的实现。

4、6502 指令集适用汇编语言初学者(英文)

6502 是一块诞生于1975年的 CPU,很多早期电脑(比如 Apple II)都使用它。作者解释,为什么你应该用它,作为学习汇编语言的第一个指令集。

5、你应该多用/tmp目录(英文)

作者提出,Linux 系统的/tmp目录用起来很方便,完全可以把它当作自己的临时性目录。

6、中国的清洁能源战略(英文)

《纽约时报》驻华记者的长文,体验当代中国的生活,比如无人驾驶、无人机送餐,他说"感觉像生活在未来"。

工具

1、MADOLA

一种新的数学脚本语言,像编程一样写数学公式,可以编译成 HTML 格式作为文档,也可以编译成 C++ 或 WebAssembly 直接运行。(@AI4Engr 投稿)

2、CattoPic

一个基于 Cloudflare Worker 的图片托管服务,将图片上传到 Cloudflare 进行推过,支持自动格式转换、标签管理。(@Yuri-NagaSaki 投稿)

3、termdev

直接在终端,通过连接 Chrome Devtool 调试网页。(@taotao7 投稿)

4、tui-banner

为 Rust 语言的命令行项目添加一个横幅图案。(@coolbeevip 投稿)

5、Alertivity

macOS 菜单栏的资源监控工具,监控 CPU、内存、磁盘、网络和进程活动。(@nobbbbby 投稿)

6、cpp‑linter

C/C++ 代码的静态检查工具,可以接入 CI/CD 流程,简化代码质量管理。(@shenxianpeng 投稿)

7、Rote

开源的 Web 笔记软件,需要自己架设。(@Rabithua 投稿)

8、Infographic

JS 的数据可视化框架,用于在网页生成各种信息图,内置200多种模板。(@Aarebecca 投稿)

9、Clock Dashboard

天气时钟看板,适合老旧的电子设备再利用。(@teojs 投稿)

10、离线版问卷

开源 Web 应用,用来设计和托管调查问卷/报名表。(@chenbz777 投稿)

11、Xget

基于边缘计算(如 Cloudflare Workers/Vercel/Netlify)的加速引擎,可以加速程序员网站的访问速度,比如将github.com域名替换成xget.xi-xu.me/gh。(@xixu-me 投稿)

12、BoxLite

一个 Python 库,可以在脚本中运行一个微型虚拟机,提供硬件隔离。(@DorianZheng 投稿)

13、Green Wall

生成你的 GitHub 年度报告。(@Codennnn 投稿)

14、edge-next-starter

面向出海项目的 Next.js + Cloudflare 全栈项目模板,集成 Edge Runtime、D1 数据库、R2 存储。(@TangSY 投稿)

AI 相关

1、Chaterm

带有 AI 功能的智能终端工具,可以用自然语言完成命令行操作。(@zhouyu123666 投稿)

2、miniCC

网友开发的 AI 编程工具 Claude Code 替代品,主要用于学习目的。(@Disdjj 投稿)

3、Android Trans Tool Plus

一个开源的纯前端应用,通过 AI 翻译安卓资源文件,支持多语言同步、差异校验。(@huanfeng 投稿)

4、octopus

个人用户的大模型 API 聚合工具,支持接入多个模型供应商,提供负载均衡、分组名称、使用量统计等功能。(@bestruirui 投稿)

5、Vexor

一个 Python 工具,对当前目录的文件进行向量嵌入,用来语义搜索。(@scarletkc 投稿)

6、Tada

开源的任务管理应用,带有 AI 总结功能。(@Leaomato 投稿)

资源

1、大模型原理(英文)

一篇相对好懂的大模型原理解释,文章不长,并且还有大量的互动图形,写得非常好,推荐阅读。

2、编程语言速度比较

这个网站使用不同的计算机语言,通过莱布尼茨公式计算 π 值,然后给出运行速度的排名,最快是 C++(clang++),最慢是 Python (CPython)。

3、更好的 ZIP 炸弹

这个网页提供三个 ZIP 炸弹文件的下载,其中最小一个只有 42KB,但是解压后的大小是 5.5GB。

图片

1、2025年最佳科学图片

《自然》杂志评选的一组2025年最佳科学图片。

两只争夺领地的青蛙。

南非废弃天文台长出的蘑菇。

2、帽子,乌龟和幽灵

2022年,一个业余数学家 David Smith 发现了一个有点像帽子的奇特形状。

这个形状的奇特之处在于,它可以无限不重复地铺满整个空间,且不形成周期性的重复图案。

不久后,他又发现了两种稍加变化的形状,称为乌龟和幽灵,也可以不重复地平铺平面。

下面就是这三种形状各自平铺的图案。

言论

1、

我使用氛围编程会感到疲惫,AI 生成代码的速度太快了,我的大脑跟不上,无法及时完成代码验收或审查。我必须休息一段时间,才能重新开始。

-- 《氛围编程疲劳》

2、

制造汽车是非常困难的一件事。一辆车大约有3万个独立零部件,公司可能只会采购3000个,因为像车头灯这样的部件,是作为一个整体采购的,但它实际上包含很多组件。

里面的二级、三级、四级供应商提供的零部件,任何一个出现问题都可能导致整车的问题。

-- 汽车创业公司 Rivian 的 CEO 专访

3、

数码世界的现状是,很多人(尤其是大多数老年人)已经放弃了抵抗,任由电子设备将他们带到任何地方。

因为一旦你想搞清楚电子设备的运作,就会发现,在便利的幌子下,一切都充满了敌意,暗箱操作无处不在,不可能完全理清。你想从它们手中夺回个人数据和隐私会非常艰苦,而且注定失败,最终只会带来更大的挫败感。

-- 《一切并非必然》

4、

现在的学生拥有前所未有的优质教育资源,但他们却陷入成千上万种选择中不知该学什么、该用什么资源的困境。拥有资源并不意味着就能找到方向。

-- 《不要关闭你的大脑》

5、

危险并非来自中国的崛起,而是美国的思维模式。如果把科学视为零和博弈,那么每一项中国专利看起来都像是美国的损失。但创意是非竞争性的:中国的科研突破不会让美国人变穷,而是会让世界变得更富有。多极化的科学世界意味着更快的增长、更大的财富和加速的技术进步。

-- 《中国的创新》

往年回顾

西蒙·威利森的年终总结,梁文锋的访谈(#332)

电动皮卡 Cybertruck 的 48V 供电(#282)

好用的平面设计软件(#232)

新人优惠的风险(#182)

(完)

当半导体一级市场回归理性,资本不再为单纯的“算力堆叠”买单,而是开始寻找真正能“落地”的技术。1 月 15 日,硅谷通用神经网络处理器(GPNPU)IP 厂商 Quadric 正式宣布完成 3000 万美元(约合人民币 2.17 亿元) 的 C 轮融资。本轮融资由 BEENEXT 管理的 ACCELERATE 基金领投,老股东 Uncork Capital、Pear VC 持续加注,新投资方阵容则颇具产业背景,包括 万向美国(Wanxiang America)、NSITEXE(丰田 / 电装生态圈)、MegaChips(日本大型无厂半导体公司)以及 Gentree 和 Volta 等。

在端侧大模型(Edge LLM) 加速渗透的今天,Quadric 试图用一套“软件优先”的 GPNPU 架构,打破传统 NPU“不仅难用,还没法改”的僵局。

1. 营收翻倍,不仅是“讲故事”

芯片圈现在的融资环境大家有目共睹,光靠 PPT 已经很难从 VC 口袋里掏出钱了。Quadric 这轮融资之所以能成,核心在于其商业化进程的 “实锤”。根据官方通稿披露的数据,Quadric 在过去一年交出了一份相当硬核的成绩单:2025 年的 IP 许可与特许权使用费(Royalty)营收较 2024 年实现了三倍增长。截至目前,其累计融资总额已超过 7200 万美元。Quadric CEO Veerbhan Kheterpal 在谈及此次融资时底气十足地表示:“在这个充满挑战的融资环境中,能够超额认购完成 C 轮,直接证明了市场对我们‘代码优先’(Code-First)推理架构的认可。”

2. 拿下关键 Design Wins:Tier IV 与亚洲大厂

除了营收数据,Quadric 此次还披露了两个极具含金量的 Design Wins(设计中标),直接验证了其技术在高端市场的落地能力:日本自动驾驶软件巨头 Tier IV作为开源自动驾驶软件 Autoware 的维护者,Tier IV 将在其下一代 AD / ADAS 计算平台中集成 Quadric 的 Chimera GPNPU 核心。这对实时性要求极高的车规级市场来说,是一个重要的风向标。一家亚洲顶级芯片供应商(Top-Tier Asian Silicon Vendor)虽然官方未点名,但这大概率指向了本轮的战略投资方之一(如 MegaChips 等)。该厂商将在其边缘 SoC 中集成 Quadric IP,专门用于运行端侧大语言模型(Edge LLMs)。这标志着 Quadric 已经杀入了最火热的 AI PC / AI Phone 或边缘服务器赛道。

3. 为什么要“革 NPU 的命”?

目前市面上的边缘 SoC 设计,普遍还在用“CPU + DSP + NPU”的异构堆叠模式。看着分工明确,实则痛点不少:数据要在不同核心的内存间搬来搬去,功耗白白浪费;而且 NPU 往往是“黑盒”,开发门槛高,一旦算法变了(比如从 CNN 切到 Transformer),硬件可能就废了。

Quadric 搞的这个 Chimera™ GPNPU,核心逻辑就是做 减法与融合。软件定义的硬件:Quadric 强调 “C++ driven”,开发者不需要学习晦涩的专用语言,直接用 C++ 就能控制硬件。混合流水线:它在一个处理器里同时处理矩阵计算(AI 推理)和控制逻辑(C++ 代码)。这意味着,你不需要把数据在 CPU 和 NPU 之间来回倒腾,直接在 GPNPU 内部“一条龙”处理完。抗老化能力:对于汽车这种生命周期长达 10 年的产品,算法年年变。GPNPU 的可编程性,意味着车厂可以通过软件更新来支持未来的新模型,而不用更换硬件。

4. 行业观察:资本向“应用侧”转移

边缘计算社区观察到,本轮投资方的构成非常耐人寻味。除了财务投资人,NSITEXE(电装关联企业)、MegaChips 和万向美国 的入局,清晰地表明了产业链上下游的态度:汽车电子和工业自动化领域,急需一种更灵活、更高效的计算架构。随着 Transformer 架构日新月异,端侧大模型层出不穷,专用加速器(ASIC)“上市即落伍”的风险越来越大。Quadric 这种“通用性 + 高性能”的中间路线,或许正是解决当前边缘 AI 碎片化难题的一剂良药。据悉,这笔 3000 万美元 将重点用于扩大全球工程团队,并进一步打磨其软件开发工具链(SDK),毕竟对于 IP 厂商来说,生态好不好用,直接决定了客户愿不愿意用。

参考材料
Quadric Press Release: Quadric Raises $30M Series C Funding to Accelerate On-Device AIhttps://quadric.ai/press-release/quadric-raises-30m-series-c-...

Pulse 2.0: Quadric: $30 Million Series C Closed As Design Wins Acceleratehttps://pulse2.com/quadric-30-million-series-c/

Design & Reuse: Quadric Raises $30M Series C Financing for GPNPU Architecturehttps://www.design-reuse.com/news/56829/quadric-series-c-fina...

这里记录每周值得分享的科技内容,周五发布。([通知] 下周元旦假期,周刊休息。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系[email protected])。

封面图

哈尔滨19米大雪人,完工之前的样子。(via cgtn@instagram

《硅谷钢铁侠》摘录

最近,我读了一本十年前的马斯克传记《硅谷钢铁侠》(中信出版社,2016)。

按理说,这本书已经过时了,这十年马斯克发生太多事情了。

我是睡觉前随手拿起来,翻了几页,看得津津有味,就读完了。

这本是马斯克的授权传记,他本人亲自接受了采访,还挺有料的。而且,因为我已经知道后续的发展,所以读到十年前的采访,反而有更多启发。

他的人生确实传奇,白手起家,家里给的最大帮助就是从南非移民到加拿大,后面都是自己奋斗出来的。

他创立了 Paypal,然后把卖掉它的钱拿来又创办了三家公司:特斯拉、SpaceX 和 SolarCity。

这太疯狂了,他一个外行同时进入了三个不同的行业----电动汽车、宇宙航天和太阳能----这些行业都刚萌芽,没有任何个人创业成功的先例。

更疯狂的是,他居然把这三家公司都做成了,而且都做到了世界第一(SolarCity 后并入特斯拉),他也因此变成了世界首富,你说神奇不神奇。

读完全书,我的最大感受是,还是要动手做事,没准真能做成。想他人不敢想,做他人不敢做。即使最狂野的梦想,只要全心投入,用力去做,也是有可能成功的。

下面就是我的一点摘录。

(1)

特斯拉最艰难的时候,非常接近于破产倒闭。

马斯克对外宣传,特斯拉是一家汽车公司,但实际上,他们只是一群年轻人租了一间大厂房,更像是在捣鼓汽车的大型实验室。

(2)

马斯克非常不理解,为什么有人设计了车灯开关。

他说:"真是多此一举。天黑时车灯自动打开,就这么简单。"

(3)

特斯拉的第一版设计稿,因为设计师没想好门把手的形状,就没画上去。

没想到马斯克很喜欢这个没有门把手的车型,就决定门把手应该在有需要的时候自动弹出。

(4)

马斯克认为,未来会有人口危机,主张多生孩子。

他认真考虑了,怎么在特斯拉后排安装婴儿座椅。传统的车门设计,使得把婴儿座椅和小孩安置在后排非常不方便,所以特斯特的车门设计采用了"鹰翼门"。

(5)

特斯拉的第一款车型是跑车,但没有大量生产。真正大量生产的第一款车型是 Model S,最初的名字是 Model Sedan。

Sedan 这个词的意思就是轿车,用来跟跑车相区别。但是马斯克认为这个词太平淡了。英国人习惯称轿车为 Saloon,这听上一样不伦不类。最后,就索性只保留第一个字母,称为 Model S。

(6)

马斯克对员工的要求是,全情投入你的工作,并把事情搞定。

不要等待上级的指导和详细指示,也不要等待别人的反馈意见,你要主动想办法把工作完成。

(7)

他认为,一个人独立工作,是最佳的工作状态。

一个人不需要开会、不需要与谁达成共识,也不需要在项目中帮助其他人。你一个人就可以持续地工作、工作、再工作。

(8)

特斯拉员工最害怕的事情,就是向马斯克申请额外的时间或者经费。

你一定要事先做好详细准备,跟他解释为什么必须招更多的人,以及需要追加的时间和资金预算。如果有招聘目标,还要准备那个人的简历。

(9)

如果你一上来就告诉马斯克,某件事情做不了,他会马上把你轰出办公室,甚至可能当场解雇你。

在马斯克看来,某件事办不成的唯一原因,就是违背了基本的物理原理。但是即使这样,你也必须做足了功课,深入每一个技术环节,向他解释为什么行不通。

(10)

马斯克要求员工,项目没完成之前,周六和周日依然要努力工作,并睡在桌子底下。

有些人反对,表示员工也需要休息,有时间陪陪家人。

马斯克说:"我们破产之后,你们会有大量时间陪家人。"

(11)

马斯克有自己计算时间价值的方法。他预期10年后,公司的日营收可以达到1000万美元,所以进度每拖延一天,就相当于多损失1000万美元。

(12)

马斯克的根本想法是改变这个世界,他总是喜欢谈论人类的生存问题。

早在他开始创业的时候,就已经得出了结论,那就是生命是短暂的。如果你真的意识到这一点,你就会知道,活着的时候工作越努力越好。

科技动态

1、黑色圣诞卡

爱沙尼亚交通警察向800多名危险驾驶者,寄送了黑色圣诞卡,提醒他们新的一年必须安全驾驶。

这些人都是过去违反交通规则的司机,最常见的问题是超速和不系安全带。

圣诞卡上是一起交通事故的现场,黑漆漆的深夜,天空中有明亮的月亮,公路上有交通事故后的车辆残骸,远处还有车灯的亮光。

一个有趣的统计是,虽然人们常说女司机是"马路杀手",但是这800多个危险驾驶者里面,只有33名女性。

2、2025全球互联网报告

世界最大 CDN 服务商 Cloudflare,发布了《2025全球互联网报告》,公布了它的统计数据。

2025年,全球互联网流量上升19%,由于网民数量基本没变,所以多出来的流量来自 AI 爬虫。

流量最大的前10大互联网服务:谷歌、脸书、苹果......

移动流量中,苹果设备占35%,安卓设备占65%。

浏览器排行是,Chrome 66%,Safari 15.4%,Edge 7.4%。

3、违停巡逻车

上海警方启用无人驾驶的违章停车巡逻车。

这辆小车自动在马路上巡逻,对路面进行抓拍。

一旦发现违停车辆,它就会识别车牌,将其上传警务系统,系统后台会发送提醒短信给车主,要求在12分钟内驶离。

12分钟后,小车就会返回点位进行检查,将相关信息回传后台,并经民警审核后开罚单。

据报道,12月18日一天,它共发现违停车辆119辆次。

4、室内过山车

一家瑞典的创意工作室,在他们的办公室建造了世界唯一的室内过山车。

这个过山车途径办公室的各个角落,总长60米,最高的地方距离地面有3米。

坐上这个过山车,你就能游览一圈办公室,看到同事们在干什么。

工作室负责人说,建造它的目的是"促进员工之间的互动,以及打破常规,培养创造力。"

文章

1、分布式架构的演化(英文)

本文将分布式架构分成三种:P2P、联邦式(比如 Mastodon)、中继式(比如 Nostr)。作者认为,对于大型分布式应用,中继式架构才是未来方向。

2、什么是 GitHub 自托管 Runner?(中文)

GitHub Actions 有一个 self-hosted runner 功能,让 action 运行在你自己的服务器。本文详细介绍它的概念、原理,并结合案例进行实践。(@luhuadong 投稿)

3、CSS Grid Lanes 布局(英文)

浏览器开始支持 CSS 的 Grid Lanes 布局了,大大方便了瀑布流的实现。

4、6502 指令集适用汇编语言初学者(英文)

6502 是一块诞生于1975年的 CPU,很多早期电脑(比如 Apple II)都使用它。作者解释,为什么你应该用它,作为学习汇编语言的第一个指令集。

5、你应该多用/tmp目录(英文)

作者提出,Linux 系统的/tmp目录用起来很方便,完全可以把它当作自己的临时性目录。

6、中国的清洁能源战略(英文)

《纽约时报》驻华记者的长文,体验当代中国的生活,比如无人驾驶、无人机送餐,他说"感觉像生活在未来"。

工具

1、MADOLA

一种新的数学脚本语言,像编程一样写数学公式,可以编译成 HTML 格式作为文档,也可以编译成 C++ 或 WebAssembly 直接运行。(@AI4Engr 投稿)

2、CattoPic

一个基于 Cloudflare Worker 的图片托管服务,将图片上传到 Cloudflare 进行推过,支持自动格式转换、标签管理。(@Yuri-NagaSaki 投稿)

3、termdev

直接在终端,通过连接 Chrome Devtool 调试网页。(@taotao7 投稿)

4、tui-banner

为 Rust 语言的命令行项目添加一个横幅图案。(@coolbeevip 投稿)

5、Alertivity

macOS 菜单栏的资源监控工具,监控 CPU、内存、磁盘、网络和进程活动。(@nobbbbby 投稿)

6、cpp‑linter

C/C++ 代码的静态检查工具,可以接入 CI/CD 流程,简化代码质量管理。(@shenxianpeng 投稿)

7、Rote

开源的 Web 笔记软件,需要自己架设。(@Rabithua 投稿)

8、Infographic

JS 的数据可视化框架,用于在网页生成各种信息图,内置200多种模板。(@Aarebecca 投稿)

9、Clock Dashboard

天气时钟看板,适合老旧的电子设备再利用。(@teojs 投稿)

10、离线版问卷

开源 Web 应用,用来设计和托管调查问卷/报名表。(@chenbz777 投稿)

11、Xget

基于边缘计算(如 Cloudflare Workers/Vercel/Netlify)的加速引擎,可以加速程序员网站的访问速度,比如将github.com域名替换成xget.xi-xu.me/gh。(@xixu-me 投稿)

12、BoxLite

一个 Python 库,可以在脚本中运行一个微型虚拟机,提供硬件隔离。(@DorianZheng 投稿)

13、Green Wall

生成你的 GitHub 年度报告。(@Codennnn 投稿)

14、edge-next-starter

面向出海项目的 Next.js + Cloudflare 全栈项目模板,集成 Edge Runtime、D1 数据库、R2 存储。(@TangSY 投稿)

AI 相关

1、Chaterm

带有 AI 功能的智能终端工具,可以用自然语言完成命令行操作。(@zhouyu123666 投稿)

2、miniCC

网友开发的 AI 编程工具 Claude Code 替代品,主要用于学习目的。(@Disdjj 投稿)

3、Android Trans Tool Plus

一个开源的纯前端应用,通过 AI 翻译安卓资源文件,支持多语言同步、差异校验。(@huanfeng 投稿)

4、octopus

个人用户的大模型 API 聚合工具,支持接入多个模型供应商,提供负载均衡、分组名称、使用量统计等功能。(@bestruirui 投稿)

5、Vexor

一个 Python 工具,对当前目录的文件进行向量嵌入,用来语义搜索。(@scarletkc 投稿)

6、Tada

开源的任务管理应用,带有 AI 总结功能。(@Leaomato 投稿)

资源

1、大模型原理(英文)

一篇相对好懂的大模型原理解释,文章不长,并且还有大量的互动图形,写得非常好,推荐阅读。

2、编程语言速度比较

这个网站使用不同的计算机语言,通过莱布尼茨公式计算 π 值,然后给出运行速度的排名,最快是 C++(clang++),最慢是 Python (CPython)。

3、更好的 ZIP 炸弹

这个网页提供三个 ZIP 炸弹文件的下载,其中最小一个只有 42KB,但是解压后的大小是 5.5GB。

图片

1、2025年最佳科学图片

《自然》杂志评选的一组2025年最佳科学图片。

两只争夺领地的青蛙。

南非废弃天文台长出的蘑菇。

2、帽子,乌龟和幽灵

2022年,一个业余数学家 David Smith 发现了一个有点像帽子的奇特形状。

这个形状的奇特之处在于,它可以无限不重复地铺满整个空间,且不形成周期性的重复图案。

不久后,他又发现了两种稍加变化的形状,称为乌龟和幽灵,也可以不重复地平铺平面。

下面就是这三种形状各自平铺的图案。

言论

1、

我使用氛围编程会感到疲惫,AI 生成代码的速度太快了,我的大脑跟不上,无法及时完成代码验收或审查。我必须休息一段时间,才能重新开始。

-- 《氛围编程疲劳》

2、

制造汽车是非常困难的一件事。一辆车大约有3万个独立零部件,公司可能只会采购3000个,因为像车头灯这样的部件,是作为一个整体采购的,但它实际上包含很多组件。

里面的二级、三级、四级供应商提供的零部件,任何一个出现问题都可能导致整车的问题。

-- 汽车创业公司 Rivian 的 CEO 专访

3、

数码世界的现状是,很多人(尤其是大多数老年人)已经放弃了抵抗,任由电子设备将他们带到任何地方。

因为一旦你想搞清楚电子设备的运作,就会发现,在便利的幌子下,一切都充满了敌意,暗箱操作无处不在,不可能完全理清。你想从它们手中夺回个人数据和隐私会非常艰苦,而且注定失败,最终只会带来更大的挫败感。

-- 《一切并非必然》

4、

现在的学生拥有前所未有的优质教育资源,但他们却陷入成千上万种选择中不知该学什么、该用什么资源的困境。拥有资源并不意味着就能找到方向。

-- 《不要关闭你的大脑》

5、

危险并非来自中国的崛起,而是美国的思维模式。如果把科学视为零和博弈,那么每一项中国专利看起来都像是美国的损失。但创意是非竞争性的:中国的科研突破不会让美国人变穷,而是会让世界变得更富有。多极化的科学世界意味着更快的增长、更大的财富和加速的技术进步。

-- 《中国的创新》

往年回顾

西蒙·威利森的年终总结,梁文锋的访谈(#332)

电动皮卡 Cybertruck 的 48V 供电(#282)

好用的平面设计软件(#232)

新人优惠的风险(#182)

(完)

英伟达(NVIDIA)发布了一套涵盖语言、智能体系统、机器人技术、自动驾驶和生物医学研究的开放模型、数据集和开发工具。此次更新扩展了多个现有的 NVIDIA 模型家族,并通过 GitHub、Hugging Face 和 NVIDIA 的开发者平台提供了相应的训练数据和参考实现。

 

在代理式 AI 领域,NVIDIA 扩展了 Nemotron 模型家族,为语音识别、检索增强生成和安全提供了新的组件。Nemotron Speech 包括针对低延迟、实时用例优化的自动语音识别模型。Nemotron RAG 引入了用于多模态文档搜索和检索流程的嵌入和重排视觉语言模型。Nemotron Safety 增加了用于内容过滤和敏感或个人身份信息检测的更新模型。NVIDIA 还发布了用于选定 Nemotron 模型的数据集和训练代码,包括在公共基准上评估的嵌入模型。

 

对于机器人技术和物理 AI,NVIDIA 引入了新的 Cosmos 世界基础模型,这些模型支持在真实环境中的感知、推理和合成数据生成。Cosmos Reason 2 是一个多模态推理模型,旨在增强智能体在物理环境中操作的场景理解。Cosmos Transfer 2.5 和 Cosmos Predict 2.5 专注于在不同环境和条件下生成合成视频数据,支持仿真和数据增强工作流程。基于 Cosmos,NVIDIA 发布了 Isaac GR00T N1.6,这是一个用于人形机器人的开放视觉-语言-动作模型,支持全身控制并将视觉感知与动作规划集成。

 

公告的一个组成部分是 NVIDIA Alpamayo,一个用于基于推理的自动驾驶的新开放模型家族。Alpamayo 结合了感知、规划和可解释性,采用视觉-语言-动作架构,并与仿真工具和大规模驾驶数据集相匹配。NVIDIA 还引入了 AlpaSim,这是一个用于自动驾驶汽车模型闭环评估的开源仿真框架。

 

据 NVIDIA 汽车部门负责人吴信洲表示,Alpamayo 和相关工具反映了跨研究、模拟、数据工程、安全和集成团队多年的开发努力。吴指出,这项工作涉及广泛的道路测试、使用 Cosmos 等平台进行持续的大规模模拟,以及与包括梅赛德斯-奔驰在内的汽车合作伙伴的紧密合作,计划在即将推出的量产车辆中进行初步部署。

 

医疗保健和生命科学更新通过新的 NVIDIA Clara 模型提供。这些包括用于原子级蛋白质设计的 La-Proteina,用于合成感知药物设计的 ReaSyn v2,用于早期安全和相互作用预测的 KERMT,以及用于 RNA 结构建模的 RNAPro。NVIDIA 还发布了一个包含 45.5 万个合成蛋白质结构的数据集,以支持该领域的训练和评估。

 

所有模型和数据集均在开放许可下发布,可通过 GitHub 和 Hugging Face 访问。NVIDIA 表示,许多模型还被打包为 NIM 微服务,以便在从本地推理环境到云基础设施的 NVIDIA 加速系统上部署。

 

https://www.infoq.com/news/2026/01/nvidia-open-models/

这里记录每周值得分享的科技内容,周五发布。([通知] 下周元旦假期,周刊休息。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系[email protected])。

封面图

哈尔滨19米大雪人,完工之前的样子。(via cgtn@instagram

《硅谷钢铁侠》摘录

最近,我读了一本十年前的马斯克传记《硅谷钢铁侠》(中信出版社,2016)。

按理说,这本书已经过时了,这十年马斯克发生太多事情了。

我是睡觉前随手拿起来,翻了几页,看得津津有味,就读完了。

这本是马斯克的授权传记,他本人亲自接受了采访,还挺有料的。而且,因为我已经知道后续的发展,所以读到十年前的采访,反而有更多启发。

他的人生确实传奇,白手起家,家里给的最大帮助就是从南非移民到加拿大,后面都是自己奋斗出来的。

他创立了 Paypal,然后把卖掉它的钱拿来又创办了三家公司:特斯拉、SpaceX 和 SolarCity。

这太疯狂了,他一个外行同时进入了三个不同的行业----电动汽车、宇宙航天和太阳能----这些行业都刚萌芽,没有任何个人创业成功的先例。

更疯狂的是,他居然把这三家公司都做成了,而且都做到了世界第一(SolarCity 后并入特斯拉),他也因此变成了世界首富,你说神奇不神奇。

读完全书,我的最大感受是,还是要动手做事,没准真能做成。想他人不敢想,做他人不敢做。即使最狂野的梦想,只要全心投入,用力去做,也是有可能成功的。

下面就是我的一点摘录。

(1)

特斯拉最艰难的时候,非常接近于破产倒闭。

马斯克对外宣传,特斯拉是一家汽车公司,但实际上,他们只是一群年轻人租了一间大厂房,更像是在捣鼓汽车的大型实验室。

(2)

马斯克非常不理解,为什么有人设计了车灯开关。

他说:"真是多此一举。天黑时车灯自动打开,就这么简单。"

(3)

特斯拉的第一版设计稿,因为设计师没想好门把手的形状,就没画上去。

没想到马斯克很喜欢这个没有门把手的车型,就决定门把手应该在有需要的时候自动弹出。

(4)

马斯克认为,未来会有人口危机,主张多生孩子。

他认真考虑了,怎么在特斯拉后排安装婴儿座椅。传统的车门设计,使得把婴儿座椅和小孩安置在后排非常不方便,所以特斯特的车门设计采用了"鹰翼门"。

(5)

特斯拉的第一款车型是跑车,但没有大量生产。真正大量生产的第一款车型是 Model S,最初的名字是 Model Sedan。

Sedan 这个词的意思就是轿车,用来跟跑车相区别。但是马斯克认为这个词太平淡了。英国人习惯称轿车为 Saloon,这听上一样不伦不类。最后,就索性只保留第一个字母,称为 Model S。

(6)

马斯克对员工的要求是,全情投入你的工作,并把事情搞定。

不要等待上级的指导和详细指示,也不要等待别人的反馈意见,你要主动想办法把工作完成。

(7)

他认为,一个人独立工作,是最佳的工作状态。

一个人不需要开会、不需要与谁达成共识,也不需要在项目中帮助其他人。你一个人就可以持续地工作、工作、再工作。

(8)

特斯拉员工最害怕的事情,就是向马斯克申请额外的时间或者经费。

你一定要事先做好详细准备,跟他解释为什么必须招更多的人,以及需要追加的时间和资金预算。如果有招聘目标,还要准备那个人的简历。

(9)

如果你一上来就告诉马斯克,某件事情做不了,他会马上把你轰出办公室,甚至可能当场解雇你。

在马斯克看来,某件事办不成的唯一原因,就是违背了基本的物理原理。但是即使这样,你也必须做足了功课,深入每一个技术环节,向他解释为什么行不通。

(10)

马斯克要求员工,项目没完成之前,周六和周日依然要努力工作,并睡在桌子底下。

有些人反对,表示员工也需要休息,有时间陪陪家人。

马斯克说:"我们破产之后,你们会有大量时间陪家人。"

(11)

马斯克有自己计算时间价值的方法。他预期10年后,公司的日营收可以达到1000万美元,所以进度每拖延一天,就相当于多损失1000万美元。

(12)

马斯克的根本想法是改变这个世界,他总是喜欢谈论人类的生存问题。

早在他开始创业的时候,就已经得出了结论,那就是生命是短暂的。如果你真的意识到这一点,你就会知道,活着的时候工作越努力越好。

科技动态

1、黑色圣诞卡

爱沙尼亚交通警察向800多名危险驾驶者,寄送了黑色圣诞卡,提醒他们新的一年必须安全驾驶。

这些人都是过去违反交通规则的司机,最常见的问题是超速和不系安全带。

圣诞卡上是一起交通事故的现场,黑漆漆的深夜,天空中有明亮的月亮,公路上有交通事故后的车辆残骸,远处还有车灯的亮光。

一个有趣的统计是,虽然人们常说女司机是"马路杀手",但是这800多个危险驾驶者里面,只有33名女性。

2、2025全球互联网报告

世界最大 CDN 服务商 Cloudflare,发布了《2025全球互联网报告》,公布了它的统计数据。

2025年,全球互联网流量上升19%,由于网民数量基本没变,所以多出来的流量来自 AI 爬虫。

流量最大的前10大互联网服务:谷歌、脸书、苹果......

移动流量中,苹果设备占35%,安卓设备占65%。

浏览器排行是,Chrome 66%,Safari 15.4%,Edge 7.4%。

3、违停巡逻车

上海警方启用无人驾驶的违章停车巡逻车。

这辆小车自动在马路上巡逻,对路面进行抓拍。

一旦发现违停车辆,它就会识别车牌,将其上传警务系统,系统后台会发送提醒短信给车主,要求在12分钟内驶离。

12分钟后,小车就会返回点位进行检查,将相关信息回传后台,并经民警审核后开罚单。

据报道,12月18日一天,它共发现违停车辆119辆次。

4、室内过山车

一家瑞典的创意工作室,在他们的办公室建造了世界唯一的室内过山车。

这个过山车途径办公室的各个角落,总长60米,最高的地方距离地面有3米。

坐上这个过山车,你就能游览一圈办公室,看到同事们在干什么。

工作室负责人说,建造它的目的是"促进员工之间的互动,以及打破常规,培养创造力。"

文章

1、分布式架构的演化(英文)

本文将分布式架构分成三种:P2P、联邦式(比如 Mastodon)、中继式(比如 Nostr)。作者认为,对于大型分布式应用,中继式架构才是未来方向。

2、什么是 GitHub 自托管 Runner?(中文)

GitHub Actions 有一个 self-hosted runner 功能,让 action 运行在你自己的服务器。本文详细介绍它的概念、原理,并结合案例进行实践。(@luhuadong 投稿)

3、CSS Grid Lanes 布局(英文)

浏览器开始支持 CSS 的 Grid Lanes 布局了,大大方便了瀑布流的实现。

4、6502 指令集适用汇编语言初学者(英文)

6502 是一块诞生于1975年的 CPU,很多早期电脑(比如 Apple II)都使用它。作者解释,为什么你应该用它,作为学习汇编语言的第一个指令集。

5、你应该多用/tmp目录(英文)

作者提出,Linux 系统的/tmp目录用起来很方便,完全可以把它当作自己的临时性目录。

6、中国的清洁能源战略(英文)

《纽约时报》驻华记者的长文,体验当代中国的生活,比如无人驾驶、无人机送餐,他说"感觉像生活在未来"。

工具

1、MADOLA

一种新的数学脚本语言,像编程一样写数学公式,可以编译成 HTML 格式作为文档,也可以编译成 C++ 或 WebAssembly 直接运行。(@AI4Engr 投稿)

2、CattoPic

一个基于 Cloudflare Worker 的图片托管服务,将图片上传到 Cloudflare 进行推过,支持自动格式转换、标签管理。(@Yuri-NagaSaki 投稿)

3、termdev

直接在终端,通过连接 Chrome Devtool 调试网页。(@taotao7 投稿)

4、tui-banner

为 Rust 语言的命令行项目添加一个横幅图案。(@coolbeevip 投稿)

5、Alertivity

macOS 菜单栏的资源监控工具,监控 CPU、内存、磁盘、网络和进程活动。(@nobbbbby 投稿)

6、cpp‑linter

C/C++ 代码的静态检查工具,可以接入 CI/CD 流程,简化代码质量管理。(@shenxianpeng 投稿)

7、Rote

开源的 Web 笔记软件,需要自己架设。(@Rabithua 投稿)

8、Infographic

JS 的数据可视化框架,用于在网页生成各种信息图,内置200多种模板。(@Aarebecca 投稿)

9、Clock Dashboard

天气时钟看板,适合老旧的电子设备再利用。(@teojs 投稿)

10、离线版问卷

开源 Web 应用,用来设计和托管调查问卷/报名表。(@chenbz777 投稿)

11、Xget

基于边缘计算(如 Cloudflare Workers/Vercel/Netlify)的加速引擎,可以加速程序员网站的访问速度,比如将github.com域名替换成xget.xi-xu.me/gh。(@xixu-me 投稿)

12、BoxLite

一个 Python 库,可以在脚本中运行一个微型虚拟机,提供硬件隔离。(@DorianZheng 投稿)

13、Green Wall

生成你的 GitHub 年度报告。(@Codennnn 投稿)

14、edge-next-starter

面向出海项目的 Next.js + Cloudflare 全栈项目模板,集成 Edge Runtime、D1 数据库、R2 存储。(@TangSY 投稿)

AI 相关

1、Chaterm

带有 AI 功能的智能终端工具,可以用自然语言完成命令行操作。(@zhouyu123666 投稿)

2、miniCC

网友开发的 AI 编程工具 Claude Code 替代品,主要用于学习目的。(@Disdjj 投稿)

3、Android Trans Tool Plus

一个开源的纯前端应用,通过 AI 翻译安卓资源文件,支持多语言同步、差异校验。(@huanfeng 投稿)

4、octopus

个人用户的大模型 API 聚合工具,支持接入多个模型供应商,提供负载均衡、分组名称、使用量统计等功能。(@bestruirui 投稿)

5、Vexor

一个 Python 工具,对当前目录的文件进行向量嵌入,用来语义搜索。(@scarletkc 投稿)

6、Tada

开源的任务管理应用,带有 AI 总结功能。(@Leaomato 投稿)

资源

1、大模型原理(英文)

一篇相对好懂的大模型原理解释,文章不长,并且还有大量的互动图形,写得非常好,推荐阅读。

2、编程语言速度比较

这个网站使用不同的计算机语言,通过莱布尼茨公式计算 π 值,然后给出运行速度的排名,最快是 C++(clang++),最慢是 Python (CPython)。

3、更好的 ZIP 炸弹

这个网页提供三个 ZIP 炸弹文件的下载,其中最小一个只有 42KB,但是解压后的大小是 5.5GB。

图片

1、2025年最佳科学图片

《自然》杂志评选的一组2025年最佳科学图片。

两只争夺领地的青蛙。

南非废弃天文台长出的蘑菇。

2、帽子,乌龟和幽灵

2022年,一个业余数学家 David Smith 发现了一个有点像帽子的奇特形状。

这个形状的奇特之处在于,它可以无限不重复地铺满整个空间,且不形成周期性的重复图案。

不久后,他又发现了两种稍加变化的形状,称为乌龟和幽灵,也可以不重复地平铺平面。

下面就是这三种形状各自平铺的图案。

言论

1、

我使用氛围编程会感到疲惫,AI 生成代码的速度太快了,我的大脑跟不上,无法及时完成代码验收或审查。我必须休息一段时间,才能重新开始。

-- 《氛围编程疲劳》

2、

制造汽车是非常困难的一件事。一辆车大约有3万个独立零部件,公司可能只会采购3000个,因为像车头灯这样的部件,是作为一个整体采购的,但它实际上包含很多组件。

里面的二级、三级、四级供应商提供的零部件,任何一个出现问题都可能导致整车的问题。

-- 汽车创业公司 Rivian 的 CEO 专访

3、

数码世界的现状是,很多人(尤其是大多数老年人)已经放弃了抵抗,任由电子设备将他们带到任何地方。

因为一旦你想搞清楚电子设备的运作,就会发现,在便利的幌子下,一切都充满了敌意,暗箱操作无处不在,不可能完全理清。你想从它们手中夺回个人数据和隐私会非常艰苦,而且注定失败,最终只会带来更大的挫败感。

-- 《一切并非必然》

4、

现在的学生拥有前所未有的优质教育资源,但他们却陷入成千上万种选择中不知该学什么、该用什么资源的困境。拥有资源并不意味着就能找到方向。

-- 《不要关闭你的大脑》

5、

危险并非来自中国的崛起,而是美国的思维模式。如果把科学视为零和博弈,那么每一项中国专利看起来都像是美国的损失。但创意是非竞争性的:中国的科研突破不会让美国人变穷,而是会让世界变得更富有。多极化的科学世界意味着更快的增长、更大的财富和加速的技术进步。

-- 《中国的创新》

往年回顾

西蒙·威利森的年终总结,梁文锋的访谈(#332)

电动皮卡 Cybertruck 的 48V 供电(#282)

好用的平面设计软件(#232)

新人优惠的风险(#182)

(完)

这里记录每周值得分享的科技内容,周五发布。([通知] 下周元旦假期,周刊休息。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系[email protected])。

封面图

哈尔滨19米大雪人,完工之前的样子。(via cgtn@instagram

《硅谷钢铁侠》摘录

最近,我读了一本十年前的马斯克传记《硅谷钢铁侠》(中信出版社,2016)。

按理说,这本书已经过时了,这十年马斯克发生太多事情了。

我是睡觉前随手拿起来,翻了几页,看得津津有味,就读完了。

这本是马斯克的授权传记,他本人亲自接受了采访,还挺有料的。而且,因为我已经知道后续的发展,所以读到十年前的采访,反而有更多启发。

他的人生确实传奇,白手起家,家里给的最大帮助就是从南非移民到加拿大,后面都是自己奋斗出来的。

他创立了 Paypal,然后把卖掉它的钱拿来又创办了三家公司:特斯拉、SpaceX 和 SolarCity。

这太疯狂了,他一个外行同时进入了三个不同的行业----电动汽车、宇宙航天和太阳能----这些行业都刚萌芽,没有任何个人创业成功的先例。

更疯狂的是,他居然把这三家公司都做成了,而且都做到了世界第一(SolarCity 后并入特斯拉),他也因此变成了世界首富,你说神奇不神奇。

读完全书,我的最大感受是,还是要动手做事,没准真能做成。想他人不敢想,做他人不敢做。即使最狂野的梦想,只要全心投入,用力去做,也是有可能成功的。

下面就是我的一点摘录。

(1)

特斯拉最艰难的时候,非常接近于破产倒闭。

马斯克对外宣传,特斯拉是一家汽车公司,但实际上,他们只是一群年轻人租了一间大厂房,更像是在捣鼓汽车的大型实验室。

(2)

马斯克非常不理解,为什么有人设计了车灯开关。

他说:"真是多此一举。天黑时车灯自动打开,就这么简单。"

(3)

特斯拉的第一版设计稿,因为设计师没想好门把手的形状,就没画上去。

没想到马斯克很喜欢这个没有门把手的车型,就决定门把手应该在有需要的时候自动弹出。

(4)

马斯克认为,未来会有人口危机,主张多生孩子。

他认真考虑了,怎么在特斯拉后排安装婴儿座椅。传统的车门设计,使得把婴儿座椅和小孩安置在后排非常不方便,所以特斯特的车门设计采用了"鹰翼门"。

(5)

特斯拉的第一款车型是跑车,但没有大量生产。真正大量生产的第一款车型是 Model S,最初的名字是 Model Sedan。

Sedan 这个词的意思就是轿车,用来跟跑车相区别。但是马斯克认为这个词太平淡了。英国人习惯称轿车为 Saloon,这听上一样不伦不类。最后,就索性只保留第一个字母,称为 Model S。

(6)

马斯克对员工的要求是,全情投入你的工作,并把事情搞定。

不要等待上级的指导和详细指示,也不要等待别人的反馈意见,你要主动想办法把工作完成。

(7)

他认为,一个人独立工作,是最佳的工作状态。

一个人不需要开会、不需要与谁达成共识,也不需要在项目中帮助其他人。你一个人就可以持续地工作、工作、再工作。

(8)

特斯拉员工最害怕的事情,就是向马斯克申请额外的时间或者经费。

你一定要事先做好详细准备,跟他解释为什么必须招更多的人,以及需要追加的时间和资金预算。如果有招聘目标,还要准备那个人的简历。

(9)

如果你一上来就告诉马斯克,某件事情做不了,他会马上把你轰出办公室,甚至可能当场解雇你。

在马斯克看来,某件事办不成的唯一原因,就是违背了基本的物理原理。但是即使这样,你也必须做足了功课,深入每一个技术环节,向他解释为什么行不通。

(10)

马斯克要求员工,项目没完成之前,周六和周日依然要努力工作,并睡在桌子底下。

有些人反对,表示员工也需要休息,有时间陪陪家人。

马斯克说:"我们破产之后,你们会有大量时间陪家人。"

(11)

马斯克有自己计算时间价值的方法。他预期10年后,公司的日营收可以达到1000万美元,所以进度每拖延一天,就相当于多损失1000万美元。

(12)

马斯克的根本想法是改变这个世界,他总是喜欢谈论人类的生存问题。

早在他开始创业的时候,就已经得出了结论,那就是生命是短暂的。如果你真的意识到这一点,你就会知道,活着的时候工作越努力越好。

科技动态

1、黑色圣诞卡

爱沙尼亚交通警察向800多名危险驾驶者,寄送了黑色圣诞卡,提醒他们新的一年必须安全驾驶。

这些人都是过去违反交通规则的司机,最常见的问题是超速和不系安全带。

圣诞卡上是一起交通事故的现场,黑漆漆的深夜,天空中有明亮的月亮,公路上有交通事故后的车辆残骸,远处还有车灯的亮光。

一个有趣的统计是,虽然人们常说女司机是"马路杀手",但是这800多个危险驾驶者里面,只有33名女性。

2、2025全球互联网报告

世界最大 CDN 服务商 Cloudflare,发布了《2025全球互联网报告》,公布了它的统计数据。

2025年,全球互联网流量上升19%,由于网民数量基本没变,所以多出来的流量来自 AI 爬虫。

流量最大的前10大互联网服务:谷歌、脸书、苹果......

移动流量中,苹果设备占35%,安卓设备占65%。

浏览器排行是,Chrome 66%,Safari 15.4%,Edge 7.4%。

3、违停巡逻车

上海警方启用无人驾驶的违章停车巡逻车。

这辆小车自动在马路上巡逻,对路面进行抓拍。

一旦发现违停车辆,它就会识别车牌,将其上传警务系统,系统后台会发送提醒短信给车主,要求在12分钟内驶离。

12分钟后,小车就会返回点位进行检查,将相关信息回传后台,并经民警审核后开罚单。

据报道,12月18日一天,它共发现违停车辆119辆次。

4、室内过山车

一家瑞典的创意工作室,在他们的办公室建造了世界唯一的室内过山车。

这个过山车途径办公室的各个角落,总长60米,最高的地方距离地面有3米。

坐上这个过山车,你就能游览一圈办公室,看到同事们在干什么。

工作室负责人说,建造它的目的是"促进员工之间的互动,以及打破常规,培养创造力。"

文章

1、分布式架构的演化(英文)

本文将分布式架构分成三种:P2P、联邦式(比如 Mastodon)、中继式(比如 Nostr)。作者认为,对于大型分布式应用,中继式架构才是未来方向。

2、什么是 GitHub 自托管 Runner?(中文)

GitHub Actions 有一个 self-hosted runner 功能,让 action 运行在你自己的服务器。本文详细介绍它的概念、原理,并结合案例进行实践。(@luhuadong 投稿)

3、CSS Grid Lanes 布局(英文)

浏览器开始支持 CSS 的 Grid Lanes 布局了,大大方便了瀑布流的实现。

4、6502 指令集适用汇编语言初学者(英文)

6502 是一块诞生于1975年的 CPU,很多早期电脑(比如 Apple II)都使用它。作者解释,为什么你应该用它,作为学习汇编语言的第一个指令集。

5、你应该多用/tmp目录(英文)

作者提出,Linux 系统的/tmp目录用起来很方便,完全可以把它当作自己的临时性目录。

6、中国的清洁能源战略(英文)

《纽约时报》驻华记者的长文,体验当代中国的生活,比如无人驾驶、无人机送餐,他说"感觉像生活在未来"。

工具

1、MADOLA

一种新的数学脚本语言,像编程一样写数学公式,可以编译成 HTML 格式作为文档,也可以编译成 C++ 或 WebAssembly 直接运行。(@AI4Engr 投稿)

2、CattoPic

一个基于 Cloudflare Worker 的图片托管服务,将图片上传到 Cloudflare 进行推过,支持自动格式转换、标签管理。(@Yuri-NagaSaki 投稿)

3、termdev

直接在终端,通过连接 Chrome Devtool 调试网页。(@taotao7 投稿)

4、tui-banner

为 Rust 语言的命令行项目添加一个横幅图案。(@coolbeevip 投稿)

5、Alertivity

macOS 菜单栏的资源监控工具,监控 CPU、内存、磁盘、网络和进程活动。(@nobbbbby 投稿)

6、cpp‑linter

C/C++ 代码的静态检查工具,可以接入 CI/CD 流程,简化代码质量管理。(@shenxianpeng 投稿)

7、Rote

开源的 Web 笔记软件,需要自己架设。(@Rabithua 投稿)

8、Infographic

JS 的数据可视化框架,用于在网页生成各种信息图,内置200多种模板。(@Aarebecca 投稿)

9、Clock Dashboard

天气时钟看板,适合老旧的电子设备再利用。(@teojs 投稿)

10、离线版问卷

开源 Web 应用,用来设计和托管调查问卷/报名表。(@chenbz777 投稿)

11、Xget

基于边缘计算(如 Cloudflare Workers/Vercel/Netlify)的加速引擎,可以加速程序员网站的访问速度,比如将github.com域名替换成xget.xi-xu.me/gh。(@xixu-me 投稿)

12、BoxLite

一个 Python 库,可以在脚本中运行一个微型虚拟机,提供硬件隔离。(@DorianZheng 投稿)

13、Green Wall

生成你的 GitHub 年度报告。(@Codennnn 投稿)

14、edge-next-starter

面向出海项目的 Next.js + Cloudflare 全栈项目模板,集成 Edge Runtime、D1 数据库、R2 存储。(@TangSY 投稿)

AI 相关

1、Chaterm

带有 AI 功能的智能终端工具,可以用自然语言完成命令行操作。(@zhouyu123666 投稿)

2、miniCC

网友开发的 AI 编程工具 Claude Code 替代品,主要用于学习目的。(@Disdjj 投稿)

3、Android Trans Tool Plus

一个开源的纯前端应用,通过 AI 翻译安卓资源文件,支持多语言同步、差异校验。(@huanfeng 投稿)

4、octopus

个人用户的大模型 API 聚合工具,支持接入多个模型供应商,提供负载均衡、分组名称、使用量统计等功能。(@bestruirui 投稿)

5、Vexor

一个 Python 工具,对当前目录的文件进行向量嵌入,用来语义搜索。(@scarletkc 投稿)

6、Tada

开源的任务管理应用,带有 AI 总结功能。(@Leaomato 投稿)

资源

1、大模型原理(英文)

一篇相对好懂的大模型原理解释,文章不长,并且还有大量的互动图形,写得非常好,推荐阅读。

2、编程语言速度比较

这个网站使用不同的计算机语言,通过莱布尼茨公式计算 π 值,然后给出运行速度的排名,最快是 C++(clang++),最慢是 Python (CPython)。

3、更好的 ZIP 炸弹

这个网页提供三个 ZIP 炸弹文件的下载,其中最小一个只有 42KB,但是解压后的大小是 5.5GB。

图片

1、2025年最佳科学图片

《自然》杂志评选的一组2025年最佳科学图片。

两只争夺领地的青蛙。

南非废弃天文台长出的蘑菇。

2、帽子,乌龟和幽灵

2022年,一个业余数学家 David Smith 发现了一个有点像帽子的奇特形状。

这个形状的奇特之处在于,它可以无限不重复地铺满整个空间,且不形成周期性的重复图案。

不久后,他又发现了两种稍加变化的形状,称为乌龟和幽灵,也可以不重复地平铺平面。

下面就是这三种形状各自平铺的图案。

言论

1、

我使用氛围编程会感到疲惫,AI 生成代码的速度太快了,我的大脑跟不上,无法及时完成代码验收或审查。我必须休息一段时间,才能重新开始。

-- 《氛围编程疲劳》

2、

制造汽车是非常困难的一件事。一辆车大约有3万个独立零部件,公司可能只会采购3000个,因为像车头灯这样的部件,是作为一个整体采购的,但它实际上包含很多组件。

里面的二级、三级、四级供应商提供的零部件,任何一个出现问题都可能导致整车的问题。

-- 汽车创业公司 Rivian 的 CEO 专访

3、

数码世界的现状是,很多人(尤其是大多数老年人)已经放弃了抵抗,任由电子设备将他们带到任何地方。

因为一旦你想搞清楚电子设备的运作,就会发现,在便利的幌子下,一切都充满了敌意,暗箱操作无处不在,不可能完全理清。你想从它们手中夺回个人数据和隐私会非常艰苦,而且注定失败,最终只会带来更大的挫败感。

-- 《一切并非必然》

4、

现在的学生拥有前所未有的优质教育资源,但他们却陷入成千上万种选择中不知该学什么、该用什么资源的困境。拥有资源并不意味着就能找到方向。

-- 《不要关闭你的大脑》

5、

危险并非来自中国的崛起,而是美国的思维模式。如果把科学视为零和博弈,那么每一项中国专利看起来都像是美国的损失。但创意是非竞争性的:中国的科研突破不会让美国人变穷,而是会让世界变得更富有。多极化的科学世界意味着更快的增长、更大的财富和加速的技术进步。

-- 《中国的创新》

往年回顾

西蒙·威利森的年终总结,梁文锋的访谈(#332)

电动皮卡 Cybertruck 的 48V 供电(#282)

好用的平面设计软件(#232)

新人优惠的风险(#182)

(完)

报告摘要

2025年11月24日,人工智能领域在开源社区和企业应用层面均展现出强劲活力。小米发布了业界首个开源的自动驾驶与具身智能融合大模型MiMo-Embodied,Sber也开源了包括视频生成在内的一系列新模型。学术界持续探索AI Agent、多模态及模型可信赖性等前沿方向。企业动态方面,三星与英伟达宣布合作共建AI巨型工厂,预示着AI将深度赋能智能制造。同时,AI在网络安全、音乐授权等领域的应用也取得了新进展。

一、模型发布与产品更新 (Model Releases & Product Updates)

  1. 小米发布MiMo-Embodied开源模型
    小米公司发布了业界首个开源的视觉-语言基础模型 MiMo-Embodied。该模型旨在无缝集成自动驾驶和具身智能(Embodied AI)任务,在任务规划、可供性预测和空间理解方面表现出色,为机器人和智能汽车的协同发展提供了新的技术路径。(来自newsbytesapp.com)
  2. Sber开源一系列生成式AI模型
    俄罗斯联邦储蓄银行(Sber)发布并开源了多个AI模型,包括:

    • Kandinsky 5.0系列:包含Video Pro、Video Lite和Image Lite,原生支持俄语提示,并能稳健生成含西里尔字母的图像和视频。
    • K-VAE 1.0:一个高性能的开源图像/视频编解码器模型,对训练视觉生成模型至关重要。
    • GigaChat Ultra Preview / Lightning:基于混合专家(MoE)架构的新模型,专为俄语任务优化。(来自newsbytesapp.com)

二、精选AI论文 (New Papers)

arXiv在过去24小时内更新了多篇值得关注的论文,主要集中在多智能体系统、联邦学习和AI可信赖性等领域:

  • arXiv:2511.16205 - ChemLabs on ChemO: A Multi-Agent System for Multimodal Reasoning on IChO 2025: 介绍了一个用于化学奥林匹克竞赛(IChO)多模态推理的多智能体系统,展示了AI在复杂科学推理任务中的潜力。(来自arxiv.org)
  • arXiv:2511.16423 - TOFA: Training-Free One-Shot Federated Adaptation for Vision-Language Models: 提出了一种名为TOFA的免训练、一次性联邦自适应框架,用于视觉-语言模型,旨在解决联邦学习中的数据异构性和通信效率问题。(来自arxiv.org)
  • arXiv:2511.16402 - Trustworthy AI in the Agentic Lakehouse: from Concurrency to Governance: 探讨了在Agentic Lakehouse架构中实现可信赖AI的挑战,从并发性到治理提出了一个框架,对构建可靠的企业级AI系统具有指导意义。(来自arxiv.org)

三、热门开源项目 (Open-Source Projects)

  1. google / adk-go
    谷歌为Go语言开发者推出的AI Agent开发工具包(ADK)继续在GitHub上保持高热度。它提供了一个代码优先的开源工具集,用于构建、评估和部署复杂的AI智能体,持续吸引着社区的关注。(来自github.com)
  2. microsoft / call-center-ai
    微软开源的AI呼叫中心项目热度不减,该项目允许开发者通过API调用或直接拨打电话号码与AI Agent进行通话,为构建自动化客服、语音助手等应用提供了基础框架。(来自github.com)
  3. yeongpin / cursor-free-vip
    一个旨在免费使用Cursor AI编辑器Pro功能的工具登上趋势榜。该项目通过重置机器ID来绕过付费限制,虽然这反映了社区对强大AI编程工具的渴望,但也引发了关于软件许可和道德使用的讨论。(来自github.com)

四、重大科技新闻与公告 (Major Tech News)

  1. 三星与NVIDIA合作共建AI巨型工厂
    三星电子宣布与NVIDIA深化合作,将通过建设新的“AI巨型工厂”(AI Megafactory)来引领全球智能制造的转型。此举旨在将AI技术深度整合到生产流程中,提升效率和创新能力。(来自samsung.com)
  2. Anthropic挫败首例AI驱动的大规模网络间谍活动
    AI安全公司Anthropic宣布,其协助识别并挫败了首个主要由AI智能体大规模策划的网络间谍攻击。该攻击在很大程度上无需人类干预,凸显了AI在网络攻防两端日益增长的重要性。(来自apnews.com)
  3. OpenAI招募Intel AI高管
    OpenAI招募了Intel公司的首席技术与人工智能官Sachin Katti。他将负责领导设计和构建实现通用人工智能(AGI)所需的庞大计算基础设施,显示出OpenAI在硬件和基础设施层面的战略布局正在加速。(来自technologymagazine.com)
  4. 索尼、华纳等与AI音乐初创公司签署授权协议
    索尼、华纳和环球三大唱片公司与AI音乐初创公司Klay签署了授权协议。这一里程碑事件为AI生成音乐的合法化和商业化铺平了道路,可能将重塑音乐产业的创作和分发模式。(来自technologymagazine.com)

https://track.linso.ai/zh/execution/cmicgehwr03cwl694l1nkc212