2026年1月

发现一个 Claude code 的教程,还是中文版的,虽然我也有在用 cc,但想把 cc 用好还是得进阶学习的,不然就算 opus 有时也会原地打转。

目录:

引言
什么是编码助手?
Claude Code 实战
Claude Code 安装与配置
项目准备
添加上下文
进行修改
课程满意度调查
控制上下文
自定义命令
Claude Code 的 MCP 服务器
GitHub 集成
认识 Hooks
定义 Hooks
实现一个 Hook
Hooks 常见坑点
实用的 Hooks
另一个实用 Hook
Claude Code SDK
Claude Code 测验
总结与下一步

原链接(英文)


📌 转载信息
原作者:
shaioo
转载时间:
2026/1/6 11:36:47

各位佬好,我是 Wipely 的作者。

最近玩 NotebookLM 确实上头,Slide 生成确实很强,但那个生成的 PDF 简直让人高血压 —— 全是死图 / PDF,想改个字、换个翻译都不行。 之前试过各种转 PPT 工具,要么跑版,要么收费死贵,最后只能对着屏幕干瞪眼。

心里想:既然你不让我改,那我就把你字全扣出来,变成没字的背景,再把字填回去变成可编辑的文本框!

于是趁着元旦假期,搓了这个在线工具。

这玩意儿能干啥?(不仅仅是擦除)

不仅仅是去水印 / 去字,更是 “复活” PPT:

  1. 智能去字 & 补全:自动识别文字区域,基于把字擦掉,并脑补背景填回去,还原一张干净的 “母版” 背景图。
  2. OCR & 还原可编辑文本:利用 OCR 识别原来的文字内容、颜色和位置,以可编辑文本框的形式重新填回 PPTX 里。
  3. 最终产物:导出的不是几张大图,而是真正的、文字可选中、可修改的 .pptx 文件
  4. 批量搞:支持整份 PDF 扔进去,批量处理导出。



L 站兄弟专属福利 (不整虚的)

新站上线,肯定是 Bug 满天飞。为了感谢各位佬帮我踩坑测试,直接上干货:

1. Pro 会员免费领 (1 年)

  • 暗号:不用绑卡!直接在升级页面选择 Pro 365 日免费试用!
  • 注意:不需要绑卡!直接 0 元购。截止到 1 月 9 号下午 5 点(首发这三天)。
  • 权益:解锁所有 Pro 功能(无限导出 PPTX),随便用。

2. 只有 L 站才有的永久特权

  • 就算不想领 Pro,也就是偶尔用用,我也把基础额度改了:永久每天免费 50 个文件
  • 重点:一个 100 页的 PDF 也只算 1 个文件。这下够用了吧?

传送门

https://www.wipelyai.cv/


最后碎碎念: OpenCV 在浏览器里跑确实吃点资源,第一次加载 opencv.js 可能会转圈几秒,我已经尽力做了缓存优化,大家体谅一下。 有任何 Bug、或者觉得识别不准、排版错乱的,直接在楼下喷,我在线修!


📌 转载信息
转载时间:
2026/1/6 11:36:28

https://www.canva.com/brand/join?token=nDN52ECZADA7-8GfzjWQBQ&brandingVariant=edu&referrer=team-invite

Team 2 第二队
https://www.canva.com/brand/join?token=-kAlYeiCDz0UP1kUfLI8Aw&brandingVariant=edu&referrer=team-invite

Team 3 第三队
https://www.canva.com/brand/join?token=Aya4fN0p583bKkNfhXXC-w&brandingVariant=edu&referrer=team-invite


📌 转载信息
原作者:
lhllinuxdo
转载时间:
2026/1/6 11:35:37

从在 Google 和 Amazon 打造传奇级平台,到写出 AI 驱动开发领域最具影响力的文章之一《初级开发者的复仇》(Revenge of the Junior Developer,这篇文章后来被 Anthropic CEO Dario Amodei 公开引用),Steve Yegge 数十年来始终站在软件工程的最前沿。而现在,他正带头冲向他所称的“代码工厂化”时代,如今他现在成为 Vibe Coding 理念最激进、也最系统的倡导者之一。

 

Steve 的职业生涯始于 1992 年,至今已深耕软件开发领域 30 余年。1998 年,他加入当时仅有 250 人的亚马逊,担任软件开发高级经理,在长达 7 年的任职期间,深度参与亚马逊的技术体系搭建,尤其在 API 战略制定方面发挥关键作用,助力亚马逊构建起早期的技术护城河。

 

2005 年,Yegge 加入谷歌,聚焦开发工具与代码智能领域,因不满微软开发者对谷歌代码库导航工具的抱怨,于 2008 年主导构建了强大的代码智能平台 Grok,由其赋能的 Google Code Search 成为谷歌技术生态的重要组成部分。

 

2018 年,Yegge 因认为谷歌变得“过于保守、不再创新”而离职,随后加入新加坡共享出行企业 Grab,大约两年后因疫情影响无法正常出差的他宣布离开 Grab。2022 年 10 月,结束短暂“退休”状态后,加入 Sourcegraph 公司,主导推动公司向人工智能企业转型。

 

期间,他主导构建了一个几乎完全由“vibe coding”构建的、拥有数万用户的问题追踪系统 Beads,目标是把开发者从“写代码”转变为“管理 AI agent 编队”:让它们在你睡觉时协同工作、并行推进、交付功能。用实际产品验证了“AI 主导开发”的可行性。

 

近期,在参加“Latent Space”节目中,Steve 甩出了不少“暴论”:

 

  • 现在还在用传统 IDE 写代码的,不是合格工程师,必须尽快转向 Agent 编程。IDE 的核心价值已不是写代码,而是自动索引和增量构建,应作为 AI 的辅助工具而非人类直接使用;

  • Claude Code、Cursor 以及整个 2024 年的技术栈已经过时,Claude Code 行不通,它操作复杂、需大量阅读,即便熟练使用者也会频繁被其 “离谱操作” 气到发疯;

  • 一年未接触 AI 编程的工程师已属 “恐龙级别”,世界级传统工程师若不拥抱 AI,一年后可能沦为实习生水平;

  • 驾驭 AI 编程需 2000 小时(约 1 年)磨合,核心是 “能预测 AI 行为”,而非情感上的信任。如果你把它当人,它真的会删你的生产数据库;

  • 真正的核心技能已经不再是写代码,而是学会指挥 Agent;合并(merge)正在成为所有 10× 高效团队撞上的新墙,高生产力导致的大量代码冲突无法用传统方式解决,部分公司已采取 “一仓库一工程师” 的临时方案;

  • “永远不要重写代码” 的旧规已失效。对越来越多的代码库来说,“推倒重写”已经比重构更快;

  • OpenAI、Anthropic、Google 在极速扩张下,内部实际上非常混乱。

 

下面是他在节目中的详细对话,我们在不改变原意基础上进行了翻译和删减,以飨读者。

 

“用传统 IDE 写代码,那不是合格工程师”

 

主持人:我们请到了传奇程序员 Steve Yegge。最近他还出版了《Vibe Coding》一书。本次访谈的主题就是围绕 Vibe Coding 和 AI Engineering 的交集进行讨论。你如何看待两者之间的关系?

 

Steve:这已经不只是一个技术点了,而是一场运动。需要让更多人参与进来。我在演讲中提到,现在已经出现了强烈的反对浪潮。AI 工程的核心是构建 AI 驱动的应用,而 Vibe Coding 则意味着摒弃旧的软件开发方式,采用全新的方法。这两件事,都把很多人惹毛了。

 

主持人:我觉得那些人之所以愤怒,是因为他们的身份完全绑在了“现在这套工作方式”上,而且不允许改变。

 

Steve:对,那我来抛出第一个“暴论”。真正受冲击最大的一群人,不是初级工程师,也不是中级工程师,这些人其实都在践行 Vibe Coding,反而是资深工程师和技术领导对 Vibe Coding 最反感,尤其是拥有大约 12~15 年经验的人。他们的身份认同建立在长期使用传统编程模式上,所以他们排斥 AI,也排斥 Vibe Coding,在网上说“我十几年的经验比你这破 AI 强多了”。

 

我看到过英伟达 Jordan Hubbard 的一篇帖子,写得很好,讲怎么更好地用 Agent 来写代码。结果底下有人回他说:“你还是老老实实做你的管理吧,编程这种事留给我们这种有十几年经验的人。”那种调调你肯定见过。

 

我就回他一句:“我觉得你得学会看时间”,他却反驳“等你有我这么多年经验再来。”我就说:“我都 45 岁了,还要等到 60 岁才能跟你说话?或者干脆把我 30 年经验砍掉,让我跟你一样愚钝?”

 

主持人:但现实是这些人会共存,就连 OpenAI 也是,之前聊到 OpenAI 里也有人不用 AI 写代码。

 

Steve:是的,他们有人不用 Codex,可能用的是 Cursor,但他们并没有在用 agent loop。从 Andrew Glover(OpenAI 开发生产总监)那边听到的说法是,他们内部已经看到了非常明显的差距,只是还在等更多数据再公开说。

 

这个差距大到离谱。不管你用什么指标,代码量、提交数、业务影响还是什么,都是 10 倍级。两个职位、职责完全一样的人,一个用了 Agent,一个没用,绩效评估时一个是另一个的十倍产出。那你怎么办?你会慌。你会去找 HR、找法务,问“我们现在还有什么选择”。

 

如果你 2026 年 1 月 1 日后还用传统 IDE 写代码,那你已经不是个合格的工程师了。现在就是你必须放下 IDE、开始学 Agent 编程的时候。这是一套新技能,非常复杂。我和 Gene Kim 去年一直在研究,写博客、做实验,每一篇博客都三十页起步,长到没法看。后来我们意识到:大家骂 AI 写代码不行,根本原因是你只花了两个小时试它,但问题是,你得花 200 个小时,甚至 2000 个小时去磨合才行。

 

有研究显示,你至少要和 AI 一起工作一年,才会真正“信任”它。这里的信任不是情感,是你能预测它下一步会干什么。如果它对你来说是不可预测的,你当然会愤怒。

 

等你真的理解了它的能力和边界,你就能驾驭它了。比如它会胡编、会记忆混乱、会“失忆”等,这些边界其实一直都在。现在的模型已经好用得多了,如果你两个月没试过,你已经落后了;一年没试,那你就是恐龙级别。

 

我有一些朋友,比我厉害得多,是世界级工程师,开发过你一定听说过的系统。但他们现在对 AI 的使用,也就停留在“问个像维基百科一样的问题”。说句残酷的,这些人一年后可能只能当实习生。

 

主持人:真的会这么极端吗?

 

Steve:我以前也只是个假设,直到遇到一个人。他有十多年经验,完全排斥 AI。后来他遇到两个欧洲的博士生,Agent、Vibe Coding 玩得飞起。虽然他们很初级,但完全没有恐惧,问题一个接一个地追问模型:为什么这么做?有没有别的方案?安全性呢?扩展性呢?测试呢?

他突然意识到:所谓“工程师思维”,本质就是问对问题。那一刻他明白了:我必须学这个。

 

但我必须说,这一点都不轻松。你不能指望随便试试 Claude Code 就能成功。即便你态度再正确,你最近两天有没有对 agent 爆过粗口?我会说“谢谢”“请”,然后下一秒骂它“你是不是脑子坏了”。这是因为我们后来意识到:这些 Agent 看起来很像人,但你绝对不能把它们当人。千万别拟人化大模型。它随时可能“背刺”你,比如告诉你“问题已经解决了”,然后顺手把你的数据库删了。

 

就是 Agent 编程真正危险的地方。你一旦觉得“它懂我了”“手感来了”,就会让它做生产改动,然后灾难就发生了。我亲身经历过。所以我们才写了那本书,不是为了炫技,而是为了告诉你:如果你不理解这套东西,坏事一定会发生。

 

主持人:那接下来呢?

 

Steve:是需要慢慢学的。就像开车一样,你得知道弯道在哪、减速带在哪。说白了,你是在学怎么“开快车”,想当的是 NASCAR 车手。

 

这套东西是高性能玩法。你一次同时用 12 个 Agent 写代码,野心比你过去任何时候都大。我今天还跟一个人聊,他同时在跑的项目比我还多,我都不知道他哪来那么多时间,但他现在大概同时推进十来个大型项目,全靠 Agentic Coding。

 

所以真正的广告词其实是:你会变成蝙蝠侠。但你不能直接把战衣一穿就说“我就是蝙蝠侠”,那只是 cosplay,你是在 cosplay Vibe Coding。你得学会怎么用工具腰带,而这个过程一定伴随着痛苦、踩坑、犯错和成长。

 

你可以通过读我们的书、读 O'Reilly 的相关书籍、看演讲来加速这个过程,多从不同角度了解,因为不同的人能 get 的“开窍点”是不一样的。总会有某个比喻突然击中你,让你一下就明白了。比如我觉得 Vibe Coding 就像 3D 打印,别人可能不这么认为,但这个类比却帮我打通了任督二脉。

 

主持人:让我最意外的一点是,很多人都表示,自己已经不再逐行写代码了,而是完全靠 prompt ,然后放手让 AI 去跑。

 

Steve:不编辑、不修改。整体看,这种“亲手改代码”的成本反而是很高的,甚至会让人觉得不如把 IDE 关掉、干脆卸载算了。其实也不是,后来终于有人说服我了,IDE 其实非常强大,尤其是它的“智能”能力,一定要开着。我指的是 Cradle Build。而且并不是为了 LSP,虽然那也能用,如果你有 MCP server,用 LLM 也是另一种不错的方式。真正关键的是,IDE 的智能自动索引速度非常快,增量构建也快得多,这一点非常重要。

 

“Claude Code 行不通”

 

主持人:还有一个点,你说 Claude Code 不行,能解释一下吗?

Steve:当然。Claude Code 从今年三月就已经出来了,也已经被证明是真的能用、能干活的。但现实是,全球大概还有 80% 甚至 90% 的程序员,根本没有在用它,甚至连类似的东西都没用起来。确实有少数公司用得特别猛,但大多数没有。整个世界还停留在 Cursor 上,还停留在 2024 年的水平。

 

去年我们还在拼命劝大家用“聊天”来写代码,别用补全了,他们就说不行;我们又说模型可以直接生成代码,你复制粘贴就行,他们又觉得这太麻烦了。我们说其实更快,但他们就是不买账。结果九个月之后,大家终于被“渗透”了,然后现在全在说:“我喜欢 Cursor”,可问题是,那已经是 2024 年的东西了,该醒醒了。

 

但即便如此,他们还是没有真正采用 Claude Code。那你会问为什么?答案其实很简单:太难了,这事儿是要读东西的。

 

说实话,大多数工程师眼里,五段话就已经算一篇论文了。而用 Claude Code,你要读的不是一点点信息,而是瀑布一样长的信息:生成说明、代码、diff,全都要看。因为一旦你真的把 IDE 放一边,你就必须认真看 diff。

 

好消息是,当你有了一点经验之后,其实不用逐行读代码,只看 diff 的形状、颜色、长度,你就能判断出很多东西:这是不是需要 code review?是不是方向错了?是不是为了解决一个小问题却改了过多代码?光是 diff 的“形态”,就能告诉你很多真相。但你必须关注它,否则这些问题只会在以后以更大的坑冒出来。

 

说实话,我自己每天用 Claude Code 十到十二个小时,连续用了好几个月,我还是会经常骂它、被它气到发疯,心里想“你刚刚明明理解对了,怎么还能干出这种事?”这种问题你一定会遇到。不过也有迹象表明,适当给模型一点压力,有时候反而能帮它突破卡点。无论如何,问题一定会有,但好消息是:明年的工具一定会更好。

 

如果 Claude Code 不是终局,那是什么呢?答案是:我们还是要回到某种“像 IDE 一样”的东西,因为那才符合人的直觉。你得一眼就能看明白发生了什么,而不是靠读大量文本;要有清晰的视觉信号。

 

但它又不会是传统 IDE,因为 IDE 是为“写代码”服务的,而现在你已经不再主要是写代码了。未来的东西,会是一个 Agent 编排控制台。你早上打开它,就像问一句:“今天情况怎么样?”。这个 Agent 还在跑,那个在调用工具,这个需要你输入一下。你只要顺着列表过一遍就行。

 

我现在就在做这么一个东西。原本是私有仓库,结果不小心开成了公开的,被 fork 了一堆,也就随它去了,你们也可以玩玩。它叫 VC(Vibe Coder),本质上就是一套已经设计好的工作流,帮你把一堆 Agent 跑起来。

 

编排革命

 

主持人:你有没有看到 Google 的那个 Antigravity 项目。

 

Steve:看到了,真的太有意思了。现在大家发布的这些东西,本质上都在验证我三月份提的那个判断。我当时管它叫“初级程序员的复仇”,还专门画过一张图。后来 Dario (Anthropic 联合创始人兼 CEO)还在各种客户顾问委员会上引用过这套说法,影响其实挺大的。

 

出处:https://sourcegraph.com/blog/revenge-of-the-junior-developer?utm_source=chatgpt.com

 

我当时就预测,Agent 编程太难了,未来会出现可编程的智能体编排工具,90%的重复工作都可以交给更便宜的模型来处理。比如遇到“二选一”的问题,让 Haiku 模型随便选一个就行。

 

所以我当时就说,“编排器”一定会出现。只是这个进程比我想象得稍微慢了一点,差不多到年底才真正跑出来,但整体时间点跟我预测的差不多。现在你看,Replit Agent 3、有 Conductor、还有开源的 DMAD,再加上 Google 的方案,都是不同形态的尝试,但本质是一回事,而且后面肯定还会更多。

 

主持人:我挺喜欢他们现在这个比喻的:你不用一直盯着 Agent,只要在它们工作的时候给你发通知就行。

 

Steve:对,正是这个方向。VC 里有个“活动流”,那是我加的第一个功能之一。我的理想状态就是:我去干别的事,只要偶尔收到一些“值得注意的进展”提醒就够了。

 

主持人:那以后会不会出现“Agent 的社交网络”?Agent 彼此认识、互相关注那种。

 

Steve:其实已经有人在这么干了。我前几天和Jeffrey Emanuel喝了三个小时咖啡。他是我见过最聪明的人之一,也是写那篇英伟达泡沫文章、直接把股市写崩的人。他后来做了一个东西叫 Agent Mail,本质原因特别简单:他受够了在不同 Agent 之间来回复制信息。于是他干脆做了一个“收件箱”,让 Agent 之间可以直接发消息。现在他只要一句话:“你们自己协调,把这个任务拆了”,Agent 就会自己分工去做。

有人是自上而下地做编排器,试图把一切都包起来;但你看我做的 Beads,再加上他这个 Agent Mail,其实是自下而上的。

 

主持人:而且 Beads 是纯 Vibe Coding 写出来的,对吧?

 

Steve:没错,完全是 Vibe Coding。说实话,我每天都会收到 PR,里面全是我之前引入的烂问题,但大家也不太介意,因为现在已经有稳定版本了。

 

Beads 本身就证明了一件事:你其实完全可以不用亲自看代码,只要你和其他人提的问题是对的,让 AI 去读、去改。现在我收到的很多 PR,很明显就是 AI 做了全部分析和编码。我甚至会把 PR 丢给我的 AI,让它评价“对方的 AI 写得怎么样”。

 

Steve 曾分享过 Beads 的开发过程:https://steve-yegge.medium.com/introducing-beads-a-coding-agent-memory-system-637d7d92514a

 

主持人:这样不会很糟吗?

 

Steve:如果结果是坏的,那当然糟。但 Beads 跑得好好的,还有好几万重度用户,那就说明这条路是成立的。当然,如果你把这种方式用在公司核心生产系统上,把网站搞挂了,那就是灾难。

 

主持人:但 Beads 本质上还是个数据库系统,数据库可不简单。

 

Steve:它的架构确实非常诡异,放在过去根本不可能维护,但现在你可以直接跟 AI 说:“坏了就自己修。”哪怕是数据损坏、merge 冲突,它都能修回来。

Jeffrey 那套也是一样,所有 Agent 都在同一个目录里跑,还做了文件预约系统:智能体会说“我需要这个文件”。说实话,这在老派工程师眼里简直是疯了。但一旦跑起来,Agent 自己就开始协作了,就像一个“智能体村落”。

 

主持人:所以真正的难点不是让单个 Agent 听话,而是让一群 Agent 协同。

 

Steve:没错。接下来大家都会撞上一堵墙:merge(合并),现在几乎所有团队都卡在了这里。

 

我认为最有希望解决这个问题的公司是 Graphite,我打算找他们谈谈的。我和 Gene Kim 经常和大企业沟通,我是 SaaS 销售,所以能听到很多大公司的内部情况。他们认为,一旦每个开发者的生产力都提升 10 倍,代码合并就会变成一个极其复杂的问题。

 

比如你和我同时工作两三个小时,各自做了 3 万行代码的修改,我先合并了代码。我可能修改了日志系统、架构和你正在使用的 API,这时候你的代码就无法直接合并了。这不是简单修复合并冲突就能解决的,你得基于我的修改重新构思、重新实现你的功能,或者删掉你的代码,让我重新做。

 

但归根结底,这些代码都是 AI 写的。关键是,代码合并必须序列化,得排队。当轮到你的代码合并时,你必须在最新的代码基础上重新做一遍。现在还没有人解决这个问题,这是个巨大的障碍。有家公司给出的临时解决方案你知道是什么吗?一个代码仓库配一个工程师,我可没瞎编。

 

主持人:传统的解决方案是堆叠差异(stacked diffs),就是合并队列、堆叠差异吧?这是 Facebook 的概念,现在他们想推广到开源社区,GitHub 也在开发相关功能。目前还没有成熟的解决方案,但你必须意识到这个问题,并围绕它做设计。

 

Steve:当然也有老办法:硬着头皮解决。

 

主持人:或者提前沟通说,“我要做一个深度架构修改,让我先合并,我们先达成一致的整体方案”。

 

Steve:是的,我也遇到过几次这样的情况。我试过让一个智能体提醒另一个智能体“我在做会影响你的修改”,就像 Jeffrey 的 mail 工具做的事情。等我把这个功能打通,智能体之间就能互相沟通了,到时候它们只需提醒对方“那个智能体在做影响你的工作,你们最好先达成一致的基础架构方案”。智能体没有 ego,不会争着“必须听我的”,谁先做谁就当领导者。

 

主持人:你和 Jeffrey 有什么分歧吗?

 

Steve:我们在一个核心问题上有分歧,即在同一个仓库克隆中让 12 个智能体工作是否可行。我支持用工作树(多个分支)或者多个仓库克隆,把智能体隔离开。他则认为应该让所有智能体在同一个仓库、同一个构建环境下工作,比如一个智能体正在构建、运行测试,这会产生很多冲突。但他有文件预约系统,所以他说“这很疯狂”,但也说服我承认:如果是独立开发者,用不超过 12 到 20 个智能体,这种方式可能确实可行,毕竟他自己就是这么做的。

 

这和 Beads 的原理一样,放在以前根本行不通,在真正的工程师看来毫无道理,但你只需告诉 AI“出问题就自己修”,AI 真的会修。所以他的系统能运行,因为偶尔文件预约系统出问题时,智能体会说“我们需要解决这个冲突”,然后自己搞定。

 

主持人:有意思。有人提议明年峰会的主题定为“多智能体”。

 

Steve:我完全同意。AI 的未来一定是多 Agent。现在我们还处在“用镰刀收割玉米”的阶段,这就是现在“真正程序员”的工作方式。很明显,明年我们就要进入“机械化耕作”的阶段,就像现在农场里的大型机械一样,我们要“工厂化编程”了。很多人从哲学、道德、伦理层面坚决反对,他们习惯了“自给自足的小农经济”,不适应“大型 John Deere 拖拉机”(代表工业化)。但我们确实正在进入编程的“John Deere 时代”。

 

Claude Code、Amp、Codex 这些工具,我对它们都一样喜爱,但它们也都一样“危险”。我在演讲中说过,它们就像电锯、电钻,高手能用它们创造奇迹,也可能一不小心把脚锯掉。Claude Code 也是如此。

 

想象一下,有一台大型农业机械,会用 Claude Code,还能检查代码,把“规划、实现、评审、测试”这些环节都拆分自动化,这就是工厂化编程,现在已经有人在做了,必然会成为趋势。它已经开始让非程序员也能参与编程,这彻底颠覆了公司的运作模式。

 

公司开始意识到,理想的团队规模可能只有两三人,公司的运营方式、治理结构都要改变。因为编程不再是瓶颈,业务人员需要直接参与,反馈循环变得更快。

 

这是个非常激动人心的时代,但对很多人来说,冲击太大了,他们要么选择逃避,要么在网上强烈反弹。而我敢预测,随着这种能力不断增强、代码真正进入“工厂化生产”,来自既得利益群体的反弹,只会越来越猛烈。

 

永远不要重写代码?错了!

 

主持人:你是少数几个能以这种态度提出这个问题的人之一。我知道观众里有不少人对“彻底拥抱这种方式”是持保留态度的,所以这个问题我只能问你这样的人。很多人觉得,这些工具写写前端、应用层代码还行,但千万别碰云基础设施、别碰后端,更别说分布式微服务了。

 

Steve:有人说“绝对不要动任何生产环境的代码,只是在生产环境使用,且一定要以 Git 作为兜底采用这些工具。你会很想写点什么,但别写。”如果有 Git 做备份,为什么还要担心?

 

人们觉得 AI 不擅长后端代码。这就是很多人数学不好的问题(指缺乏长远眼光)。ChatGPT 3.5 写系统级代码的能力有多强?说实话,非常差。那是多久以前的事了?但很多人现在还停留在那个认知里。老实说,我认为这里的误解,根源在于一种非常基础的信念:大家觉得模型已经“不会再变聪明了”。

 

有意思的是,就算模型真的不再变聪明(当然事实并非如此)我们其实也已经跨过了那个关键门槛:就像人类已经发现了电,接下来要做的只是如何把它用起来。即便只用今天这些模型的能力,我们也完全可以走到“代码工厂化”那一步,而且会非常快。我们今年夏天之前就能做到。

 

但现实是,模型正在以极快的速度变聪明。所以现在有一种有趣的现象:你在为模型“将来才会具备的能力”打造工具,而等这些能力真正被模型“内化进大脑”之后,这些工具本身就不再需要了。

 

于是,这就形成了一场持续的军备竞赛,同时也是一场工具的持续“衰减”:你的工具负责填补模型暂时空白的能力,等模型自己足够强、能填上这个空白时,这个工具就完成了使命,然后你再转向填补下一个空白。所以现在的趋势就是:所有代码、所有工具都在快速迭代,最终都会变成一次性的消耗品。

 

主持人:这反而是好事,毕竟工具也更容易构建了。

 

Steve:没错。说到这,我得提一个人,Joel Spolsky。他二十年前在亚马逊做过一次演讲,至今仍然成立。当时他提出一个金科玉律:永远不要重写代码。但现在我们发现,对于越来越多的代码库来说,直接推倒重来,比修修补补要快得多,而且效果更好,大模型尤其擅长这件事。我最早的体感来自迁移单元测试,与其不断修,不如直接全删了让模型重写,反而一下就完成了。

 

我们正在进入这样一个世界:最快的方式,是直接写一套更好的新代码,来完成旧代码本来想做的事情。这感觉就像一切认知被颠倒了,但你必须接受这个新世界。

 

主持人:你说这些话很有说服力,因为你不是年轻人“空谈未来”,而是几乎什么都干过。

 

Steve:是的。我用汇编语言写了 5 年程序,写过操作系统,做过游戏开发,做过平台,做过广告系统。游戏编程会逼你理解一切。游戏编程教会了我很多,现在再看所谓的 agent loop,和游戏里的主循环、本质上是同一类系统,操作系统循环也是如此。我感觉自己一直在重复构建相同的设计,只是换了领域。

 

谷歌、Anthropic、OpenAI 内部都很乱

 

主持人:我想让你谈谈谷歌。我最难忘的一个记忆是,在你退休前,你说谷歌还没“开窍”,尤其是谷歌云,还说他们的弃用政策很糟糕。他们现在好转了吗?

 

Steve:没有。我和谷歌的人聊过,很多人说“这就是谷歌的风格”。但有趣的是,在执行层面,谷歌已经好转了。他们终于做了 15 年前就该做的事:让员工承担责任,而不是让工程师随心所欲。过去 20 年谷歌都是这样,因为他们在广告领域有垄断地位,有足够的资金补贴工程师“随心所欲”。但最终他们还是得成熟起来,做出正确的选择,这个过程很痛苦,失去了一些谷歌文化,也没那么有趣了,但现在执行效率很高。随着 Gemini 的推出,他们逐渐把重心转向 AI,现在开始看到回报了。他们可能会成为最大的赢家。

 

主持人:那你怎么看 Google、Anthropic、OpenAI 这些实验室的状态?

 

Steve:说实话,这三家公司内部现在都非常混乱。Anthropic 把混乱掩盖得最好,这是他们产品经理的功劳,值得点个赞。这并不是因为 Anthropic 自己搞砸了,而是因为在这么快的增长速度下,混乱是不可避免的。

 

他们接下来要给 Claude Code 一口气招一百多号人,真的是在疯狂扩张。而这还只是 Claude Code 这一块。你要知道,我当年在 Google 和 Amazon 都经历过那种“必须先做大”的阶段,那时候必然是混乱的、动荡的。人们不知道该找谁、该跟谁对接,所有事情都一团糟。但慢慢地,一切会被理顺、会稳定下来,他们也会走到那一步的。

 

OpenAI 现在也很混乱,甚至更明显。他们经历了很多核心成员的离职。你要说是不是比 GitHub 那种失去大部分资深管理层、连续几年完全动荡的状态还糟,我也不确定,但 OpenAI 现在确实挺混乱的。

 

至于 Google,我们刚跟一个人聊到,说即便是在 Jules 团队内部,想在公司里达成共识、把东西推起来还是非常难。原因很简单:它太割裂了,像是由无数个小型“单体帝国”组成的集合体,一个个小应用彼此不沟通,导致任何跨公司范围的事情都极难推进。

 

所以现在这三家,其实都面临执行层面的挑战。我个人觉得 Anthropic 目前可能稍微做得好一点点,但差距非常小,战况非常胶着。接下来就很有意思了,看看 Oracle、Meta,或者其他公司能不能追上来。

 

主持人:Meta 值得关注,他们明年必须搞个大的。

 

Steve:明年很可能会成为开源模型之年。一旦开源模型达到 Claude Sonnet 3.7 一个水平,你打开 Klein 之类的东西,就能得到一个体验,至少和三月份的 Claude Code 差不多。虽然不如现在,但已经“够用”了,而且还是在你本地的 M4 上免费跑,真正的免费。

 

从我听到的情况来看,现在前沿模型大概还有七个月的领先优势,而且这个差距正在逐步缩小。这意味着,明年夏天,开源模型可能就能达到 Gemini 3 的水平。所以明年很可能会出现一个转折点:工具必须在任务拆解、模型分配上做得好得多,知道什么时候该用大模型、什么时候用小模型,才能把成本优化做好。

 

主持人:我也站在批判者的角度来说,他们认为之所以收敛,是因为模型能力是在逼近上限,提升会越来越慢。

 

Steve:这不是个小问题,而是一个根本性问题:AI 智力的发展曲线是线性的、指数的,还是趋近于上限的?

 

我们从一些非常接近研究核心的人那里听到的说法是,过去三十年里,受摩尔定律影响,AI 的“聪明程度”大约每 18 个月翻四倍。他们认为训练数据大概还能支撑两个这样的周期。之后会发生什么没人知道,可能继续上升,可能下降,甚至人类历史直接结束也不是没可能。但两个周期意味着三年后,它们会聪明 16 倍。

 

说实话,我也不知道“聪明 16 倍”具体意味着什么。但我花了很长时间去想这个问题,我的结论是:它们会变得非常、非常、非常聪明,一定会深刻改变世界,好的坏的都会有。

 

主持人:那孩子们还要学编程吗?

 

Steve:应该学 Vibe Coding。

 

主持人:你始终有一个“逃生口”,你想看代码的时候随时可以看,只是大多数时候你不需要看。但你能看,这本身就是一道护栏。不过我的看法是,不管怎样,如果你还懂一点真正的编程,你会更有优势,因为你的 prompt 更好。

 

Steve:当说到会编程的时候,但不是学语法,而是你要以一种“语言无关”的方式理解:函数、类、对象、monad 之类的能力边界是什么。你不再关心代码怎么写,但你关心它是怎么工作的。这个层级,其实已经接近产品经理或架构师的思维方式了。

 

你必须站在那个层级思考,而且你要理解所有工程层面的东西。就像我之前提到的 Jeffrey,他是数学家,自学成工程师,他不一定写代码,但他掌握了所有关键概念,知道 Cassandra 是怎么工作的。所以,就算你不需要亲手写代码了,你仍然需要学习海量知识,才能在这个新世界里成为一个高效的工程师,因为你和机器交互的层级已经被整体抬高了。

 

主持人:你还有没有什么想吐槽、想补充的?

 

Steve:我感觉最近“八卦”传播的频率上升了。不是那种“八卦”,而是工程师不断发现新方法、用 agent 变得更高效的那种兴奋感。

 

比如,我刚知道一个东西叫 Code MCP 之类的。因为 agent 并不擅长直接调用 MCP 工具,它们在这方面几乎没训练,但它们非常擅长写代码。所以你告诉它:不要直接调用工具,写代码去调用工具,它反而做得好得多。这种“小技巧”现在正在不断被发现,特别疯狂。Anthropic 自己其实不是最早发现这个的,是 Claudeflare 先发现的,Anthropic 后来才说“对,你们说得对”。

 

这也是为什么我特别喜欢把注意力放在 AI 工程师身上。我的观点一直是:AI 工程师是最能把 大模型潜力榨出来的那群人。你几乎可以把 AI 工程师定义为:不是训练模型的人,而是把模型“用到极致”的人。

 

这有点像一种颠覆式路径:当研究模型、训练模型还是高层次的事情时,当一个“GPT 包装工”显得没什么地位,但随着时间推移,这些人反而开始真正提升生产力,积累真实的专业能力。就像 F1 车手未必会造车,但他们对“怎么把车开到极限”的理解,甚至可能比造车的人还深。

 

参考链接:

https://www.youtube.com/watch?v=zuJyJP517Uw

本文为《2025 年度盘点与趋势洞察》系列内容之一,由 InfoQ 技术编辑组策划。本系列覆盖大模型、Agent、具身智能、AI Native 开发范式、AI 工具链与开发、AI+ 传统行业等方向,通过长期跟踪、与业内专家深度访谈等方式,对重点领域进行关键技术进展、核心事件和产业趋势的洞察盘点。内容将在 InfoQ 媒体矩阵陆续放出,欢迎大家持续关注。

 

我们采访了无问芯穹联合创始人兼 CEO 夏立雪,他指出,2025 年之前,算力集中于 “造模型”;2025 年起,“用模型” 的算力需求快速起量,尽管单纯扩大模型规模的边际回报递减,但整体算力需求并未下降,行业进入 “高效用模型” 的良性阶段。此外他表示,从企业一号位开始重视 AI 的公司,已在业务流中找到大量落地机会,决策层对 AI 的认知度,是未来企业拉开差距的关键。下面是详细对话内容,以飨读者。

 

两个代表性模型串联起今年 AI 圈

 

InfoQ:您眼中 2025 年科技圈的关键词是什么?您会怎样总结自己这一年的收获与遗憾?

 

夏立雪:我眼中的关键词是“跃升”。我认为,今年 AI 圈发生了非常多的可喜变化,由两个代表性模型串联,也包含了技术和产业两个角度。

 

第一个转变以 OpenAI 从 24 年底推出的 o1 模型为转折点,象征着模型从单次生成转向多步推理。第二个转变以 DeepSeek-R1 的发布为关键时刻,证明了软硬协同优化的核心价值,可以推动模型性能与应用成本巨大跃迁。而这两个模型不止带来了技术突破,也带动了巨大的产业跃升:一系列推理模型的不断出现使得 AI 能从事的工作越来越丰富,而开源模型(特别是中国的开源模型)站上人工智能舞台中央,大大加速了世界范围内各种 AI 技术的部署和实验,最终促成了行业智能体为代表的各种应用新物种的诞生。

 

与这个跃升相对应的,人工智能基础设施的关键指标在执行研发任务所需的“性能、资源利用率、算力成本”等基础保障指标之上,新增关注智能体规模化服务的“业务弹性、并发稳定性、可观测性、安全性”等服务效果指标,为这个堪称第四次工业革命的时代做好基础设施准备。

 

回头来看这一年,我很幸运能见证技术浪潮的重要拐点,而我们的技术路径能在其中创造真实价值,这种体验带来的信心,比任何事都珍贵。同时我也见证了团队的成长——既能沉下心打磨产品、陪客户啃硬骨头,又能持续在复杂的事情里面找最重要的问题,就像写数学公式一样,把最需要找到的核心剥出来,这个过程里,人是最大的收获。

 

算力需求却没有下降

 

InfoQ:在您看来今年跑出来了哪些明星公司,以及带来了怎样的行业影响?哪些企业相对落后了?

 

夏立雪:DeepSeek 是今年公认的明星公司。从生态上看,R1 的出现和它的开源姿态,极大地活跃了 AI 中下游的创新生态,让许多创业公司和开发者,能以更低的门槛获得接近前沿的推理能力,去试验和构建自己应用。

 

从算力用量上看,虽然整体上单纯扩大规模的回报在边际递减,但算力需求却没有下降。因为如果把模型制造和使用方当作一个整体玩家,你会发现从去年到今年初,基本全部算力资产都配置在了“如何造模型”,今年开始“如何用模型”的算力起量,这也是一个良性的变化。

 

关于企业的领先和落后,我的观点是 AI 是一个全新的“物种”,每一个行业都有与 AI 紧密合作的巨大机会。而我看到的现象是,在同一个行业中,自一号位开始认真拥抱 AI 的,明显已经在自己的业务流中找到许多落地的机会了,所以决策人的认识是未来拉开差距的关键点。而 AI 还在不断创新,所以我更愿意说这是一场面向未来的、所有玩家都需要边跑边学的马拉松。

 

InfoQ:根据您的观察,科技公司今年面临的压力如何?对此采取了什么样的应对措施?员工们的状态如何?(可以针对广泛的科技圈,也可以是您所在公司或细分行业公司)

 

夏立雪:今年的行业压力,更多还是在兴奋与焦虑中负重转向。以 DeepSeek 为代表的推理范式和智能体应用前景的爆发,给大家带来了一些转型压力。这种转型不止是应用产品的迭代,它会牵动整个技术栈、组织架构和商业逻辑的变化,大家都在焦虑自己的速度能否跟上范式迁移的浪潮。

 

面对快速的变化,一个组织最容易遇到的问题就是决策困难,而我们因为从诞生之日就以“让 AGI 触手可及”为目标,所以在复杂的变化中能够保持冷静和坚定,比较早就洞察到了变化,率先在相应领域进行了布局,这也是创业公司的敏捷性优势,让我们在变局中保持了一定的主动性和节奏感。甚至我们会认为,今年的许多变化都是让通往目标的路径更清晰的喜讯,这让我们信心满满。

 

在员工状态方面,作为一家身处前沿的 AI 企业,我们看到许多同事展现出极强的适应性与学习热情,积极拥抱技术变革带来的挑战。整体上,团队在对技术未来充满信心的同时,也对工作稳定性和清晰的职业发展路径产生了更强烈的期待——这是一种理性和积极并存的健康状态。

 

全球在真正生产中使用中国 AI

 

InfoQ:经过一年竞赛,国内前沿 AI 水平取得了怎样的成绩?是否赶上了硅谷科技公司?

 

夏立雪:最近 OpenRouter 和 a16z 合作的报告里讲得很清晰,全球对开源模型的使用激增与 DeepSeek V3 和 Kimi K2 等主要开放模型发布相吻合,而且这些增长持续了长时间,说明全球正在真正的生产中使用中国 AI。我们今年也自己出去走了走,体感是高度一致的。

 

这个时代可以说,是自工业革命以来,中国第一次能够以技术引领者,而不仅仅是追随者的身份,站在一场世界级产业革命的前沿。我们不仅在解决别人的问题,更在定义新的问题、新的赛道和新的游戏规则。

 

InfoQ:您认为,2026 年的技术赛点可能是什么?您会重点关注哪些行业和技术?

 

夏立雪:2026 年的技术赛点可能还是聚焦在智能体上,基础设施如何让数字世界智能体在各种场景中规模化落地,以及如何通过云端协同帮助具身智能(作为物理世界的智能体)从实验室走向特定场景的落地验证,是我们会重点关注的方向。

 

ReScript是一门强类型并可编译为 JavaScript 的语言,最近发布了 ReScript 12.0 版本,完成了为期多年的开发路线图,对编译器工具链进行了现代化改造,并通过改进的语法和性能提供了更佳的开发者体验。

 

ReScript 12.0 引入了多项重要特性,包括完全重写的构建系统改进的运算符、支持模式匹配的字典字面量嵌套记录类型JSX保留模式以及正则表达式字面量。此次发布还带来了模块化的运行时架构和平台专用二进制文件,显著减小了安装体积。

 

ReScript 12 的亮点特性之一是新的构建系统,该系统已于去年11月提前推出,具备智能依赖追踪和更快的增量构建能力。新系统现在能更精确地追踪依赖关系,避免不必要的重新编译,并且即使在 monorepo 包之间也能与增量工作流集成。这解决了随着项目规模扩大和 monorepo 日益普及而暴露出来的旧构建系统的局限性,此前的构建系统主要适用于单包项目。

 

对于仍需使用旧版“legacy”构建系统的项目,可通过rescript-legacy命令执行buildbuild -wclean操作。预计该命令将在 v13 中移除。

 

ReScript 12 最终完成了去年早些时候引入的统一运算符工作。算术运算符如+-*/%**现在对intfloatbigint具有一致的行为,编译器可根据左操作数自动推断正确的具体类型。开发者现在也可使用+进行字符串拼接,不再需要过去用于浮点运算的+.-.*./.等遗留运算符。

 

ReScript 12 还支持编译为普通 JavaScript 对象的字典字面量,相比Dict.fromArray大幅减少了样板代码。模式匹配也支持字典,可简洁地解构 JSON 载荷和配置对象:

let user = dict{"firstname": "John", "role": "manager"}switch user {| dict{"name": name, "role": role} => Console.log2(name, role)| _ => Console.log("missing user metadata")}
复制代码

开发者可通过"jsx": { "version": 4, "preserve": true }启用 JSX 保留模式。编译器将直接输出 JSX 语法,而非将其转换为react/jsx-runtime调用,这对ESBuildSWCBabel等打包工具非常有用,使其能够应用自己的转换逻辑。此举既保持了与 React Compiler 的兼容性,又确保输出中的 JSX 保持可读性。

 

从 ReScript 11 升级的团队应查阅迁移指南并预留过渡时间。本次发布包含若干破坏性变更,最重要的是移除了对 JSX v3 的支持、采用新的运行时包结构(以@rescript/runtime取代原有设置),以及 API 命名变更(原先以Exn结尾的函数现在改为以OrThrow结尾)。迁移工具包含一个 codemod,可自动完成机械式的重命名以简化过渡过程。

 

由于引入了平台专用包(如@rescript/darwin-arm64@rescript/linux-x64@rescript/win32-x64),安装体积可以大幅缩小。npm 现在只会安装与操作系统和架构匹配的二进制文件,从而加快安装速度,并减小 CI 流水线中的缓存占用。

 

围绕 ReScript 12 发布相关的新闻,社区讨论尚不热烈,但该语言仍持续将自身定位为 TypeScript 的替代方案,提供更强的类型保证。在 Reddit 上,有用户评论称这是个好消息,因为他曾以为该项目已经停止维护。也有用户质疑为何应选择 ReScript 而非 TypeScript,一位评论者给出了如下对比:

TS 仍然包含 JavaScript 的所有缺陷,并且其设计本质上是不健全的。ReScript 是用 OCaml 构建的,因此你可能会获得市面上最快的编译器之一,再也不用等待 5 分钟才能完成生产构建。

 

较早的对比指出,ReScript 的类型系统是健全的,能保证绝不出错;而 TypeScript 的类型系统仅仅基于推测,有时在运行时仍可能出错。ReScript 的编译速度也远快于 TypeScript,尽管 TypeScript 在生态系统采用率和 JavaScript 互操作性方面仍占优势。

 

ReScript 是一门开源的编程语言,可编译为高效且人类可读的 JavaScript。它最初源自OCaml,现已演变为拥有独立语法和工具链的独特语言。ReScript 在 React 开发中尤为流行,提供一流的 JSX 支持和极速的编译器,可轻松扩展至任意规模的代码库。

 

ReScript 12.0 Released with New Build System

随着 AI 大模型技术的爆发,应用开发的门槛正以前所未有的速度降低。

为进一步激活 AI 垂类应用的创新活力,微信小程序正式推出“AI 应用及线上工具小程序成长计划”

该计划将提供云开发资源、AI 算力、数据分析、广告变现及流量激励等全方位支持,帮助开发者将想法快速转化为可落地、可破圈、可盈利的产品,陪伴开发者完成从“0 到 1”的孵化与“1 到 100”的商业跨越。

全方位扶持上线,携手开发者开启小程序 AI 应用元年

过去,许多“小而垂直”的用户需求常因开发成本过高或变现路径不畅而被忽视。如今,AI 不仅重塑了交互方式,更让极速开发成为可能。更令业界振奋的是,随着 iOS 虚拟支付在微信生态的全面落地,过去制约工具类应用变现的“短板”已被补齐,虚拟服务与订阅模式的商业闭环已经形成,这意味着 AI 应用在小程序内“跑得通”之余,也能“赚到钱”。

本次成长计划的激励期为 2026 年 1 月 1 日至 2026 年 12 月 31 日,覆盖了开发、运营、变现等核心环节:

  • 免费的云开发资源:微信云开发提供完备的小程序后端能力(数据库、云函数等),支持对接 AI 大模型和 Agent;新开发者可免费创建 6 个月的个人版云开发环境,已有云开发环境的开发者可领取大额抵扣券;

  • 免费的 AI 算力支持:激励活动期间,开发者可使用总计 1 亿 Token 的腾讯混元最新文生文模型混元 2.0 额度,以及 1 万张混元文生图模型额度,后续腾讯混元最新的模型也将陆续上架,方便开发者直接使用;

  • 免费的数据分析能力 &专属流量激励:运营增长方面,平台免费开放 We 分析专业版一年,帮助团队基于深入数据洞察实现业务增长;同时,在公众号图文发布小程序相关内容并带上 #来微信做个小程序 话题,有机会获得更多公域流量;此外,「微信-发现-小程序」等专属曝光入口,将帮助优秀的线上工具小程序被更多用户看见;

  • 更友好的商业化变现:商业化方面,平台将开放安卓、iOS、鸿蒙等全终端的虚拟支付与会员订阅能力,并给予限时优惠费率;同时,支持广告变现“免开发智能接入模式”,无需复杂开发,系统可自动推荐小程序内的广告展示位置并支持实时预览、上线,让变现更加顺畅。

所有线上类应用均可参与计划,包括线上工具、AI 原生及娱乐类小程序等。小程序开发者可以登录「微信小程序后台(mp.weixin.qq.com)-行业能力-AI 小程序成长计划」参与计划,新开发者完成注册后即可参与。

众多标杆案例涌现,小程序成为 AI 独立开发的“第一站”

相比 App 动辄数月的开发周期,小程序独立开发具备周期短、上线快的优势。加上微信内的聊天转发、朋友圈、公众号等社交分发路径,优质产品容易形成口碑传播,甚至引发跨平台讨论,转化率远高于传统的 App。

目前,小程序生态内已经涌现众多极具代表性的 AI 原生应用。例如《猜盐》小程序利用大模型将信息游戏化,吸引用户持续参与问答互动,并实现极佳的用户自发口碑传播;《传图加画框》小程序通过 AI 生图能力为书法、国画、油画等图像作品加框美化,通过 AI 能力为艺术作品增色添香;《风格转换器》小程序凭借 AI 绘画功能,成为微信生态内具有代表性的 AI 生图小程序,不仅用户活跃度高,更成为社交平台刷屏内容的源头;《金攒攒》小程序也凭借着简洁的界面与直观的操作,让黄金的资产管理变得轻松愉快。

此外,如《配音神器》、《写作鹅》、《作文说》等工具类小程序,正在深入视频创作、教育、文字工作等细分领域,展示出 AI 与垂直场景结合的巨大潜力。

在 AI 能力快速迭代的当下,技术门槛已不再是鸿沟,创意的重要性正愈发强化。微信小程序正聚焦于通过资源加码与政策激励为开发者的创意和实践铺平道路,小程序生态正愈发成为 AI 应用快速验证的最好阵地。

“推出成长计划仅仅是一个开始,未来,平台将持续加码,聚焦生态基建,助力每一位心怀创意的开发者将想法变为现实。” 微信团队表示。

1 月 5 日,零一万物正式对外发布了《中国企业智能体 2026 六大预判》,并对外展示了其在企业级多智能体方向上的最新探索成果“万智 2.5 企业多智能体”。

企业智能体 2026 年六大预判

 

零一万物中国区解决方案和交付总经理韩炜表示,企业智能体正从“单点工具”进化为“智能管理系统”。多智能体架构的本质,是重构了企业的组织形式,让 AI 从“单点提效”转向“全局优化”。这不仅是技术的跃迁,更是组织生产关系的重组。

 

基于与某世界能源巨头、友邦等多家行业头部客户的 AI 变革实践,零一万物总结出中国企业智能体演进的六大核心预判。

预判一:智能体从“一人一工具”进阶“一人一团队”

 

过去单点 AI 工具解决的是任务自动化问题,而多智能体推动的是整个企业组织的系统性智能化。

智能体不仅仅是执行单元,更能将公司内部的优秀能力沉淀成可复用、可组合的业务资产。当智能体可以将顶尖人才的能力进行拆解和重构,同时封装成可复用的能力模块,根据实际生产场景进行落地和执行,企业将不再受限于“招聘-培养-流失”的人才循环。一个顶级销售、资深律师、王牌产品经理的专业判断力,可以被高效复制和执行、24 小时运转,在毫秒级时间内部署到全球任意分支机构。

 

零一万物提出,智能体团队将像水一样具有超强的适配度和延展度:业务高峰期自动扩容,低谷期静默待命。这种“弹性超能力”让中小企业首次拥有了与巨头同台竞技的“不对称优势”。企业应通过多智能体实现业务能力的“软件化”与“服务化”(CaaS,能力即服务),推动整个企业组织的智能化。 

 

预判二:多智能体需具备 TAB 三要素

 

零一万物认为,下一代企业的竞争优势,将取决于其将业务能力转化为数字资产的速度。零一万物提出,多智能体必须具备 TAB 三要素:

 

  • AI Team(团队作战):人和智能体、智能体和智能体之间可以进行智能协同,1 人指挥 1 支智能体团队成为可能,进而突破“人才瓶颈”,实现“能力软件化”的跃迁,让企业摆脱对单一专家的依赖,实现能力的弹性伸缩。

  • AI Auto-pilot(业务裂变):可以根据实际核心生产业务生产场景进行智能规划,过程可控可查,确保交付质量。开启个人业务能力指数级增长,企业业务线容易在垂直深度和规模化增长中找到平衡点。

  • AI Business(商业重构):多智能体流程、产出均可沉淀,通过提取并重构团队能力模块,实现商业模式的原子颗粒度重构,这正是零一万物助力企业在 AI 时代实现“能力即服务”(CaaS)的核心逻辑。

 

多智能体将企业的核心能力解构成可组合的能力模块,像乐高积木一样自由拼装。

预判三:中国将成为全球多智能体落地的“超级引擎”

 

中国拥有全球最完整的产业链、全球领先的开源模型、超大规模市场及丰富的复杂业务场景,为企业级多智能体提供了天然的试验田和进化土壤。这不仅是一次“弯道超车”,更是一场“换道超车”。

 

从底层技术的角度来看,中国模型的开源实践正在推动底座平权。中国在开源大模型领域的全球领先地位,为企业提供了具备全球竞争力的技术基座,降低了 AI 应用门槛,推动技术普惠和生态共建,使得更多企业能够平等、高效地接入智能转型浪潮。

 

同时,基于门类齐全的制造业体系与超大规模的消费市场,中国有望实现从 “世界工厂”到“智能体工厂” 的跃迁。零一万物强调,中国企业在智能化转型中已不再满足于使用通用模型,而是需要深度结合行业知识、业务流程的“业务级智能体”。

 

预判四:“一把手工程”是赢取 AI 红利的关键路径

 

参与企业 AI 数智化转型不是技术部门的单点试验,而是企业战略与组织架构的系统性重构。零一万物认为,单点突破仅是开始,如果局限于“局部优化工程”,反而会制造出新的“数据孤岛”。只有 AI 科技公司与企业的深度共创,全局突破,才能更全面兑现“变革红利”。

 

这一过程中,需要具备“技术信仰型领导力”的一把手,以全局价值导向克服既得利益,推动 AI 变革。这种“技术理解力”也将成为领导力的新护城河。传统 CEO 可以不懂代码,但 AI 时代的 CEO 必须懂“AI 的可能性边界”。就像乔布斯不需要会写 iOS 代码,但他必须知道“多点触控”能重新定义手机。

 

零一万物表示,在与头部客户的合作中,“一把手工程”模式的价值已经得到验证,在后续的调模型、找场景、搭应用的落地过程中,FDE (Forward Deployed Engineer)成为承接一把手工程的关键。既懂代码又懂业务,是技术管理复合型人才,像特种部队一样深入一线,用代码解决商业问题,用商业思维优化技术方案。

 

预判五:智能体反哺推动企业数字基建“自主进化”

 

智能体不仅是数字化的“消费者”,更将成为企业数据与知识体系的“建设者”。通过自动标注、数据清洗、行为反馈等机制,智能体能在运行中持续丰富企业知识库、优化决策模型,形成“数据飞轮”,并且在未来形成企业“记忆库”。这种自主进化机制将大幅缩短企业从数字化向智能化跨越的周期。

 

预判六:2026 年将成为企业多智能体规模化“上岗元年”

 

随着智能体技术成熟与场景深化,2026 年企业竞争的焦点将从“招多少人”转向“指挥多少硅基军团”。多智能体将率先在数据基础完善、业务流程复杂、协同要求高的领域实现规模化部署。相应地,“智能体运营师”将成为企业新兴关键岗位,负责智能体的部署、训练、评估与优化。

 

对于人类员工而言,决策力成为知识工作者的核心竞争力,具备综合判断力与决策审计力的“复合型员工”将成为人机协同的核心。而对于企业而言,企业的核心竞争力将体现在三方面:早(尽早引入)、快(选用最先进 Agent)和有闭环数据(利用自身数据持续训练)。

 

“我们不再沿用大厂销售标准化产品的模式”

 

基于上述六大预判,零一万物万智企业大模型一站式平台(以下简称万智平台)正式升级至 2.5 版:企业级多智能体成为平台的核心企业应用之一,好比 Office 之于 Windows 系统。

 

据悉,针对企业场景中动态、开放的难点,万智 2.5 采用了“代码先行、模型驱动”的硬核架构。相比传统只会在画布上按照既定工作流运转的通用型 AI Agent,万智平台支持通过 MCP 协议和安全沙箱环境,不仅能确保多智能体执行时切合企业真实生产场景,且能实现工业级的稳定性。

 

韩炜表示,“零一万物团队与大厂团队模式不同,我们不再沿用大厂销售标准化产品的模式,而是更注重基于客户需求进行梳理和设计,将其转化为产品原型。这对解决方案团队的能力要求非常高。随后,我们会将原型交付给产品与研发团队,以类似 FDE 的模式高效推进,迅速为客户交付可用的演示版本或 PoC(概念验证)场景。通过这种方式,我们持续缩小自身与客户之间的理解落差。

 

他补充道,以往大厂的产品与客户需求之间存在显著的理解落差,这常常引发交付问题,导致最终成果与客户预期不符,需求范围不断蔓延。这也正是大厂在承接定制化项目或智能体相关项目时持续亏损、意愿不强的原因之一。大厂往往认为此类业务规模效应有限,而零一万物正在积极探索的新模式,能够持续降低交付成本、缩减与客户的沟通差距,并在此过程中寻求可行的盈利路径。这是我们团队的定位以及我所负责工作的核心方向。”

 

在零一万物的产研版图中,企业级多智能体的实现依托于基模-框架-应用“三位一体”的整合:

  • 底层是开源基座模型与行业垂类模型,以及零一万物两年来所积累下的模型训练方法论;

  • 中间是企业级多智能体技术框架,负责将模型封装为角色化、工具化、可协同的 Agent 团队;

  • 顶层则是面向行业的“超级员工”与解决方案,如 AI 招商专员、AI 保险顾问等,直接对接业务部门并承担 KPI,为企业客户带来可量化的价值。 

 

整合过往的合作经验,零一万物也为企业客户规划出了企业多智能体进化“三步走”布局:

 

第一步,确立“一把手工程”下的全局策略。 零一万物认为,AI 数智化转型绝非单纯的技术试验,而是深刻的业务重塑。企业必须由 CEO 亲自挂帅,将多智能体的表现与企业的核心 KPI 深度绑定。在落地初期,便要敢于切入高频、复杂、多部门协作的核心业务链路,以全局视角指引技术与业务的融合。

 

第二步,引入 FDE 模式跨越组织鸿沟。 针对转型中常见的部门墙与数据孤岛,企业需借助前置工程师(FDE)深入一线“破壁”。这一阶段的关键在于防范系统性熵增,拒绝盲目堆叠智能体数量,而是通过精细化管理,紧盯准确率、响应延迟与 Token 效能,避免陷入“内耗型架构”。 

 

第三步,通过协同进化跨越技术鸿沟。 企业应摒弃盲目的“榜一模型崇拜”,拥抱开源多模型混合架构。通过夯实目标规划、系统调用、安全审计、多模型协同四大核心能力,企业将构建起稳固的三层架构:以开源及行业大模型为“底座层”,以企业级多智能体技术框架为“中枢层”,最终在应用层孕育出能够真正解决问题的“超级数字员工”。

 

零一万物技术与产品中心副总裁赵斌强表示,2026 年,企业多智能体上岗的过程,就是将“TAB 三要素”转化为生产力的过程。而这其中的关键胜负手,就在于以“一把手工程”推动技术与组织的协同进化。零一万物的目标,正是基于万智 2.5 开放平台,助力企业 AI 转变为能够持续产生复利、驱动商业模式创新的核心资产,从而在这场以“组织智能”为核心的转型浪潮中,赢得关键加速度。

 

结束语

对于 Agent 的未来发展,韩炜表示,长期有可能“模型即应用”或“模型即 Agent”最终会实现,就是最终 AGI 的时代,但这个时间线有多长还不确定。从短中期来看模型和应用之间还是有比较大的差别,Agent 有记忆能力、调用工具能力,现在还有通过 Multi-Agent 对抗式分析的能力,这是单一模型可能很难具备的。特别针对企业场景而言,模型不是 Agent,模型只是 Agent 的“大脑”。大脑之外至少还缺四样关键的东西:

 

一是安全、可控、合规。这个对于企业来说是非常重要的,企业不仅仅关心会不会回答,更重要的是答错了谁来负责,Agent 需要基础于特定的企业记忆(Enterprise Memory),了解企业专属边界。

 

二是工具和系统的能力。模型本身不会调用你的 CRM,不会登录你的内网系统和下单采购,Agent 必须具备稳定的工具调用能力,去保证跨系统调用的准确率和效率。

 

三是包括 Multi-Agen 在内的企业级 Agent 里面,特别需要智能体做目标和任务的规划。模型只会天生对下一句话去负责,Agent 需要对业务目标负责,企业级 Agent 需要理解 KPI,比如签单量、周转天数、风险敞口等 KPI 的目标,把这些目标拆解成目标和任务,并且在执行过程当中动态调整计划。

 

四是多模型、多角色的协同。在真实的企业环境中往往是多模型共存,包括自研模型、开源模型、商用模型等,不同的场景需要选用不同的模型或者不同参数量的模型,没有最好的模型,只有最适合场景的模型,这个可能是比较重要的。企业级多智能体需要做的是根据任务选择不同的模型,可能不同的子 Agent 用不同的模型,包括主 Agent 也用的并不一定是参数量特别大的模型,这是基于实际场景的情况。另外,在多智能体的中分工协同互相校对也很关键。

 

零一万物认为,AI Agent 颠覆性价值在于行业重构,重点将从降本转向增效。

Clicks 推出 Power Keyboard 和 Communicator 手机

1 月 2 日,科技初创公司 Clicks Technology 发布了继实体键盘保护壳之后的首批新品。

其中,Clicks Communicator 手机被定义为一款「现代通讯伴侣」,定位类似于 Kindle 之于 iPad,主要作为用户的第二部手机使用。该设备运行 Android 系统,直板设计,配备 4 英寸屏幕与实体全键盘,重 170 克,厚 12 毫米。为了减少信息干扰,其系统界面由 Niagara Launcher 深度定制,摒弃了传统的应用网格,转而采用极简的消息聚合中心。硬件方面,Communicator 有 5000 万像素后摄、2400 万像素前摄,保留了 3.5mm 耳机孔、静音开关与 MicroSD 卡槽,侧面设有可根据通知类型改变颜色的信号灯按键,搭载 4000mAh 电池。处理器和存储参数未公布。该机起售价为 499 美元(约合人民币 3487 元),目前提供 399 美元的早鸟预订价,预计将于今年晚些时候发货。

另一款新品 Clicks Power Keyboard 则是蓝牙键盘与移动电源二合一设备。它支持 MagSafe 与 Qi2 无线充电标准,可以磁吸在手机背面。键盘采用滑盖式设计,除了作为手机的实体键盘外,还支持通过蓝牙 5.4 连接至多三台平板电脑、智能电视等设备。Power Keyboard 重 180 克,厚 15.2 毫米,电池容量为 2150mAh,其中 500mAh 划分给键盘使用。该产品定价 109 美元(约合人民币 790 元),早鸟价 79 美元,将于今年春季正式发售。


Pebble 推出 Round 2 手表

1 月 2 日,智能手表品牌 Pebble 发布 Pebble Round 2。作为品牌重启计划的一部分,Round 2 复刻了 2015 年推出的 Pebble Time Round,旨在通过更现代的技术重现这款当年「业界最薄」的圆形手表经典设计。

在硬件设计上,Pebble Round 2 解决了初代产品边框过宽的痛点。新品在保持 8.1mm 超薄不锈钢机身的同时,搭载了一块 1.3 英寸彩色电子墨水屏,像素密度较前代翻倍至 283 ppi,且具备背光功能。Round 2 保留侧边实体按键,让用户可在会议等场景下通过触觉盲操作。

为实现 10 至 14 天的续航,Pebble Round 2 在功能上做了明显的取舍,仅保留计步、睡眠追踪等基础健康功能,未配备心率传感器,因此不适合作为运动追踪设备使用。系统方面,它运行开源的 Pebble OS,兼容数千款表盘与应用,内置麦克风支持语音输入与回复,但受限于苹果系统限制,该功能目前主要面向 Android 用户,iOS 端的支持将率先在欧盟地区开放。此前,Pebble 已推出过一款具备录音转写功能的低成本 AI 智能戒指,官方表示未来计划将类似的 AI 能力引入手表端。

该产品定价 199 美元(约 1390 元),即日起在官网开启预售,预计将于今年 5 月发货。对于此前已预订方形表盘 Pebble Time 2 的消费者,官方也提供了保留排队位次改订 Round 2 的选项。


DeepSeek 发论文介绍高效训练技术 mHC

1 月 1 日,DeepSeek 发布了一篇由创始人梁文锋合著的技术论文,提出了一种名为「流形约束超级连接」(Manifold-Constrained Hyper-Connections, mHC)的新型深度学习架构。该研究旨在通过优化计算效率,在算力资源受限的环境下,以更低的成本训练更大规模的模型。

mHC 技术是对「超级连接」(Hyper-Connections)架构的进一步改良。超级连接最初由字节跳动研究人员于 2024 年 9 月提出,旨在改进由微软亚洲研究院何恺明等人发明的 ResNet(残差网络)主流架构,以解决深层网络中的信号衰减(信息在传递过程中「声音」越来越小,深层网络接收不到有效信息)与模型坍塌(无论输入什么不同的数据,层层处理后变得相似甚至趋同)。

DeepSeek 团队指出,虽然字节跳动的方案提升了网络复杂度,但在大模型训练中忽略了日益增长的显存成本,导致实际扩展性受限。就此,DeepSeek 的 mHC 方案通过引入特定的流形约束,让数据流仅在特定的几何轨迹(流形)上运行。这在保留超级连接优势的同时,成功解决了内存与成本瓶颈,实现了「几乎可忽略的计算开销」。论文数据显示,DeepSeek 研究团队在 30 亿、90 亿及 270 亿参数规模的模型上测试,实证结果表明 mHC 具备优于传统架构的扩展性,且能维持大规模训练的稳定性。

该论文由梁文锋本人账号上传至 arXiv。梁文锋此前仅亲自发布过 DeepSeek 最重要的技术论文(如 R1 和 V3 模型相关研究),且被列为本文的最后一位作者,这一举动证实了他仍深入参与核心研发,也被视为 DeepSeek 下一代核心模型技术路线确立的信号。目前市场预期 DeepSeek 可能延续 R1 的发布策略,在 2 月中旬的春节假期前发布新款大模型。


华硕通知渠道今起涨价

VideoCardz 报道,华硕于去年 12 月 30 日向合作伙伴发出《2026 年产品价格调整说明函》,宣布将于 2026 年 1 月 5 日起实施价格调整。

该函称,受全球供应链结构性波动影响,多项关键零组件正承受严峻的成本上升压力,特别是 DRAM 内存和 NAND。此变动源于「全球原厂产能配置调整」「先进製程投资成本增加」,以及「AI 算力需求导致的产业结构性缺口」。

尽管华硕未列出具体受影响的型号,但明确表示将「针对部分产品组合策略性价格调整」。由于此次调价生效日期恰逢 2026 年 CES 开幕前夕,业界分析认为,华硕即将在 CES 上发布的新一代硬件产品,特别是 AI PC 及电竞设备,将首当其冲,并可能确立新的市场价格基准。

华硕强调,此次调价是公司在「长期吸收与因应成本压力后所做出的必要决定」,目的是为了「确保稳定供应、维持品质与服务水准」。针对后续影响,华硕业务代表将主动联系合作伙伴,提供详细说明并协助规划最适切的因应方案或配置建议。

华硕公关部门证实了该文件的真实性,但向媒体澄清,这是一份仅供渠道合作伙伴参考的内部商业沟通文件,并非面向公众发布的正式新闻稿。


新一批作品进入公有领域

2026 年 1 月 1 日,全球迎来一年一度的版权释放重要时刻。弗洛伊德、爱因斯坦、汤因比等名家名作分别在美国、欧洲或中国等司法辖区进入公有领域。

在美国,随着 1930 年作品保护期的终结,福克纳的《我弥留之际》、弗洛伊德的《文明及其不满》等著作,《西线无战事》等电影进入公有领域。蒙德里安与保罗·克利的画作、初代「贝蒂娃娃」、迪士尼最早期的普鲁托(当时名为 Rover)形象均不再受版权限制,基于这些早期素材二次创作成为可能。

在实行「作者有生之年加 70 年」版权期限的司法辖区,如欧盟、英国、俄罗斯,1955 年逝世作者作品保护期届满。这意味着物理学家爱因斯坦、《人性的弱点》作者卡耐基、诺贝尔文学奖得主托马斯·曼的作品在这些地区将不再受版权限制。

在实行「作者有生之年加 50 年」版权期限的司法辖区,如中国及亚洲和非洲大部分地方,1975 年逝世的作者作品保护期届满。这包括蒋介石、历史学家阿诺德·汤因比、苏联作曲家肖斯塔科维奇、政治哲学家汉娜·阿伦特等。


比亚迪超越特斯拉成为 2025 年全球电动车销量榜首

据《纽约时报》报道,2025 年,特斯拉失去全球最大电动汽车制造商的位置,首次被比亚迪超越。根据 12 月 31 日公布的数据,特斯拉全年交付量同比下降 9% 至 164 万辆,其中第四季度销量受政策冲击暴跌 16%。相比之下,比亚迪全年纯电车型销量增长 28%,达到 226 万辆,并凭借价格优势在亚洲、欧洲和拉美市场实现了显著扩张。

特斯拉销量的下滑主要受到美国政策急剧转向的冲击。尽管马斯克在 2024 年大选中大力支持特朗普,但共和党重新执掌白宫和国会后,迅速废除了最高 7500 美元的联邦电动车税收抵免,并着手削弱清洁空气法规。特斯拉作为占据美国电动车市场 45% 份额的绝对主力,成为此项政策变动的最大受害者,导致其第四季度交付量从上年同期的 49.6 万辆锐减至 41.8 万辆。

除外部环境恶化外,特斯拉自身的产品迭代滞后也是关键因素。其主力车型 Model Y 自 2020 年上市以来未见重大更新,新推出的 Cybertruck 销量惨淡。在欧洲市场,特斯拉的销量已被大众汽车反超。此外,马斯克将公司重心转向自动驾驶出租车(Robotaxi)和人形机器人,但尚未产生显著营收,且在自动驾驶落地进程上已落后于谷歌旗下的 Waymo。

行业分析师预测,2026 年美国电动车市场将持续低迷,需等到 2027 年更多低于 3 万美元的廉价车型上市后才有望回暖。尽管汽车销售疲软,但华尔街因看好其在自动驾驶领域的长期潜力,特斯拉股价目前仍维持在历史高位。与此同时,比亚迪虽然因高关税壁垒无法进入美国市场,但已确立了其在全球其他市场的领跑地位。


看看就行的小道消息

  • 近日,多名 Reddit 用户抱怨多邻国通过实时活动功能显示订阅广告,而这是 App Store 审核规则禁止的行为,可能被下架处理。多邻国后来似乎停止了广告展示。
  • 据 StackOverflow 官方数据,该站在 2025 年 12 月仅新增 3862 个问题,已低于初创不久时 2008 年 8 月的水平。
  • 据路透社查阅的 Meta 内部文件显示,面对全球监管机构打击社交媒体诈骗广告的压力,Meta 制定了一套名为「全球剧本」(Global Playbook)的应对策略。文件揭露,Meta 并没有全面验证广告主身份、根除诈骗,而是通过操纵搜索结果,使监管机构难以发现违规广告,以此通过合规审查。例如在日本,Meta 团队发现监管机构会通过特定关键词(如名人姓名)在公开的广告资料库中搜索诈骗广告,于是在监管审查前针对性地清洗相关搜索结果,制造出诈骗广告已大幅减少的假象。此外,当一地加强监管时,算法会自动将诈骗广告流量导向其他监管较松的地区。此前,Meta 曾因 Facebook 和 Instagram 上泛滥的投资诈骗和 AI 合成名人代言虚假广告而面临日本、新加坡等国政府的严厉质询。
  • 1 月 3 日晚,雷军在新年直播中披露,2025 年小米汽车交付量目标原本定的是 30 万辆,中间提高到 35 万,最后实现超过 41 万辆,并宣布 2026 年小米汽车交付目标为 55 万辆。当晚,雷军直播四个小时,随工程师团队完整拆解了一台 YU7。拆车结束后,雷军集中回应了近期围绕小米汽车的多项舆情与争议。关于「1300公里只充一次电」「200公里瞬间刹停」等营销表述质疑,雷军表示,相关说法源自驾驶体验展示视频,主要用于展示 SU7 的续航、刹车性能,有完整视频作为佐证,但在传播过程中被「断章取义」。雷军还承认「小字营销」是行业陋习,接受批评,已于去年 11 月要求各业务团队尽量使用大字直观展示。


少数派的近期动态

  • 年末「夯」一下!少数派 2025 年度盘点正式上线
  • 少数派会员年终福利来袭,引荐比例限时上调至 15%,邀请好友享 85 折入会优惠。参与活动
  • 好玩又实用,还有迪士尼授权配件可选,少数派「扭扭宝」充电宝火爆开售。来一个试试
  • GAMEBABY for iPhone 17 Pro & 17 Pro Max 系列现已上市。进一步了解
  • 《蓝皮书》系列新版上架,一起探索全新 iOS 和 macOS 的精彩。试读并选购


你可能错过的好文章


    什么是 Game Jam

    Jam,原意是「果酱」、「交通堵塞」等。把语境替换到音乐文化中,则有着「几个音乐人聚在一起,即兴演奏、创作」的意思。那么「Game Jam」,则是「一群游戏爱好者聚在一起,即兴设计、开发游戏」。

    Global Game Jam (GGJ) 是一年一度的全球最大游戏极限开发活动,在世界各地的众多线下站点同时举行。 创作者需要在规定的时间内(常见为 48 小时),根据大会的主题给出主题,完成一款体现核心玩法的游戏 demo。GameJam 活动不仅可以在限定的时间内激发开发者的情感创意,同时还是一个大型的创作者交友与交流活动,策划、编程、美术、音乐等不同职能的创作者在此相聚,在有限的时间内创造无限的可能性。

    UcImbyXsRoBlu3xd3A5cie3bn6c

    从 2009 年第一届 GGJ 创办以来,在一次次短暂的聚会之后,不少 demo 也获得了持续的开发,最终推出正式版本,出现在更多人的面前。

    Z6vAboWdGomvxlxtoT2cWJ8XnGg

    Game Jam 同时也是锻炼团队协作的好机会,你可以提前约上朋友一起参与,又或是在现场和新认识的小伙伴临时组队,在 48 小时的限时协作中互相了解、磨合。不少开发团队成员的结识,也都源自线下 Game Jam 活动。

    为什么选择 Global Game Jam?

    Game Jam 类活动其实有很多,而 Global Game Jam 是全球规模最大、影响力最深的线下 Game Jam 活动,每年吸引超过 100 个国家的数万名开发者参与,2009 年至今共有 132 个国家和地区的超过 47 万名开发者参与了此项活动,在 48 小时内完成了 101,246 款游戏。

    I8cPb9Y9soxKArxVqqGcT0rMnqj
    图源:万物破元游戏博物馆

    关于荔湾站

    荔湾站发起人浜浜(苏浩浜)是一个参与了 10 年 GJ 的广州本地人,从2015年第一届广州 GGJ 至今,从平面美术到 TA,参与并组织了无数场游戏开发者活动。这一次,他想做一场 20~30 人的小型经典 Jam,保留路演和After Party,还原印象中 GJ 最初的味道。

    • 老城新区:老城区公园活化社区,周边成熟的社区配套与人文景观,好吃的、好玩的不在话下;Jam完还能逛吃逛吃,灵感与味蕾双重满足
    • 助力光环:精酿现场供应创作灵感,更有喵星人鼓励师常驻,夜晚可能有专业DJ闪现演出,开发配打碟、微醺GJ也许不是梦
    • Indie之味:独具氛围的场地,与人文景观、文艺地标为邻。专业级多媒体设备助力路演,人人齐当产品经理;在这里,你的声音会被听见

    站点场地信息

    Heim精酿酒馆 / 少数派广州体验店:一个能够听音乐、放松、畅饮、交流、撸猫的线下场地,毗邻 1200 书店。这里不只有创意,还有啤酒、猫咪和志同道合的伙伴。

    活动详情

    • 时间:2026年1月30 ~ 2月1日(具体日程参考活动行页面)
    • 地点:广州市荔湾区 Heim精酿酒馆(1200 书店附近,报名后有详细指引)
    • 费用: 100元/人,一人一票(通过活动行购票,见文末)
    • 开放时间:场地并非 24 小时开放(具体开放时间早上9点至晚上10点)
    • 装备提示:请勿使用台式电脑等功耗较高、体积较大的设备;请自备排插等相关设备

    谁可以参加?

    • 须年满18岁,只要想参加都可以,但非常建议对 GameJam 有事先了解
    • 建议:游戏开发者、程序员、美术设计师、音乐人、策划、写手等创意工作者
    • 尤其:独立游戏爱好者、想尝试做游戏的新手、寻找队友的独狼
    • 欢迎单人或组队报名!也可报名后现场组队!

    你需要准备什么?

    • 笔记本电脑及电源
    • 创意和热情
    • 有线插座(重要!)
    • 耳机(建议,保持现场安静)

    报名方式

    1. 通过活动行链接 https://hdxu.cn/1DCYu(或扫下面的二维码)购买入场票,开发者请选开发者票,想来看看路演和试玩的,可以选择观众票,一人一票;

     

    AYC7bA3qbojzVPxOwthcwxquneh

     

    X0rlbMhsboSbapx2lcHctwuxnIg

    扫码小程序中打开

    扫码网页中打开

    1. 前往Global Game Jam官网 https://globalgamejam.org/ 注册账号(指引另附)
    2. 搜索关键词" Liwan"加入“GGJ China 2026 × CiGA – Guangzhou - Liwan”站点或直接前往https://globalgamejam.org/jam-sites/2026/ggj-china-2025-ciga-guangzhou-liwan加入
    3. 联系站点负责人浜浜(微信:13508431263),加入站点的筹备群
    VNqmbvz2aoTa7wxbCwYc7X0Ln1d

    2026 年的第一个月,在广州老城区里,期待创意的现场碰撞,产生独具魅力的作品。

      这篇文章是 TDS Studio 在少数派上的第十六篇文章,依然是全平台首发。虽然迟到了,祝你新年快乐。

      我们近年来对于小米的音频产品其实大多数都没给出多么高的综合评价,它们或多或少都存在一些问题,尤其在早期,稳定性往往也不是尽善尽美。在时隔近一年半之后,我们又是首发购入了最新一代小米旗舰半入耳 TWS,进入 Buds 6 时代的小米,能否补足 Buds 5 时期的问题,佩戴上不那么容易滑脱,降噪是否可能提升一些,并做出更完善的基础调音,这些都是我们关心的。但你可以看到我们的评分,所以……我们还是详细来看看。

      包装与配件 | Package & Accessories

      包装还是小米音频产品的老样子,比较小巧的天地盖纸盒,通体白色,表面有设计一次性封膜的拉手贴纸——虽然非常容易拉断就是了。内部的配件只有一条 USB-C to USB-A 的短充电线,的确半入耳产品也不太需要更多的内置配件。首发购入的时候平台也赠送了我们之前在小米开放式耳机 Pro 购入时类似的皮质收纳包。这个收纳包有轻度的抗压性,拉链顺滑度一般,表面有类似 SU7 Ultra 的双条纹图案。然而,这个包显然不是给 Buds 6 设计的,Buds 6 在里面会乱晃,我怀疑就是给我来了个开放式耳机 PRO 的包……

      设计、佩戴表现与声学结构 | Design, Fit & Acoustic Structure

      小米 Buds 6 共有月影黑、钛光金、珍珠白、星云紫四种配色。根据我们在小米之家线下看到的情况,Buds 6 前三种配色跟过去的小米耳机其实没有特别大的区分度,所以我们自然是购入了星云紫版本。它的实物观感跟 SU7 的霞光紫有相似之处,质感上都有着类似金属漆面的感觉,而 Buds 6 的这个紫色会更加浅一点,甚至有点往索尼的玫瑰灰那个方向靠近的趋势。我个人对于这个新颜色还是挺喜欢的。

      充电盒的体积仍然比较小,像是一块小香皂,精致程度足够高。基本的形状跟 Buds 5 类似,依然由三种质感拼成,上盖为抛光、底座为磨砂的阳极氧化质感,盒内则为磨砂纯色塑料,不同点在于上盖的电镀改成了类似烤漆的质感,不再凸显指纹,对紫色来说也更有高级感。开盒的手感不错,有明确的弹性反馈,配对按键位于盒子底部,按下反馈的扎实程度良好。

      耳机在盒内仍然是「趴着」的,但是这次你不能直接让耳机靠上去就完事儿,而是「半靠、半插入」地让耳机放进去,磁吸力度倒是没问题。充电触点回到了底部,不如上代容易清理。

      耳机本体是基于 pods 形态半入耳结构进行调整,腔体比较偏向于扁圆而非椭圆,相对饱满,而前腔的突出程度较低,相对比较扁平。接触耳道口的部分仍然是磨砂,但这次不会像上代那样可能容易松脱。对于大多数人来说,Buds 6 的佩戴还是较为舒服的,且我个人觉得比 AirPods 4 更无感一点,但是半入耳很依赖耳道口耦合,建议还是线下找个小米之家多试试。单边重量 4.4g,比上代稍重 0.2g,但是实际佩戴并不会有明显感知。

      小米 Buds 6 支持 IP54 级别的防尘防水,作为半入耳耳机,还算满足使用。

      腔体并没有什么被动隔音能力,且这次小米强调了腔体气流通路的优化,这也意味着,嗯,更加开放了一点。

      操作与软件端功能 | Control & APP

      小米 Buds 6 的操作是依靠捏动柄部的触控区域进行的,识别区域有专门的凹槽用于盲操,不过捏上去并不算舒服,连续多次操作大抵会让指尖不适——这点相较于上代并没有明显改善。默认的逻辑是按压一次控制播放、按压两次下一曲、三次录音、长按切换降噪、滑动控制音量。

      佩戴与操作识别的表现有点不太好评,目前在 1.8.9.0 和 1.8.9.5 的早期固件下,我们发现它在摘下暂停的操作会有约一秒的滞后,而佩戴好恢复降噪和播放状态则需要更长的反应时间。它对于操作的识别也是这样,多次点击的准确率还有提升空间,且也会稍微不那么跟手。另一方面,它对于操作反馈的提示音非常难以察觉,结合不太舒服的操作触感,有时候都得反应一下到底这个操作是否真的被准确识别了。

      「耳机盒」开关提示音倒是相对响亮一些,且反馈特别快,但是只能是耳机在盒内时才能使用,我们推测这个声音更多来源于耳机本体而非耳机盒。

      在米系设备之外,依然是依靠「小米耳机」 app 来进行各项操作与固件升级。基于小米耳机 app,你可以实现降噪控制、声音模式切换、固件更新、录音、自定义操作等功能,目前小米和 Redmi 品牌近两代的 TWS 耳机及其限定版基本都有支持。这个 app 的 UI 设计基本上是 HyperOS 那一套,好不好看另说,逻辑还是清晰的。

      这次在传统的响声查找功能(响声还是不大)之外,还加入了苹果的 Find My 网络——我们实际使用下来,它基本和第三方的类 AirTag 体验类似。

      我们关心的软件端功能,自然还是录音和翻译。

      单边 90min,与上代一致。在进行实际尝试之后,我们也能够看到它的录音文件规格为采样率 16kHz 的单声道 m4a 文件,比特率在 32~35kbps 之间——码率居然有进步(笑),但采样率缩减了,和开放式耳机 Pro 一致,而上代 Buds 5 是 48kHz。实际聆听下来,录音质量只能说是在安静环境录个通话是够用了,但是更进一步不太可能。比特率过低、麦克风拾音能力的限制,使得它的录音表现仅仅是通话水平。受限于通话降噪做得一般,所以嘈杂环境的使用也是问题,我们在通话部分会详尽介绍。

      就我们在嘈杂环境录音的样本进行转写,它的准确率也比较低。翻译质量…… 如果转写的文本本身对头的话,翻译的准确度还是足够你进行理解的。同声传译时,它可以选择读取耳机收到的内容还是手机播放的内容,但对于耳机收到的语音主体无法进行准确识别。同声传译的速度有一些滞后,这个就没办法了。

      降噪与通话 | ANC & Call

      作为半入耳降噪耳机,它天生不具备足够稳定的耳道口耦合以及被动隔音的辅助,所以十分依靠于麦克风的性能以及算法的能力。跟上代类似,小米 Buds 6 在开启深度降噪之后实际效果依然非常有限,只能对于基本的稳定低频噪声有一些处理,无论是降噪深度还是频宽覆盖都比较一般。在嘈杂环境中几乎起不到太多作用,只能是在比较安静的如办公室之类的地方,可以减少一些空调噪声、电脑风扇之类的东西的影响而已。它的降噪可用性相较于 AirPods 4 ANC、Galaxy Buds3 等还有明显距离,甚至 QCY AilyBuds Pro 之类也会有更加明显的降噪实感。总体的降噪感知甚至不如上一代明显。

      值得一提的是,它的耳压感并不严重。不过在极其安静的环境下,你能听到降噪模式开关前后的几秒内有短暂的底噪(是伴随提示音出现的),深度降噪使用过程中也会有等级更低但依然可感的底噪存在。

      抗风噪方面,小米官方标称的抗风噪是能够搞定最高 12m/s 速度的风,这方面表现还可以。它的抗风噪并不是单独的模式,而是整合在降噪里面。在测试风源开启之后,它会有几秒中的反应时间,随后对于正面的风源有着比较明显的削弱,而侧面、背面的风源则削弱不会那么明显。

      通话方面,小米声称通话降噪深度可达 95dB…… 但实际这套三麦降噪的效果,真的是聊胜于无。我们在运营商网络进行通话测试,它的实际通话稳定性还是相当不错的,在同价位属于第一档水准。安静环境里,它的收音是明显偏闷的。在通话状态下,来自侧面与背面的风噪会对于通话主体的清晰度产生一些影响,正面直吹影响相对较小。

      综合来看,我们认为小米 Buds 6 的降噪能力依然是不太具备实用性的,在 TDS 降噪综合能力金字塔中可以拿到 In-Ear Medium Level 的分级,且排名在同级别靠后。

      信号与续航 | Connection & Battery

      作为支持 aptX Lossless 的骁龙畅听认证设备,小米 Buds 6 对于 aptX Adaptive 显然是向下兼容的。我们将基于 Adaptive 进行主要的信号测试。

      在 48kHz 档位,在 WLAN 开启或关闭的情况下都很难出现卡顿丢包情况,基本上可以说有着比较出色的信号稳定性表现。在距离八米且有遮挡的状态开始出现卡顿丢包。在 96kHz 档位,卡顿会在约 5.5m 处开始出现。可以认为在信号非复杂环境,Adaptive 的双档位都可以进行近场的稳定使用,聆听体验相对顺畅。在 AAC 连接 iPhone 14 场景下,连接稳定性相对还不错。额外地,它依然有高通平台的老问题,即远距离丢包后会有短暂的声音质量明显下降,靠近后一段时间才会恢复正常。

      延迟方面,在默认的状态下以 aptX Adaptive 编解码器信号优先连接 Xperia 5 III,进行流媒体视频和本地视频观看,它的延迟大概控制在正常语速约大于半个字的程度。

      它也支持双设备连接,且与 aptX Adaptive 等不冲突。

      续航方面,官方标称仅耳机连续播放 3.5h(AAC、降噪开、50% 音量)或 3h(aptX Adaptive、降噪开、50% 音量),在关闭降噪后最长则可以到单次 6h。搭配充电盒最高一共 35h。个人经过标准流程测试下来,以 aptX Adaptive 编解码器 48kHz 档位连接 Xperia 5 III,开启自适应与降噪,设置其他为默认,以 50% 音量连续播放流媒体音乐(Apple Music Lossless)、播客节目(小宇宙),仅耳机续航为 3 小时 12 分钟(标识满电状态开始计入),跟标称值还是有一些差距的。

      充电方面,我们依然进行了测试,它可以在 2.5W 左右比较稳定地充电,PD 支持没问题。

      空间音频 | Spatial Audio

      终于,空间音频是可以与高码率编解码器共存了,但它的空间音频仍然是并非严格 Dolby Atmos 定义的状态。我们还是走标准流程,以下的描述我们基于这样的场景配置:标准测试设备 Xperia 5 III 以 aptX Adaptive 连接,开启耳机的空间音频,固定位置(关闭头部追踪),搭配聆听 Apple Music 的原生 Dolby Atmos 音源和哔哩哔哩的杜比全景声适配视频。

      无论哪个场景,小米 Buds 6 都能够比较完整地呈现出脑后的信息量,空间音频的空间呈现在横纵向上终于规整了一些,且边界感相对清晰,这是巨大的进步。不过,在两种场景下,它对于音色改变依然是明显的,你还是可以感知到混响的增加,部分乐器的结像位置产生了变化,现在呈现出的样子像是个「剧场模式」。头部追踪的准确度还行,不会有甩着甩着丢了的问题。

      怎么说呢…… 至少空间表现有进步了,下一步把音色问题解决好,我们觉得说不定下一代 Buds Pro,小米能够拿出还不错的方案。现在算是个听上去还挺有意思的「空间化立体声」而非严格的空间音频。我们建议体验空间音频时打开自适应听感来获得比较好的综合感知。

      扬声器、声音模式和编解码器 | Driver, Sound Modes & Codec

      小米 Buds 6 搭载了一颗 24K 镀金球顶的复合振膜动圈单元,三磁路设计。支持自适应算法动态补偿中低频听感,但在出厂的 1.8.9.0 固件下,我们发现自适应听感开启后有一定可能产生算法 bug 导致偏音,但是并非 100% 复现,且在更新至 1.8.9.5 之后目前还没有出现这个问题。所以如果你手上的小米 Buds 6 也出现了偶尔偏音——尤其是偏左——的情况,欢迎在评论区告诉我们。这个自适应开启之后最大的改变就是总体声压的提高和低频比例变多。

      依然是与哈曼联合调音的,包装上也可以见到 HARMAN AudioEFX 的标识,但默认的声音模式不再是 Harman AudioEFX 了,这次小米 Buds 6 延续了开放式耳机 Pro 默认声音预设是「均衡听感」的做法。相较于这个均衡档位,Harman AudioEFX 明显要更加浓郁、厚重,人声略凹,而「哈曼大师」则是加厚低频的同时没有过度影响人声清晰度。在室外聆听时可以适当考虑哈曼大师的选项。除此之外还有三种预设和自定义均衡器,支持 8 个频率点的 ±4dB 调节——相较于上代有缩减。

      你可以开启最高 2.1Mbps 的码率,即 24bit / 48kHz 档开启 LE Audio 的 aptX Adaptive LE——当然是限制部分机型支持的。对于其他手机来说,它支持的编解码器为 SBC / AAC / aptX Adaptive / aptX Lossless(1.2Mbps)/ LC3。

      声音主观描述 | Sound Description

      基于 aptX Adaptive 编解码器 + 均衡听感,关闭自适应,固件版本 1.8.9.5。

      低频量感适中略偏少一些,厚度和饱满度都不算高。弹性则相较于 Buds 5 有明显进步,下潜也还可以。收放速度适中,保留的残响不多。氛围烘托的晕染感和浓郁度都比较轻。由于半入耳的特性以及主动降噪并不算明显,Buds 6 在室外会有明显的低频泄漏,即使打开自适应听感依然会有明显的不足感。我们认为为了听力健康考虑,不建议盲目在嘈杂环境把它开到大音量来 get 更多的低频感知。在关闭自适应的前提下,Buds 6 良好佩戴的情况也就只能提供不算完全偏薄偏弱的低频而已,相对紧绷而存在感不多。基音位于中下盘的乐器没有明显前倾。

      中频,人声稍近,口型比标准稍小一点,精致程度还比较高。对于人声的质感和线条更加偏向于后者,厚度不算多,线条相对扎实程度还行。对于男女声之间的倾向性不算明显,适合偏细偏上盘的人声类型。颗粒感有所打磨,顺滑程度是不错的。音色渲染不算多,仅有轻度的为了悦耳度的调整。喉音位置稍高,气声比例不算足,口水声的前凸不多。齿音有轻度的打磨,但是在部分曲目中还是有感知。人声总体的通透程度比较高,相较于 Buds 5 自然度也会有进步。在开启自适应之后,人声的厚度和口型都会有所增强,而声线的适应性也会稍广一些。

      乐器方面,也是线条较为优先的风格。弦乐器中,小提琴、中提琴、吉他等的抓耳感比较高,但是不会有明显的不自然,拉拨弦的细节有一定的突出。大提琴的形体感不算扎实,在空间里所占比例也偏小。铜管类的气势感不算足,需要亮度的小号等有比较合适的亮感。木管类的空气感表现还行,自然度尚可,厚度不多。乐器的泛音量适中,显得比较精致。打击乐器中,Kick 的存在感不强,Snare 收得比较快,镲片类有比较充足的亮度,好在不至于刺激。

      高频总体亮度适中,平滑程度还可以,只有程度不算高的尖峰,只要不把音量开得太高,都不会觉得刺激。极高频的延伸能力比 Buds 5 稍好一点,滚降还是早了点但不算快,听上去尤其在高码率编码下是不会有太明显的高频截断感了。

      声场的规模在半入耳里算是中等稍大的程度,边界感因为半入耳本身的结构而显得不会有明显的强调,横纵都能拉开一些距离,横向会更明显一点。结合中规中矩的「高度感」,小米 Buds 6 可以呈现出比较扁平化的扁球空间。开启自适应之后声场的包围感会强一些。人声与乐器之间的分离度表现还行,整体感没有太大问题。解析能力要比 Buds 5 好,信息量在这个价位算是比较合格的状态,有轻度的「解析感」增强。动态中规中矩,瞬态不错。

      综合来看,我们建议是在均衡听感档位下打开自适应听感来获得一定程度的中低频补偿,进而让听感更加饱满。

      总结评价 | Overall Impression

      小米 Buds 6 相较于上一代产品在作为一个半入耳 TWS 耳机的几个方面还是有进步的,主要的进步点在于比较正常的默认调音、相对稳定的 aptX 连接、做工精致度与表面处理,以及空间音频的声场呈现。我们觉得同样售价 699 元,小米 Buds 6 还是比上代有了更多的可取之处,在更新固件后也没有再出现自适应算法跑偏的情况,日常你也可以开着自适应听感来使用了。

      我们也对于它几处阉割点觉得匪夷所思,首先是降噪综合感知,没有进步的同时甚至还有小幅度的倒退,到了几乎是不怎么有用的程度也是让人惊讶。录音功能或许是因为主控内存的限制而做出变化,倒是可以理解,但是 EQ 缩减频段数和可调范围为什么也要打折扣呢?没有很好的独立于 LC3 之外的低延迟模式、依然效果不够好的通话与录音,以及声音终究还是跟真正旗舰有素质上的差距,这些点也依然难以忽视。

      我们看到了一些正向变化,也有一些摸不着头脑的地方,希望小米在 Buds Pro 6 上继续进步,让我们能够打得出 IV 分甚至更高的成绩。目前综合判断下来,我们更加倾向于给小米 Buds 6 一个 III 分平均评价。


      本文所涉及型号在当时市场背景下的 KT MARK 与降噪综合能力金字塔 | TDS ANC Pyramid:Xiaomi Buds 6: III (Average) 

      【怎么感觉这 III 级评分的配色方案就是给 Buds 6 星云紫设计的一样——自我吐槽】

      降噪综合能力金字塔 | TDS ANC Pyramid:Xiaomi Buds 6: In-Ear Medium Level

      关于 KT MARK 评分机制以及利益相关的「不干涉评价原则」,请搜索《TDS Studio 评分标准与内容说明 V202502》,可以在主流搜索引擎直接搜索。

      KingTsui, TDS Studio.

      Jan 2026

      It's a TDS production.

      部分截图来自小米,其余所有内容全部自主创作,请勿抄袭内容、套抄行文结构等,保留一切权利。

        欢迎收看本期《派评》。你可以通过文章目录快速跳转到你感兴趣的内容。如果发现了其它感兴趣的 App 或者关注的话题,也欢迎在评论区和我们讨论。

        值得关注的新 App

        虽然少数派一直在为大家发现和介绍各平台上的优质 App,但仍有不少设计、功能、交互、体验都非常优秀的 App,还没有被我们发掘和介绍。它们可能是一款老 App,也可能是近期上架的新 App,我们会在这里介绍给你。

        Bauhaus Clock:Mac 屏保新选择

        • 平台:macOS
        • 关键词:屏保、时钟

        @PlatyHsu:屏幕保护程序听起来已经像是上个时代的概念了,如今它的作用更多是作为一种美化装点和临时遮挡。特别是在较大的外接显示器上,一个美观的屏保还是挺出镜的。不过,或许是因为 macOS 本身内置的屏保已经很丰富,再加上屏保开发框架年久失修,近年来很少见到有什么优秀的第三方屏保(App Store 里那些骗钱玩意不算)。

        Bauhaus Clock 就是我很久以来第一次发现的一个优秀 macOS 屏保。如果你用过 iOS 6 的话,应该对当时时钟 app 里的瑞士铁路时钟印象深刻。Bauhaus Clock 采用的也是类似思路,其主要功能就是在屏保界面显示一个写实的包豪斯风格时钟。

        当然,显示一个时钟不难,但 Bauhaus Clock 把细节做得特别到位:从指针的金属光泽、到表盘上投下的阴影,再到刻度上凹陷的荧光涂层,无不刻画得惟妙惟肖。指针的跳动方式也有三种可选:石英表(每次移动一格)、机械表(每次移动 1/4 格)和数字表(平滑移动)。特别是在石英表模式下,作者甚至把指针移动时轻微的颤动都做出来了。

        表盘有 13 种颜色主题可选,换主题时,刻度、数字和指针会随着表盘一起换成匹配的颜色。尤其推荐其中的冰川蓝(Glacier)、开心果绿(Pistachio)和薰衣草紫(Lavender),都是那种看了想要偷来做博客主题色的搭配。

        而到了晚上,Bauhaus Clock 还会随系统主题自动切换到暗色模式,这时看到的效果就像是熄灯后的挂钟:荧光刻度在纯黑底色下泛出带着颗粒感的微光(有 14 种颜色可选),隐隐照映出指针的轮廓。

        Bauhaus Clock 的其他「小节」也做得很到位。例如,设置面板上所有的控件都没有用系统标准样式,而是另外画的一套,高光和阴影颇有拟物遗风。又如,时钟刻度会定时轻微抖动,以避免烧屏(虽然目前还没有 Mac 使用 OLED 屏幕,或许是考虑到用 OLED 外接显示器的用户,或者是在为未来的 OLED MacBook 预备吧)。

        如果要说有什么美中不足…… 沾上「包豪斯」这个名字的东西都不会太便宜,包括 Bauhaus Clock——19 美元的价格已经向很多独立应用的定价看齐了。作者在 FAQ 里花了很多笔墨解释它为什么值,不用看都知道是说精雕细琢、免费更新、从不打折云云。考虑到这个价格,我也很难说有多推荐。如果它正好踩在你的审美上,或者能给你提供一些取景素材(像 MKBHD 那样),这个时钟漂亮得货真价实;否则,省下这钱已经够你向 ChatGPT 索要一个月的情绪价值了。

        Bevel:全能型健康助手,运动、饮食一把抓

        • 平台:iOS / watchOS
        • 关键词:健康数据、体能训练

        @Vanilla:Bevel 是一款 iOS 平台上的健康应用,同时提供了 Apple Watch 客户端,可以在健康监测、运动训练等方面进行联动。近日,Bevel 将自己的核心功能免费开放,只保留了 Bevel Intelligence 相关的功能为付费解锁内容。作为一款健康应用,Bevel 包含的功能非常全面,基本上可以满足我们对运动、健康等方面的大部分需求,接下来让我带大家一起来看看。

        Bevel 应用分为首页、手记、健身、生命体征这四个标签页。顾名思义「首页」起到了一个聚合的作用,展示了压力、能量、营养和一些健康监测的数据;「手记」则可以让我们手动录入一些和健康相关的行为,比如说咖啡因、心情、添加糖、生酮饮食、补水、酒、在床上使用设备、睡前餐等,同时还展示了一些自动记录的数据,比如说步数、力量训练时间、有氧运动时间等。

        「健身」模块展示了运动相关的数据,比如说月视图、活动摘要、耗力表现、肌肉符合、体能训练频率等,同时还可以在这个模块中新增、管理、同步体能训练模块;「生命体征」则展示了最大摄氧量、HRV 基准线、RHR 基线、体重、体脂等数据。

        不过,我最喜欢 Bevel 这款应用的功能藏在右下角的加号按钮中。点击这个按钮后会出现一个新增界面,这里的功能主要分为饮食和训练两个部分。饮食部分,我们可以通过文本输入、图片导入、拍照导入、扫描导入、直接搜索等多种方式来记录我们每一顿的饮食;训练部分,我们可以根据自己的情况自动生成模板、查看模板,也可以记录单次活动。

        这里,我想着重介绍一下 Bevel 的体能训练模板功能。不管是自动生成模板,还是自定义模板,我们都可以从一个庞大的动作库中选择自己喜欢的动作并新增进模板中,每个动作都可以查看演示动图和动作指南,并清晰地展示了主要肌肉和次要肌肉。开始训练后,Apple Watch 客户端也会同步开始,过程中我们也可以随时记录每组的重量和次数。这个瞬间,是不是让你想到了训记 App。

        作为 Bevel 的付费功能,Bevel Intelligence 可以与我们实时对话,根据我们的情况提供针对性的建议,还可以帮我们直接生成饮食和训练方面的计划,非常方便。如果你在寻找一款健康或者运动相关的监测应用,不妨试一下 Bevel,可以免费使用大部分功能,而且功能非常丰富。

        Bevel 可以在 App Store 免费下载使用,除 AI 功能外均可免费使用,订阅费用为每年 328 元。

         

        且听:罗永浩推出 AI 书籍解说工具

        • 平台:iOS
        • 关键词:听书、AI 解说

        @Snow:上周,罗永浩在他的「科技春晚」上,推出了团队内部孵化的 AI 听书应用「且听」。与传统有声书籍致力于绘声绘色地表现文字的目标不同,且听借助 AI 引擎对全文进行理解再阐释,利用 3-4 万字的文案或 1-2 小时的音频,帮你高效获取信息。

        且听沿用了 Smartisan OS 细腻的轻拟物设计,首屏书架区目前已收录超 1 万部书籍内容。如果你不知道从什么看起,可以使用顶部分类按钮缩小类型范围,也可以跳转至榜单页,从豆瓣热门、新京报推荐这些榜单中,选择已收录的条目进行了解。

        正如我一开始所说,且听的核心功能并不是逐字朗读的「听书」,而是放在了对书籍的「讲解」上。点击「播放本书讲解」按钮,你可以查阅 AI 引擎分析提炼后的重点内容,以及补充相关背景与延伸信息,它就像是书籍版「影视解说」,AI 创作者可以帮你浓缩核心剧情,梳理结构逻辑,引经据典拓宽知识面,甚至向你传达它的所感所悟,这种篇幅有限的二创,让它基本只能展示原作的某几个侧面,无法做到完全还原,因而在我看来且听并不能完全替代阅读原作这一行为。我更建议你将它作为一种兴趣筛选或者后续补充,且听目前并不支持直接阅读电子书,如果你听完解说,激起了阅读的兴趣,可以点击应用内置的购买链接,通过京东渠道购买对应的实体书。

        且听的解说会同时提供文字和音频版本,你可以选择全屏阅读文字,也可以选择 AI 人声帮你朗读。AI 朗读支持快进快退、倍速、定时关闭、随机播放、连续播放等基础功能,并可从小文(男声)、小粟(女声)及对应的「深夜版」共 4 种声音模型中任选其一,深夜版声音相较原版更低沉舒缓,非常适合睡前助眠。你还可以选择性地为 AI 人声添加背景音乐,进一步增强聆听氛围感。比较可惜的是,科技大会上演示的名人声音模型和音色克隆功能,在这一版暂未上线,整体声音表现力会略低于预期。

        此外,且听暂不支持本地书籍的导入和解析,鉴于目前的阅读库品类还是比较有限,较难覆盖所有人的阅读需求。不过考虑到且听目前收费门槛较低,免费用户阅读体量不限,仅在音源质量以及广告上有所差异,可以作为一款阅读的补充工具使用。

        你可以在 App Store 免费下载且听。

         

        Funkey:为 Mac 带来逼真的机械键盘打字音效

        • 平台:macOS
        • 关键词:打字音效

        @化学心情下2:除了明确的段落感能带来输入上的正反馈之外,我们在使用机械键盘打字时的机械声也能从听觉上带来输入的愉悦感——至于跟你在一起的同事或者室友是否觉得愉悦我觉得可以另当别论。而在 Mac 键盘上,相对「短促」的键程体验势必会让一些已经习惯机械键盘的用户总觉得不是那么「带劲」。好在终于有开发者察觉到了这个「问题」,为 Mac 用户推出了这款机械键盘音效应用:FunKey。

        虽然听上去颇有点「脱裤子放屁」的怪诞感,但在实际购买使用后我发现 FunKey 还是有点趣味的:应用提供的不仅仅是机械键盘的音效,甚至还有鼠标点击的音效,可以说是只有你想不到没有它不提供的。

        在 FunKey 中,光是鼠标的音效就有十几种,你可以根据自己的喜好随意选择;至于机械键盘的音效,FunKey 也有非常多选择,并在设置菜单中描述了大致的音色效果。由于花样实在太多,我也无法一一描述,感兴趣可以自行体验。

        你可以在 Mac App Store 下载 FunKey,售价为 22 元。

         

        Anx Reader:接入 AI 大模型的多端阅读器

        • 平台:iOS / iPadOS / Android / Windows / macOS / 鸿蒙
        • 关键词:读书、AI 翻译

        @大大大K:最近在读一些英文小说,很多时候还是需要依赖中文翻译对照才行。手动制作双语文件太麻烦,而阅读 App 自身接入的翻译工具又太机械,翻译不出小说里的「神韵」。后来偶然发现了这款开源免费的 Anx Reader,它具备接入 AI 大模型的能力,不仅能快速翻译,还能实现更多问答功能。

        Anx Reader 本身支持跨端使用,能够运行在 Windows、Android、iOS、macOS 以及鸿蒙平台上。App 主要还是采用了 Material 3 设计风格,iOS 版的部分控件做了仿液态玻璃效果,同时 Anx Reader 针对 E-INK 设备做了单独优化,开启 E-INK 模式后 App 会切换为白底黑字,并适配墨水屏的刷新模式。

        在阅读功能方面,Anx Reader 的特色在于它对 AI 功能的支持。App 导航栏中有一个专门的 AI 功能标签,点击后会进入与 AI 的对话模式,可以针对某本书进行总结、解释、分析,也可以面向在 App 内的整体阅读情况进行总结和建议。我们还可以进入 AI 功能设置,单独设定某种会话类型的提示词,以实现更具有针对性的会话回答。

        如果是在阅读过程中,我们也可以点击右上角的 AI 按钮,让 AI 帮我们总结这本书的思维导图和阅读引导,也可以通过划词搜索或者全文翻译的方式辅助我们阅读外文文档。AI 给出的翻译要比一般翻译工具更合理,也能更好地表达小说中很多口语化的句子。

        除此之外,Anx Reader 还支持 WebDAV 同步数据,实现更完美的跨平台使用体验。不过同步过程中 Anx Reader 可能会上传小说文件,如果你在使用类似坚果云这种计算流量的服务,则需要注意一下流量使用。

        现在,你可以在官方网站GitHub 免费下载 Anx Reader。需要注意的是,iOS 用户通过 App Store 下载时需要付费购买,但开发者鼓励用户通过自签的方式免费在 iOS 设备上使用。

         

        不容错过的 App 更新

        除了「新鲜」App,App Store 中的许多老面孔也在不断迭代、更新,增加更多有趣和实用的功能。少数派希望帮你筛选 App Store 中值得关注的 App 动态,让你快速了解 App 和开发者们的最新动态。

        一生足迹2:新增年度总结、3D 地球模式

        • 平台:iOS
        • 关键词:轨迹记录、年度总结

        @ElijahLee:轨迹记录应用「一生足迹」更新了 2.0 大版本,新版推出了 2025 年度总结、轨迹总览新增 3D 地球模式、新增墨黑地图、自定义时间段查看等功能。

        首先是 2025 年度总结,入口会出现在应用首页的地图中。这份年度总结总共分为 10 个页面,依次分析 2025 年去过的 10 个城市、全年总共记录的轨迹点、平均每天记录的轨迹点以及一些日常习惯等等。最后可以生成年度小结,用于保存或分享到社交媒体。如果你在应用没有找到年度总结入口,可以应用右下角地球图标,重新解析即可。

        在轨迹总览中,新版新增了 3D 地球模式,用 3D 地球视图展示你在全球留下的足迹。值得注意的是,这是一个使用数据实时渲染的 3D 地球,你可以自由地旋转它来查看,并且加入了星星、飞机、流星等等额外的小巧思。点击地球,还可以进入全屏模式,自动播放灵动的 BGM 背景音乐。对于跨国、跨洲的用户来说,这项功能很有吸引力,足迹不再是平面数据,而是转换成了一种空间记忆。

        新版还新增了墨黑地图,以及上一版本增加的松石绿,都非常精美。自定义时间段查看在应用首页,可以按照单日、单月、全年等默认时间查看轨迹统计,还可以自行选择起止时间内的轨迹点数据,生成该时间段内的轨迹图。这项功能非常适合旅行、出差等人生阶段性记录,把足迹数据切成有意义的时间片段,便于以后回顾。

        你可以在 App Store 免费下载「一生足迹」。应用大部分功能都可以免费使用,付费可以解锁专属档案、轨迹分析、运动模式等。费用为 12元 / 年。

         

          这两天在网络上又有一个东西火了,Twitter 的创始人 @jack 新的社交 iOS App  Damus 上苹果商店(第二天就因为违反中国法律在中国区下架了),这个软件是一个去中心化的 Twitter,使用到的是 nostr – Notes and Other Stuff Transmitted by Relays 的协议(协议简介协议细节),协议简介中有很大的篇幅是在批评Twitter和其相类似的中心化的产品,如:MastodonSecure Scuttlebutt 。我顺着去看了一下这个协议,发现这个协议真是非常的简单,简单到几句话就可以讲清楚了。

          目录

          通讯过程

          • 这个协议中有两个东西,一个是 client,一个是 relay,client 就是用户社交的客户端,relay 就是转发服务器。
          • 用户不需要注册,用户只需要有一个密钥对(公钥+私钥)就好了,然后把要发的信息做签名,发给一组 relays
          • 然后你的 Follower 就可以从这些 relays 上订阅到你的信息。

          技术细节摘要

          • 技术实现上,nostr 使用 websocket + JSON 的方式。其中主要是下面这么几个指令
            • Client 到 Relay主要是下面这几个指令:
              • EVENT。发出事件,可以扩展出很多很多的动作来,比如:发信息,删信息,迁移信息,建 Channel ……扩展性很好。
              • REQ。用于请求事件和订阅更新。收到REQ消息后,relay 会查询其内部数据库并返回与过滤器匹配的事件,然后存储该过滤器,并将其接收的所有未来事件再次发送到同一websocket,直到websocket关闭。
              • CLOSE。用于停止被 REQ 请求的订阅。
            • Relay 到 Client 主要是下面几个指令:
              • EVENT。用于发送客户端请求的事件。
              • NOTICE。用于向客户端发送人类可读的错误消息或其他信息
          • 关于 EVENT 下面是几个常用的基本事件:
            • 0: set_metadata:比如,用户名,用户头像,用户简介等这样的信息。
            • 1: text_note:用户要发的信息内容
            • 2recommend_server:用户想要推荐给关注者的Relay的URL(例如wss://somerelay.com

          如何对抗网络审查

          那么,这个协议是如何对抗网络审查的?

          • 识别你的身份是通过你的签名,所以,只要你的私钥还在,你是不会被删号的
          • 任何人都可以运行一个或多个relay,所以,就很难有人控制所有的relay
          • 你还可以很方便的告诉其中的 relay 把你发的信息迁到另一个 relay 上
          • 你的信息是一次发给多个relay的,所以,只要不是所有的热门realy封了你,你就可以发出信息
          • 每个relay的运营者都可以自己制定规则,会审查哪些类型内容。用户据此选择即可。基本不会有一个全局的规则。
          • 如果你被全部的relay封了,你还是可以自建你的relay,然后,你可以通过各种方式告诉你身边的人你的relay服务器是什么?这样,他们把这个relay服务器加到他们的client列表中,你又可以从社死中复活了。

          嗯,听起来很简单,整个网络是构建在一种 “社区式”的松散结构,完全可能会出现若干个 relay zone。这种架构就像是互联网的架构,没有中心化,比如 DNS服务器和Email服务器一样,只要你愿意,你完全可以发展出自己圈子里的“私服”。

          其实,电子邮件是很难被封禁和审查的。我记得2003年中国非典的时候,我当时在北京,当时的卫生部部长说已经控制住了,才12个人感染,当局也在控制舆论和删除互联网上所有的真实信息。但是,大家都在用电子邮件传播信息,当时基本没有什么社交软件,大家分享信息都是通过邮件,尤其是外企工作的圈子,当时每天都要收很多的非典的群发邮件,大家还都是用公司的邮件服务器发……这种松散的,点对点的架构,让审查是基本不可能的。其实,我觉得 nostr 就是另外一个变种或是升级版的 email 的形式

          如何对抗Spam和骗子

          但是问题来了,如果不能删号封人的话,那么如何对抗那些制造Spam,骗子或是反人类的信息呢?nostr目前的解决方案是通过比特币闪电网络。比如有些客户端实现了如果对方没有follow 你,如果给他发私信,需要支付一点点btc ,或是relay要求你给btc才给你发信息(注:我不认为这是一个好的方法,因为:1)因为少数的坏人让大多数正常人也要跟着付出成本,这是个糟糕的治理方式,2)不鼓励那些生产内容的人,那么平台就没有任何价值了)。

          不过,我觉得也有可以有下面的这些思路:

          • 用户主动拉黑,但很明显这个效率不高,而且体验不好
          • 社区或是同盟维护一个黑名单,relay定期更新(如同email中防垃圾邮件也是这样搞的),这其实也是审查。
          • 防Spam的算法过滤垃圾信息(如同email中干的),自动化审查。
          • 增加发Spam的成本,如: PoW 工作量证明(比特币的挖矿,最早也是用于Email),发信息要花钱(这个对正常用户伤害太大了)等。
          • ……

          总之,还是有相应的方法的,但是一定没有完美解,email对抗了这么多年,你还是可以收到大量的垃圾邮件和钓鱼邮件,所以,我觉得 nostr 也不可能做到……

          怎么理解审查

          最后,我们要明白的是,无论你用什么方法,审查是肯定需要的,所以,我觉得要完全干掉审查,最终的结果就是一个到处都垃圾内容的地方!

          我理解的审查不应该是为权力或是个体服务的,而是为大众和人民服务的,所以,审查必然是要有一个开放和共同决策的流程,而不是独断的

          这点可以参考开源软件基金会的运作模式。

          • 最底端的是用户(User)参与开源社区的使用并提供问题和反馈。
          • 用户在使用过程中了解项目情况后贡献代码和文档就可以晋升为贡献者(Contributors),
          • 当贡献者提交一定数量贡献之后就可以晋升为提交者(Committers),此时你将拥有你参与仓库的代码读写权限。
          • 当提交者Committers在社区得到认可后,由项目管理委员会(PMC)选举并产生PMC成员(类似于议员),PMC成员拥有社区相关事务的投票、提名和共同决策权利和义务。

          注意下面几点

          • 整个社区的决策者,是要通过自己贡献来挣到被选举权的。
          • 社区所有的工作和决定都是要公开的。
          • 社区的方向和决策都是要投票的,PMC成员有binding的票权,大众也有non-binding的投票权供参考。
          • 如果出现了价值观的不同,那么,直接分裂社区就好了,不同价值观的人加入到不同的社区就好了

          如果审查是在这个框架下运作的话,虽然不完美,但至少会在一种公允的基础下运作,是透明公开的,也是集体决策的。

          开源软件社区是一个很成功的示范,所以,我觉得只有技术而没有一个良性的可持续运作的社区,是不可能解决问题的,干净整齐的环境是一定要有人打扫和整理的

           

          欢迎关注我 npub1w6r99545cxea6z76e8nvzjxnymjt4nrsddld33almtm78z7fz95s3c94nu
          欢迎关注我 npub1w6r99545cxea6z76e8nvzjxnymjt4nrsddld33almtm78z7fz95s3c94nu

          两个月前,我试着想用 ChatGPT 帮我写篇文章《eBPF 介绍》,结果错误百出,导致我又要从头改一遍,从那天我觉得 ChatGPT 生成的内容完全不靠谱,所以,从那天开始我说我不会再用 ChatGPT 来写文章(这篇文章不是由 ChatGPT 生成),因为,在试过一段时间后,我对 ChatGTP 有基于如下的认识:

          1. ChatGPT 不是基于事实,是基于语言模型的,事实对他来说不重要,对他重要的是他能读懂你的问题,并按照一定的套路回答你的问题。
          2. 因为是基于套路的回答,所以,他并不能保证内容是对的,他的目标是找到漂亮的精彩的套路,于是,你会发现,他的内容组织能力和表述还不错,但是只要你认真玩上一段时间,你会发现,ChatGPT 那些表述的套路其实也比较平常一般。它的很多回答其实都不深,只能在表面上。就像 Github 的 Copilot 一样,写不了什么高级的代码,只能帮你写一些常规格式化的代码(当然,这也够了)
          ChatGPT 就是一个语言模型,如果不给他足够的数据和信息,它基本就是在胡编乱造

          所以,基于上面这两个点认识,以发展的眼光来看问题,我觉得 ChatGPT 这类的 AI 可以成为一个小助理,他的确可以干掉那些初级的脑力工作者,但是,还干不掉专业的人士,这个我估计未来也很难,不过,这也很帅了,因为大量普通的工作的确也很让人费时间和精力,但是有个前提条件——就是ChatGPT所产生的内容必需是真实可靠的,没有这个前提条件的话,那就什么用也没有了

          今天,我想从另外一个角度来谈谈 ChatGPT,尤其是我在Youtube上看完了微软的发布会《Introducing your copilot for the web: AI-powered Bing and Microsoft Edge 》,才真正意识到Google 的市值为什么会掉了1000亿美元,是的,谷歌的搜索引擎的霸主位置受到了前所未有的挑战……

          我们先来分析一下搜索引擎解决了什么样的用户问题,在我看来搜索引擎解决了如下的问题:

          • 知识或信息索引。查新闻,查股票,查历史,查文档,找答案……
          • 找服务提供商。找卖东西的电商,找帮你修东西的服务,找软件……
          • 信息的准确和可靠。搜索引擎的rank算法保证了最准确、最有用、最权威的信息出现在最前面……(作恶的百度不在此列)

          基本上就是上面这几个,搜索引擎在上面这几件事上作的很好,但是,还是有一些东西搜索引擎做的并不好,如:

          • 搜索引擎是基于关键词的,不是基于语义的。所以,搜索引擎并不知道你的真实需求,因此,你会不可避免地要干下面的事,
            • 你经常要不断地增加或调整不同的关键词来提高查询信息的准确度……
            • 你经常要在你查找的信息中进行二次或多次过滤和筛选……
          • 搜索引擎是只能呈现内容,无法解读内容。所以,你找到相关的链接后,你还要花大量的时间来阅读理解,经常性的你不可避免的要干下面的事:
            • 打开一个链接,读到了一大半后,发现你要的内容不在其中,只能关掉再打开一个……
            • 你想要的内容是在的,但是太晦涩,看不懂,太费解,你要找小白友好的版本……
            • 你想要的内容不完整,你需要在很多个链接和网页上做拼图游戏……
            • 内容是无法结构化的展示的,你搜到的东西全都是碎片信息
          • 搜索引擎没有上下文关联,两次搜索是没有关系的。也就是说,人知道的越多,问题也就越多,所以,我们经常会面临下面的问题:
            • 随着我了解的越多,我的信息搜索的会出现分支,这个分支只有我自己的管理,搜索引擎是不关心的,导致我每次都相当于从头开始……
            • 你做计划的时候,你需要从多个不同的搜索中获取你想要的东西,最终组合成你定制化的东西,比如做旅游计划……

          好了,我们知道,ChatGPT 这类的技术主要是用来根据用户的需求来按一定的套路来“生成内容”的,只是其中的内容并不怎么可靠,那么,如果把搜索引擎里靠谱的内容交给 ChatGPT 呢?那么,这会是一个多么强大的搜索引擎啊,完全就是下一代的搜索引擎,上面的那些问题完全都可以解决了:

          • 你可以打一段话给搜索引擎,ChatGPT 是读得懂语义的。
          • 因为知道语义,于是在众多搜过结果中,他更知道哪些是你想要的内容。
          • ChatGPT 可以帮你生成 TL;DR,把长文中的要求总结出来形成更易读的短文
          • ChatGPT 可以帮你整理内容,在多个网页中帮你整合和结构化内容
          • ChatGPT 可以有上下文对话,你可以让他帮你不断通过更多的关键词搜索信息,并在同一个主题下生成、组织和优化内容

          一旦 ChatGPT 利用上了搜索引擎内容准确和靠谱的优势,那么,ChatGPT 的能力就完全被释放出来了,所以,带 ChatGPT 的搜索引擎,就是真正的“如虎添翼”!

          因此,微软的 Bing + ChatGPT,成为了 Google 有史以来最大的挑战者,我感觉——所有跟信息或是文字处理相关的软件应用和服务,都会因为 ChatGPT 而且全部重新洗一次牌的,这应该会是新一轮的技术革命……Copilot 一定会成为下一代软件和应用的标配!

          这两天技术圈里热议的一件事就是Amazon的流媒体平台Prime Video在2023年3月22日发布了一篇技术博客《规模化Prime Video的音视频监控服务,成本降低90%》,副标题:“从分布式微服务架构到单体应用程序的转变有助于实现更高的规模、弹性和降低成本”,有人把这篇文章在五一期间转到了reddithacker news 上,在Reddit上热议。这种话题与业内推崇的微服务架构形成了鲜明的对比。从“微服务架构”转“单体架构”,还是Amazon干的,这个话题足够劲爆。然后DHH在刚喷完Typescript后继续发文《即便是亚马逊也无法理解Servless或微服务》,继续抨击微服务架构,于是,瞬间引爆技术圈,登上技术圈热搜。

          今天上午有好几个朋友在微信里转了三篇文章给我,如下所示:

          看看这些标题就知道这些文章要的是流量而不是好好写篇文章。看到第二篇,你还真当 Prime Video 就是 Amazon 的全部么?然后,再看看这些文章后面的跟风评论,我觉得有 80%的人只看标题,而且是连原文都不看的。所以,我想我得写篇文章了……

          原文解读

          要认清这个问题首先是要认认真真读一读原文,Amazon Prime Video 技术团队的这篇文章并不难读,也没有太多的技术细节,但核心意思如下:

          1)这个系统是一个监控系统,用于监控数据千条用户的点播视频流。主要是监控整个视频流运作的质量和效果(比如:视频损坏或是音频不同步等问题),这个监控主要是处理视频帧,所以,他们有一个微服务主要是用来把视频拆分成帧,并临时存在 S3 上,就是下图中的 Media Conversion 服务。

          2)为了快速搭建系统,Prime Video团队使用了Serverless 架构,也就是著名的 AWS Lambda 和 AWS Step Functions。前置 Lambda 用来做用户请求的网关,Step Function 用来做监控(探测器),有问题后,就发 SNS 上,Step Function 从 S3 获取 Media Conversion 的数据,然后把运行结果再汇总给一个后置的 Lambda ,并存在 S3 上。

          整个架构看上去非常简单 ,一点也不复杂,而且使用了 Serverless 的架构,一点服务器的影子都看不见。实话实说,这样的开发不香吗?我觉得很香啊,方便快捷,完全不理那些无聊的基础设施,直接把代码转成服务,然后用 AWS 的 Lamda + Step Function + SNS + S3 分分钟就搭出一个有模有样的监控系统了,哪里不好了?!

          但是他们遇到了一个比较大的问题,就是 AWS Step Function 的伸缩问题,从文章中我看到了两个问题(注意前方高能):

          1. 需要很多很多的并发的 AWS Step Function ,于是达到了帐户的 hard limit。
          2. AWS Step Function 按状态转换收费,所以,贵得受不了了。

          注意,这里有两个关键点:1)帐户对 Step Function 有限制,2)Step Function 太贵了用不起

          然后,Prime Video 的团队开始解决问题,下面是解决的手段:

          1) 把 Media Conversion  和 Step Function 全部写在一个程序里,Media Conversion 跟 Step Function 里的东西通过内存通信,不再走S3了。结果汇总到一个线程中,然后写到 S3.

          2)把上面这个单体架构进行分布式部署,还是用之前的 AWS Lambda 来做入门调度。

          EC2 的水平扩展没有限制,而且你想买多少 CPU/MEM 的机器由你说了算,而这些视频转码,监控分析的功能感觉就不复杂,本来就应该写在一起,这么做不更香吗?当然更香,比前面的 Serverless 的确更香,因为如下的几个原因:

          1. 不再受 Step Function 的限制了,技术在自己手里,有更大的自由度。
          2. 没有昂贵的 Step Function 云成本的确变得更低了,如果你把 Lambda 换成 Nginx 或 Spring Gateway 或是我司的 Easegress,你把 S3 换成 MinIO,你把 SNS 换成 Kafka,你的成本 还能再低。

          独立思考

          好了,原文解读完了,你有自己的独立思考了吗?下面是我的独立思考,供你参考:

          1)AWS 的 Serverless 也好, 微服务也好,单体也好,在合适的场景也都很香。这就跟汽车一样,跑车,货车,越野车各有各的场景,你用跑车拉货,还是用货车泡妞都不是一个很好的决定。

          2)这篇文章中的这个例子中的业务太过简单了,本来就是一两个服务就可以干完的事。就是一个转码加分析的事,要分开的话,就两个微服务就好了(一个转码一个分析),做成流式的。如果不想分,合在一起也没问题了,这个粒度是微服务没毛病。微服务的划分有好些原则,我这里只罗列几个比较重要的原则:

          • 边界上下文。微服务的粒度不能大于领域驱动里的 Bounded Context(具体是什么 大家自行 Google),也就是一个业务域。
          • 单一职责,高内聚,低耦合。把因为相同原因变化的合在一起(内聚),把不同原因变化的分开(解耦)
          • 事务和一致性。对于两个重度依赖的功能,需要完成一个事务和要保证强一致性的,最好不要拆开,要放在一起。
          • 跟组织架构匹配。把同一个团队的东西放在一起,不同团队的分开。

          3)Prime Video 遇到的问题不是技术问题,而是 AWS  Step Function 处理能力不足,而且收费还很贵的问题。这个是 AWS 的产品问题,不是技术问题。或者说,这个是Prime Video滥用了Step Function的问题(本来这种大量的数据分析处理就不适合Step Function)。所以,大家不要用一个产品问题来得到微服务架构有问题的结论,这个没有因果关系。试问,如果 Step Funciton 可以无限扩展,性能也很好,而且白菜价,那么 Prime Video 团队还会有动力改成单体吗?他们不会反过来吹爆 Serverless 吗?

          4)Prime Video 跟 AWS 是两个独立核算的公司,就像 Amazon 的电商和 AWS 一样,也是两个公司。Amazon 的电商和 AWS 对服务化或是微服务架构的理解和运维,我个人认为这个世界上再也找不到另外一家公司了,包括 Google 或 Microsoft。你有空可以看看本站以前的这篇文章《Steve Yegg对Amazon和Google平台的吐槽》你会了解的更多。

          5)Prime Video 这个案例本质上是“下云”,下了 AWS Serverless 的云。云上的成本就是高,一个是费用问题,另一个是被锁定的问题。Prime Video 团队应该很庆幸这个监控系统并不复杂,重写起来也很快,所以,可以很快使用一个更传统的“服务化”+“云计算”的分布式架构,不然,就得像 DHH 那样咬牙下云——《Why We’re Leaving the Cloud》(他们的 SRE 的这篇博文 Our Cloud Spend in 2022说明了下云的困难和节约了多少成本)

          后记

          最后让我做个我自己的广告。我在过去几年的创业中,帮助了很多公司解决了这些 分布式,微服务,云原生以及云计算成本的问题,如果你也有类似问题。欢迎,跟我联系:[email protected]

          另外,我们今年发布了一个平台 MegaEase Cloud,就是想让用户在不失去云计算体验的同时,通过自建高可用基础架构的方式来获得更低的成本(至少降 50%的云计算成本)。目前可以降低成本的方式:

          1. 基础软件:通过开源软件自建,
          2. 内容分发:MinIO + Cloudflare 的免费 CDN,
          3. 马上准备发布的直接与底层IDC合作的廉价GPU计算资源…

          欢迎大家试用。

          如何访问

          注:这两个区完全独立,帐号不互通。因为网络的不可抗力,千万不要跨区使用。

          产品演示

          介绍文章

           

          这里记录每周值得分享的科技内容,周五发布。

          本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系[email protected])。

          封面图

          武汉首座电梯升降桥最近建成开放。因为上游有船厂,所以大桥有四根巨大的电梯柱,用来升起桥面,让船通过。(via

          预测是新的互联网热点

          大家大概想不到,美国互联网的热点,现在不是 AI 网站,而是一种全新的网站,叫做"预测市场"(prediction market)。

          这类网站像雨后春笋一样,每天都在冒出来。最有名的预测市场,目前是 PolyMarket

          预测市场的用途,就是预测各种各样的事情。以 PolyMarket 为例,首页顶部就是各种预测的分类。

          热门事件、突发事件、最新预测、政治、体育......

          只要是你能想到的事情,它都提供预测

          以上周末为例,首页热门预测如下(上图)。

          • 《时代》杂志的年度人物是谁?
          • 《时代》杂志年度人物名单会泄露吗?
          • 美联储一月份的决定是什么?
          • OpenAI 下一次的大模型发布是哪一天?

          你随便选一个,点进去就能看到,各种情况的概率。

          上图预测的是,2025年12月5日至12日期间,马斯克会发多少条推文。

          可以看到,概率最高的情况是440条~450条,概率33%,概率最低的情况是400条~419条,概率1%。

          正是因为对于几乎任何问题,它都有实时的详细预测,美国人现在已经不怎么看民调了,改成看这种预测网站了。因为民调的抽样方法和样本大小,总是有局限的,反而是预测网站更反映市场的真实看法。

          你可能会问,这些预测结果怎么产生?如何确保准确?

          答案很简单,结果来自于用户的下注。

          你看好哪一种情况,就可以对它下注。看好的人多,这种情况对应的概率就会上升,反之下降。

          实质上,它的每一个预测都是一支股票,股价就是它的概率,1%的概率就是股价0.01元,100%的概率就是股价1元。

          举例来说,某种情况的当前概率是2%,那么相当于0.02元。你看好这种情况,假定就花了100元买入。

          结果,正如你的预测,它变成了现实,概率上升为100%,价格就变成了1元,相比你的买入价,整整上涨了50倍。于是,你投入的100元就变成了5000元。

          反之,你预测错了,这个结果没有实现,概率变为0%,也就是0元,你投入的100元将一分都收不回来。

          最近,美国的一条热门新闻就是,一个男子在 PolyMarket 上,对一个2%的小概率事件投入3000美元。结果,预测准确,他收回了12.5万美元。

          为了方便世界各地的人参与,也是为了保证匿名,这种预测网站都采用稳定币交易。

          所以,它的本质就是一个巨大的彩票市场,允许用户买卖自己最感兴趣、最熟悉的事件,这是它快速流行起来的根本原因。参与的人多了以后,反过来提高了预测的准确性。

          我觉得,它的前景不可限量,一定会火爆的井喷式发展,传统彩票可能会被它彻底淘汰。

          它把任何不确定的事情,都变成了彩票,实时量化了每一种可能性的概率,并且提供了金钱翻倍的途径。这一方面很有参考价值,可以用来判断未来情况,另一方面也非常有娱乐性和刺激性。

          国产 Nano Banana Pro 的图片幻灯片生成

          上个月,谷歌发布了新一代图像编辑模型 Nano Banana Pro(其实就是 Gemini 3 Pro 的图像分支)。

          有一个功能引起了轰动:无论多么枯燥的文字,都能变成有趣的图片,从"读文"变成"读图"。

          我当时就想,国产模型一定会马上跟进。

          果然,昨天打开秘塔 AI,就看到他们发了这个功能完全对标 Nano Banana Pro 以及 NotebookLM,而且还加入了自己的特色----讲解。

          你点击"上传文件"(上图),上传各种资料(可以上传多篇),它就会自动创建一个知识库,输出内容的 AI 总结。这时,还会显示一个"给我讲讲"按钮。

          上图是我写的一篇 JS 语法点 Promise 的教程,点击"给我讲讲"就会生成图片幻灯片 + 讲解。

          大家可以去它们的官网 metaso.cn (手机 App 同名)试试看,这个功能挺好玩的,操作零门槛,关键是它免费(有赠送的积分)。

          除了上传文件,你也可以直接搜索某个主题,再点击下方的"生成幻灯片"按钮。这时就会有"图片幻灯片"选项,并有20多种风格可选,还支持自定义。

          科技动态

          1、步行环游世界

          上个世纪90年代的一天,一个英国青年在酒吧里随口说,他可以从南美洲最南端一路走到英国。他的朋友都不信。

          他就跟朋友打赌,他能做到。1998年,他正式从智利最南端开始步行,那一年他29岁。

          27年过去了,他已经56岁了,依然在路上。

          好消息是,他已经接近行程的尾段,预计将于2026年9月到达终点英国。

          下面就是他的路线图,从南美洲最南端到北美洲最北端,再到亚洲和欧洲,最后是英国。

          整个行程中,他只能步行或者游泳,不能使用任何交通工具。最难的一段就是北美洲与俄罗斯之间的白令海峡,为了不坐船,他是在冬天从海冰上爬过去的。

          这27年中,他也不是每天都在走,有时因为各种原因,会离开一段日子,然后再回来接着走。

          他说,依靠个人的力量不可能完成这样的行程,留不开家人的支持、陌生人的友善,以及赞助商的帮助。

          至于是什么力量支撑他坚持走了近30年?他说:"你需要看看真实的世界,以及生活在其中的人们,这将是你所能接受的最好的教育之一。"

          2、六臂机器人

          美的公司展示一个六臂机器人,将用于无锡工厂的生产线。

          它可以六只手同时执行三项任务。那样的话,一个机器人就相当于三个工人了。

          3、手摇洗衣机

          一位前戴森公司的工程师,为不发达地区发明了一种手摇洗衣机。

          据介绍,这种洗衣机不需要电,只要手摇几分钟,就能洗净5公斤衣物,并且节省一半的水。

          如果它真的有效,我有一个建议,就是把手摇改成脚踏车,只要踩5分钟踏板,就能洗一筒衣服。

          文章

          1、程序员为自己的工具命名时的彻底迷失(英文)

          本文批评很多程序员为软件起名时,尽起一些烂七八糟的名字,根本看不出软件的用途,建议软件名称应该跟用途有相关性。

          2、解读斯诺登文件(英文)

          这篇文章详细分析了2013年斯诺登泄漏的文件,文章第一部分就是分析对北方工业公司的情报收集,美国的监控令人叹为观止。

          3、从文本到词元(英文)

          一篇科普文章,通俗地介绍搜索引擎如何将查询的文本转换成标准化的词元(token)。

          4、大模型构建 HTML 工具的实用方法(英文)

          著名程序员 Simon Willison 的长文,总结他使用大模型生成网页应用的经验。

          5、GraphQL 蜜月期已结束(英文)

          作者认为,GraphQL 解决的问题远比人们想象的小众,而且可以通过其他方式解决,这项技术最终往往弊大于利。

          6、git add -p 的解释(英文)

          本文介绍 git add -p 命令。它会显示一个互动界面,让用户逐个确认每个文件的变动,是否要加入暂存区。

          工具

          1、Cosmic

          上周,Cosmic 1.0版正式发布了。它是一个全新的 Linux 桌面,美观且功能强大,为用户提供了 Gnome 和 KDE 之外的另一个选择。

          2、Keyden

          macOS 菜单栏的开源 TOTP 双因素认证器,密钥加密存储在 macOS Keychain。(@tasselx 投稿)

          3、WeMD

          开源的 Markdown 微信公众号编辑器。(@tenngoxars 投稿)

          4、starling-speak

          文本朗读网站,支持多种语言,带有录音功能。(@Keldon-Pro 投稿)

          5、shift

          一个基于 WebAssembly 的在线代码编辑器,支持直接在网页运行 Python、Lua、Ruby 等语言。(@hubenchang0515 投稿)

          6、EasyImg

          基于 Nuxt 4 构建的个人图床,丰富的后台配置。(@chaos-zhu 投稿)

          7、Go-WXPush

          Go 语言开发的微信消息推送服务,提供了一个简单的 API 消息推送接口。代码开源,每天10万次推送额度,个人用不完。(@hezhizheng 投稿)

          8、ZeroLaunch-rs

          Windows 应用启动器,拼音模糊匹配,基于 Rust + Tauri + Vue.js。(@ghost-him 投稿)

          9、MrRSS

          跨平台的开源桌面 RSS 阅读器,支持自动翻译、自动总结、新订阅源发现。(@ch3ny4ng 投稿)

          10、PVE Touch

          为移动设备优化的 Proxmox VE 管理界面,方便通过手机管理虚拟机。(@hanxi 投稿)

          AI 相关

          1、Disco

          谷歌实验室推出的实验性 AI 浏览器,完全跳过网页搜索,目前需要排队等待名额。

          2、Flowers

          开源的浏览器 AI 助手插件,提供网页翻译、问答、笔记等功能。(@snailfrying 投稿)

          3、DeepAudit

          开源的代码审计平台,通过智能体实现漏洞挖掘和自动化沙箱 PoC 验证,支持 ollama 私有部署模型,代码可不出内网。(@lintsinghua 投稿)

          资源

          1、生命的尺寸

          这个网站用图形展示各种生命体的大小比较,从 DNA 一直到蓝鲸。

          2、写一个你自己的 C 语言编译器(Build Your Own Lisp)

          一本面向初学者的免费英文电子书,介绍怎么用 C 语言写编译器,以 Lisp 语言的编译器为例。

          3、A Soft Murmur

          一个背景音网站,可以开关不同的音效,并调节它们的音量。

          图片

          1、13个圆画出动物

          一个艺术家使用13个圆,画出各种动物。

          猫头鹰

          兔子

          猴子

          文摘

          1、Claude Opus 4.5 是第一款让我真正担心自己工作会丢掉的大模型

          Claude Opus 4.5 真是完全不同于其他模型。还没用过的人根本无法想象未来两三年会发生什么,明年可能就是最终的转折点。

          我不知道接下来该如何适应。当然,我可以整天看着 Opus 帮我工作,偶尔出点小问题再干预一下,但再过一段日子连这些都不需要了呢?

          编码问题基本上已经解决了,接下来像系统设计、安全之类的问题也会迎刃而解。我估计再过两三个版本,80%的技术人员就基本没用了。当然,公司还需要一些时间来适应,但他们肯定会想方设法尽快摆脱我们。

          虽然我很喜欢 AI 这项技术,但一想到这一切最终会走向何方,我就感到难过。

          2、为什么学习物理学

          (本文摘自理查德·费曼于1963年6月在里约热内卢举行的美洲物理教育会议上发表的演讲。费曼是加州理工学院理论物理学教授。)

          我们应该教授物理学,这有五个原因。

          (1)物理是一门基础科学,应用于工程学、化学和生物学等各种技术领域。

          物理是研究自然界的科学,或者说是认识自然界的科学,它告诉我们事物是如何运作的,以及人类在当前和未来的技术中发明的各种设备是如何工作的。因此,懂物理的人应对本行业出现的技术问题会很有用。

          (2)物理教会你如何动手做事情。它教授许多操纵事物的技巧,以及测量和计算技巧,这些技巧的应用范围比特定研究领域要广泛得多。

          (3)物理作为一门科学,对许多人来说,是一种极大的乐趣。

          科学教育培养出来的科学家,不仅为工业发展和知识发展做出贡献,同时也参与了我们这个时代的伟大冒险,从中获得巨大的乐趣。

          即使一个人没有成为一名专业科学家,研究自然也是为了欣赏自然的奇妙和美丽。这种对自然的了解也给人一种稳定和现实的感觉,并驱散了许多恐惧和迷信。

          (4)物理教会人们如何认识事物,帮助你质疑很多事情。质疑和自由思想的价值,不仅对科学发展,而且对其他各个领域,都显而易见。

          科学教导我们如何认识事物、什么是未知事物、事物被认识到什么程度、如何处理怀疑和不确定性、证据规则是什么、如何思考事物以便做出判断、如何区分真理与欺诈。这些无疑是教授科学,特别是教授物理的重要收获。

          (5)在学习科学的过程中,你会学会如何试错,培养发明创造和自由探索的精神,这种精神的价值远远超出了科学本身。

          人们会学会问自己:"有没有更好的方法 ?"我们必须想出一些新的技巧或方法,以改进这项技术。这种想法是许多思想、发明创造以及各种人类进步的源泉。

          言论

          1、

          为什么我们有两个鼻孔,而不是一个大洞?

          因为肺部持续需要空气,两个鼻孔可以交替工作,让鼻子的一侧得到休息。

          -- 美国《大众科学》

          2、

          报社招我去当撰稿人,我以为是去写稿,结果却是以极低的薪水让我编辑 AI 生成的文案草稿,理由是"大部分工作已经完成了"。

          这让我深受打击,我曾经觉得自己很有价值,受人重视,对未来充满希望,渴望拥有辉煌的职业生涯,现在却只能修改 AI 生成的文字。

          -- 一位自由撰稿人

          3、

          SaaS 行业将会萎缩,尤其是那些功能简单的 SaaS,因为企业现在可以用 AI 快速生成内部服务。

          -- 《AI 正在蚕食 SaaS》

          4、

          我发现,中文不喜欢直接说 True,更倾向说 !False。比如,英文说"很好",中文说"不坏",英文说"对的",中文说"没错",英文说"正常",中文说"没问题"。

          中文更喜欢双重否定"否定词+否定词",这种表达方式增加了模糊性(含糊其辞)和灵活性(模棱两可),创造了回旋余地,避免了肯定答复导致的态度明确、归类迅速、立场鲜明。

          -- 《为什么中文拒绝说 true》

          往年回顾

          你可能是一个 NPC(#331)

          新基建的政策选择(#281)

          互联网公司需要多少员工?(#231)

          移动支付应该怎么设计?(#181)

          (完)

          一、

          最近,我写了好几篇 AI 教程,就收到留言,要我谈谈我自己的 AI 编程。

          今天就来分享我的 AI 编程,也就是大家说的"氛围编程"(vibe coding)。

          声明一下,我只是 AI 初级用户,不是高手。除了不想藏私,更多是为了抛砖引玉,跟大家交流。

          二、

          平时,我很少用 AI 生成新项目。因为每次看 AI 产出的代码,我总觉得那是别人的代码,不是我的。

          如果整个项目都用 AI 生成,潜意识里,我感觉不到那是自己的项目。我的习惯是,更愿意自己写新项目的主体代码。

          我主要把 AI 用在别人的项目和历史遗留代码,这可以避免读懂他人代码的巨大时间成本。

          就拿历史遗留代码为例,(1)很多时候没有足够的文档,也没有作者的说明,(2)技术栈和工具库都过时了,读懂代码还要翻找以前的标准,(3)最极端的情况下,只有构建产物,没有源代码,根本无法着手。

          AI 简直就是这类代码的救星,再古老的代码,它都能读懂和修改,甚至还能对构建产物进行逆向工程。

          下面就是我怎么用 AI 处理历史遗留代码,平时我基本就是这样来 AI 编程。

          三、

          我的 AI 编程工具是 Claude Code。因为命令行对我更方便,也容易跟其他工具集成。

          我使用的 AI 模型,大部分时间是国产的 MiniMax M2。我测过它的功能,相当不错,能够满足需要,它的排名也很靠前。

          另外,它有包月价(29元人民币),属于最便宜的编程模型之一,可以放心大量使用,反复试错。要是改用大家都趋之若鹜的 Claude 系列模型,20美元的 Pro 套餐不够用,200美元的 Max 套餐又太贵。

          MiniMax 接入 Claude Code 的方法,参考我的这篇教程

          四、

          就在我写这篇文章的时候,MiniMax 本周进行了一次大升级,M2 模型升级到了 M2.1

          因为跟自己相关,我特别关注这次升级。

          根据官方的发布声明,这次升级特别加强了"多语言编程能力",对于常用编程语言(Rust、Java、Golang、C++、Kotlin、Objective-C、TypeScript、JavaScript 等)有专门强化。

          它的 WebDev 与 AppDev 开发能力因此有大幅提升,可以用来开发复杂的 Web 应用和 Android/iOS 的原生 App。

          "在软件工程相关场景的核心榜单上,MiniMax M2.1 相比于 M2 有了显著的提升,尤其是在多语言场景上,超过 Claude Sonnet 4.5 和 Gemini 3 Pro,并接近 Claude Opus 4.5。"

          根据上面这段介绍,它的编程能力,超出或接近了国外旗舰模型。

          这个模型已经上线了,现在就能用。那么,这篇文章正好测一下,官方的介绍是否准确,它的 Web 开发能力到底有没有变强。

          至于价格,跟原来一样。但是,官方表示"响应速度显著提升,Token 消耗明显下降",也算变相降价了。

          M2.1 接入 Claude Code,我的参数如下。

          五、

          我这次选择的历史遗留项目是 wechat-format,一个 Web 应用,将 Markdown 文本转为微信公众号的样式。

          上图左侧的文本框输入 Markdown 文本,右侧立刻显示自动渲染的结果,可以直接复制到微信公众号的编辑器。

          它非常好用,大家可以去试试看。我的公众号现在就用它做排版,效果不错(下图)。

          问题是,原作者六年前就放弃了,这个项目不再更新了。我看过源码,它用的是老版本的 Vue.js 和 CodeMirror 编辑器,没有任何文档和说明,还经过了编译工具的处理,注释都删掉了。

          如果不熟悉它的技术栈,想要修改这些代码是很困难的,可能要投入大量时间。

          那么废话少说,直接让 AI 上场,把这些代码交给 MiniMax M2.1 模型。

          六、

          接手老项目的第一步,是对项目进行一个总体的了解。

          我首先会让 AI 生成项目概述。大家可以跟着一起做,跟我的结果相对照。

          
          # 克隆代码库
          $ git clone [email protected]:ruanyf/wechat-format.git
          
          # 进入项目目录
          $ cd wechat-format
          
          # 启动 Claude Code
          $ claude-minimax
          

          上面的claude-minimax是我的自定义命令,用来在 Claude Code 里面调用 MiniMax 模型(参见教程)。

          输入"生成这个仓库的概述"。

          AI 很快就给出了详细说明,包括项目的总体介绍、核心功能、技术栈和文件结构(下图)。

          有了总体了解以后,我会让 AI 解释主要脚本文件的代码。

          【提示词】解释 index.html 文件的代码

          它会给出代码结构和页面布局(上图),然后是 JS 脚本加载顺序和 Vue 应用逻辑,甚至包括了流程图(下图),这可是我没想到的。

          做完这一步,代码库的大致情况应该就相当了解了,而 AI 花费的时间不到一分钟。

          七、

          既然这个模型号称有"多语言编程能力",我就让它把项目语言从 JavaScript 改成 TypeScript。

          对于很多老项目来说,这也是常见需求,难度不低。

          它先制定了迁移计划,然后生成了 tsconfig.json 和 types.d.ts,并逐个将 JS 文件转为对应的 TS 文件(下图)。

          修改完成后,它试着运行这个应用,发现有报错(下图),于是又逐个解决错误。

          最终,迁移完成,它给出了任务总结(下图)。

          我在浏览器运行这个应用,遇到了两个报错:CodeMirror 和 FuriganaMD 未定义。

          我把报错信息提交给模型,它很快修改了代码,这次就顺利在浏览器跑起来了。

          至此,这个多年前的 JavaScript 应用就成功改成了 TypeScript 应用,并且所有内部对象都有了完整的类型定义。

          你还可以接着添加单元测试,这里就省略了。

          八、

          简单的测试就到此为止,我目前的 AI 编程大概就到这个程度,用 AI 来解释和修改代码。我也建议大家,以后遇到历史遗留代码,一律先交给 AI。

          虽然这个测试比较简单,不足以考验 MiniMax M2.1 的能力上限,但如果人工来做上面这些事情,可能一个工作日还搞不定,但是它只需要十几分钟。

          总体上,我对它的表现比较满意。大家都看到了,我的提示词很简单,就是一句话,但是它正确理解了意图,如果一次没有成功,最多再修改一两次就正确了。

          而且,就像发布说明说的一样,它运行速度很快,思考过程和生成过程最多也就两三分钟,不像有的模型要等很久。

          另外,不管什么操作,它都会给出详细的讲解和代码注释。

          总之,就我测试的情况来看,这个模型的 Web 开发能力确实很不错,可以用于实际工作。

          最后,说一点题外话。著名开发者 Simon Willison 最近说,评测大模型越来越困难,"我识别不出两个模型之间的实质性差异",因为主流的新模型都已经足够强大,足以解决常见任务,只有不断升级评测的难度,才能测出它们的强弱。

          这意味着,对于普通程序员的常见编程任务,不同模型不会构成重大差异,没必要迷信国外的旗舰模型,国产模型就很好用。

          (完)

          这里记录每周值得分享的科技内容,周五发布。([通知] 下周元旦假期,周刊休息。

          本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系[email protected])。

          封面图

          哈尔滨19米大雪人,完工之前的样子。(via cgtn@instagram

          《硅谷钢铁侠》摘录

          最近,我读了一本十年前的马斯克传记《硅谷钢铁侠》(中信出版社,2016)。

          按理说,这本书已经过时了,这十年马斯克发生太多事情了。

          我是睡觉前随手拿起来,翻了几页,看得津津有味,就读完了。

          这本是马斯克的授权传记,他本人亲自接受了采访,还挺有料的。而且,因为我已经知道后续的发展,所以读到十年前的采访,反而有更多启发。

          他的人生确实传奇,白手起家,家里给的最大帮助就是从南非移民到加拿大,后面都是自己奋斗出来的。

          他创立了 Paypal,然后把卖掉它的钱拿来又创办了三家公司:特斯拉、SpaceX 和 SolarCity。

          这太疯狂了,他一个外行同时进入了三个不同的行业----电动汽车、宇宙航天和太阳能----这些行业都刚萌芽,没有任何个人创业成功的先例。

          更疯狂的是,他居然把这三家公司都做成了,而且都做到了世界第一(SolarCity 后并入特斯拉),他也因此变成了世界首富,你说神奇不神奇。

          读完全书,我的最大感受是,还是要动手做事,没准真能做成。想他人不敢想,做他人不敢做。即使最狂野的梦想,只要全心投入,用力去做,也是有可能成功的。

          下面就是我的一点摘录。

          (1)

          特斯拉最艰难的时候,非常接近于破产倒闭。

          马斯克对外宣传,特斯拉是一家汽车公司,但实际上,他们只是一群年轻人租了一间大厂房,更像是在捣鼓汽车的大型实验室。

          (2)

          马斯克非常不理解,为什么有人设计了车灯开关。

          他说:"真是多此一举。天黑时车灯自动打开,就这么简单。"

          (3)

          特斯拉的第一版设计稿,因为设计师没想好门把手的形状,就没画上去。

          没想到马斯克很喜欢这个没有门把手的车型,就决定门把手应该在有需要的时候自动弹出。

          (4)

          马斯克认为,未来会有人口危机,主张多生孩子。

          他认真考虑了,怎么在特斯拉后排安装婴儿座椅。传统的车门设计,使得把婴儿座椅和小孩安置在后排非常不方便,所以特斯特的车门设计采用了"鹰翼门"。

          (5)

          特斯拉的第一款车型是跑车,但没有大量生产。真正大量生产的第一款车型是 Model S,最初的名字是 Model Sedan。

          Sedan 这个词的意思就是轿车,用来跟跑车相区别。但是马斯克认为这个词太平淡了。英国人习惯称轿车为 Saloon,这听上一样不伦不类。最后,就索性只保留第一个字母,称为 Model S。

          (6)

          马斯克对员工的要求是,全情投入你的工作,并把事情搞定。

          不要等待上级的指导和详细指示,也不要等待别人的反馈意见,你要主动想办法把工作完成。

          (7)

          他认为,一个人独立工作,是最佳的工作状态。

          一个人不需要开会、不需要与谁达成共识,也不需要在项目中帮助其他人。你一个人就可以持续地工作、工作、再工作。

          (8)

          特斯拉员工最害怕的事情,就是向马斯克申请额外的时间或者经费。

          你一定要事先做好详细准备,跟他解释为什么必须招更多的人,以及需要追加的时间和资金预算。如果有招聘目标,还要准备那个人的简历。

          (9)

          如果你一上来就告诉马斯克,某件事情做不了,他会马上把你轰出办公室,甚至可能当场解雇你。

          在马斯克看来,某件事办不成的唯一原因,就是违背了基本的物理原理。但是即使这样,你也必须做足了功课,深入每一个技术环节,向他解释为什么行不通。

          (10)

          马斯克要求员工,项目没完成之前,周六和周日依然要努力工作,并睡在桌子底下。

          有些人反对,表示员工也需要休息,有时间陪陪家人。

          马斯克说:"我们破产之后,你们会有大量时间陪家人。"

          (11)

          马斯克有自己计算时间价值的方法。他预期10年后,公司的日营收可以达到1000万美元,所以进度每拖延一天,就相当于多损失1000万美元。

          (12)

          马斯克的根本想法是改变这个世界,他总是喜欢谈论人类的生存问题。

          早在他开始创业的时候,就已经得出了结论,那就是生命是短暂的。如果你真的意识到这一点,你就会知道,活着的时候工作越努力越好。

          科技动态

          1、黑色圣诞卡

          爱沙尼亚交通警察向800多名危险驾驶者,寄送了黑色圣诞卡,提醒他们新的一年必须安全驾驶。

          这些人都是过去违反交通规则的司机,最常见的问题是超速和不系安全带。

          圣诞卡上是一起交通事故的现场,黑漆漆的深夜,天空中有明亮的月亮,公路上有交通事故后的车辆残骸,远处还有车灯的亮光。

          一个有趣的统计是,虽然人们常说女司机是"马路杀手",但是这800多个危险驾驶者里面,只有33名女性。

          2、2025全球互联网报告

          世界最大 CDN 服务商 Cloudflare,发布了《2025全球互联网报告》,公布了它的统计数据。

          2025年,全球互联网流量上升19%,由于网民数量基本没变,所以多出来的流量来自 AI 爬虫。

          流量最大的前10大互联网服务:谷歌、脸书、苹果......

          移动流量中,苹果设备占35%,安卓设备占65%。

          浏览器排行是,Chrome 66%,Safari 15.4%,Edge 7.4%。

          3、违停巡逻车

          上海警方启用无人驾驶的违章停车巡逻车。

          这辆小车自动在马路上巡逻,对路面进行抓拍。

          一旦发现违停车辆,它就会识别车牌,将其上传警务系统,系统后台会发送提醒短信给车主,要求在12分钟内驶离。

          12分钟后,小车就会返回点位进行检查,将相关信息回传后台,并经民警审核后开罚单。

          据报道,12月18日一天,它共发现违停车辆119辆次。

          4、室内过山车

          一家瑞典的创意工作室,在他们的办公室建造了世界唯一的室内过山车。

          这个过山车途径办公室的各个角落,总长60米,最高的地方距离地面有3米。

          坐上这个过山车,你就能游览一圈办公室,看到同事们在干什么。

          工作室负责人说,建造它的目的是"促进员工之间的互动,以及打破常规,培养创造力。"

          文章

          1、分布式架构的演化(英文)

          本文将分布式架构分成三种:P2P、联邦式(比如 Mastodon)、中继式(比如 Nostr)。作者认为,对于大型分布式应用,中继式架构才是未来方向。

          2、什么是 GitHub 自托管 Runner?(中文)

          GitHub Actions 有一个 self-hosted runner 功能,让 action 运行在你自己的服务器。本文详细介绍它的概念、原理,并结合案例进行实践。(@luhuadong 投稿)

          3、CSS Grid Lanes 布局(英文)

          浏览器开始支持 CSS 的 Grid Lanes 布局了,大大方便了瀑布流的实现。

          4、6502 指令集适用汇编语言初学者(英文)

          6502 是一块诞生于1975年的 CPU,很多早期电脑(比如 Apple II)都使用它。作者解释,为什么你应该用它,作为学习汇编语言的第一个指令集。

          5、你应该多用/tmp目录(英文)

          作者提出,Linux 系统的/tmp目录用起来很方便,完全可以把它当作自己的临时性目录。

          6、中国的清洁能源战略(英文)

          《纽约时报》驻华记者的长文,体验当代中国的生活,比如无人驾驶、无人机送餐,他说"感觉像生活在未来"。

          工具

          1、MADOLA

          一种新的数学脚本语言,像编程一样写数学公式,可以编译成 HTML 格式作为文档,也可以编译成 C++ 或 WebAssembly 直接运行。(@AI4Engr 投稿)

          2、CattoPic

          一个基于 Cloudflare Worker 的图片托管服务,将图片上传到 Cloudflare 进行推过,支持自动格式转换、标签管理。(@Yuri-NagaSaki 投稿)

          3、termdev

          直接在终端,通过连接 Chrome Devtool 调试网页。(@taotao7 投稿)

          4、tui-banner

          为 Rust 语言的命令行项目添加一个横幅图案。(@coolbeevip 投稿)

          5、Alertivity

          macOS 菜单栏的资源监控工具,监控 CPU、内存、磁盘、网络和进程活动。(@nobbbbby 投稿)

          6、cpp‑linter

          C/C++ 代码的静态检查工具,可以接入 CI/CD 流程,简化代码质量管理。(@shenxianpeng 投稿)

          7、Rote

          开源的 Web 笔记软件,需要自己架设。(@Rabithua 投稿)

          8、Infographic

          JS 的数据可视化框架,用于在网页生成各种信息图,内置200多种模板。(@Aarebecca 投稿)

          9、Clock Dashboard

          天气时钟看板,适合老旧的电子设备再利用。(@teojs 投稿)

          10、离线版问卷

          开源 Web 应用,用来设计和托管调查问卷/报名表。(@chenbz777 投稿)

          11、Xget

          基于边缘计算(如 Cloudflare Workers/Vercel/Netlify)的加速引擎,可以加速程序员网站的访问速度,比如将github.com域名替换成xget.xi-xu.me/gh。(@xixu-me 投稿)

          12、BoxLite

          一个 Python 库,可以在脚本中运行一个微型虚拟机,提供硬件隔离。(@DorianZheng 投稿)

          13、Green Wall

          生成你的 GitHub 年度报告。(@Codennnn 投稿)

          14、edge-next-starter

          面向出海项目的 Next.js + Cloudflare 全栈项目模板,集成 Edge Runtime、D1 数据库、R2 存储。(@TangSY 投稿)

          AI 相关

          1、Chaterm

          带有 AI 功能的智能终端工具,可以用自然语言完成命令行操作。(@zhouyu123666 投稿)

          2、miniCC

          网友开发的 AI 编程工具 Claude Code 替代品,主要用于学习目的。(@Disdjj 投稿)

          3、Android Trans Tool Plus

          一个开源的纯前端应用,通过 AI 翻译安卓资源文件,支持多语言同步、差异校验。(@huanfeng 投稿)

          4、octopus

          个人用户的大模型 API 聚合工具,支持接入多个模型供应商,提供负载均衡、分组名称、使用量统计等功能。(@bestruirui 投稿)

          5、Vexor

          一个 Python 工具,对当前目录的文件进行向量嵌入,用来语义搜索。(@scarletkc 投稿)

          6、Tada

          开源的任务管理应用,带有 AI 总结功能。(@Leaomato 投稿)

          资源

          1、大模型原理(英文)

          一篇相对好懂的大模型原理解释,文章不长,并且还有大量的互动图形,写得非常好,推荐阅读。

          2、编程语言速度比较

          这个网站使用不同的计算机语言,通过莱布尼茨公式计算 π 值,然后给出运行速度的排名,最快是 C++(clang++),最慢是 Python (CPython)。

          3、更好的 ZIP 炸弹

          这个网页提供三个 ZIP 炸弹文件的下载,其中最小一个只有 42KB,但是解压后的大小是 5.5GB。

          图片

          1、2025年最佳科学图片

          《自然》杂志评选的一组2025年最佳科学图片。

          两只争夺领地的青蛙。

          南非废弃天文台长出的蘑菇。

          2、帽子,乌龟和幽灵

          2022年,一个业余数学家 David Smith 发现了一个有点像帽子的奇特形状。

          这个形状的奇特之处在于,它可以无限不重复地铺满整个空间,且不形成周期性的重复图案。

          不久后,他又发现了两种稍加变化的形状,称为乌龟和幽灵,也可以不重复地平铺平面。

          下面就是这三种形状各自平铺的图案。

          言论

          1、

          我使用氛围编程会感到疲惫,AI 生成代码的速度太快了,我的大脑跟不上,无法及时完成代码验收或审查。我必须休息一段时间,才能重新开始。

          -- 《氛围编程疲劳》

          2、

          制造汽车是非常困难的一件事。一辆车大约有3万个独立零部件,公司可能只会采购3000个,因为像车头灯这样的部件,是作为一个整体采购的,但它实际上包含很多组件。

          里面的二级、三级、四级供应商提供的零部件,任何一个出现问题都可能导致整车的问题。

          -- 汽车创业公司 Rivian 的 CEO 专访

          3、

          数码世界的现状是,很多人(尤其是大多数老年人)已经放弃了抵抗,任由电子设备将他们带到任何地方。

          因为一旦你想搞清楚电子设备的运作,就会发现,在便利的幌子下,一切都充满了敌意,暗箱操作无处不在,不可能完全理清。你想从它们手中夺回个人数据和隐私会非常艰苦,而且注定失败,最终只会带来更大的挫败感。

          -- 《一切并非必然》

          4、

          现在的学生拥有前所未有的优质教育资源,但他们却陷入成千上万种选择中不知该学什么、该用什么资源的困境。拥有资源并不意味着就能找到方向。

          -- 《不要关闭你的大脑》

          5、

          危险并非来自中国的崛起,而是美国的思维模式。如果把科学视为零和博弈,那么每一项中国专利看起来都像是美国的损失。但创意是非竞争性的:中国的科研突破不会让美国人变穷,而是会让世界变得更富有。多极化的科学世界意味着更快的增长、更大的财富和加速的技术进步。

          -- 《中国的创新》

          往年回顾

          西蒙·威利森的年终总结,梁文锋的访谈(#332)

          电动皮卡 Cybertruck 的 48V 供电(#282)

          好用的平面设计软件(#232)

          新人优惠的风险(#182)

          (完)

          直接导航——通过在网页浏览器中手动输入域名访问网站的行为——从未如此危险:一项新研究发现,绝大多数"停放"域名(主要是过期或闲置域名,或是热门网站的常见拼写错误)现在都被配置为重定向访问者至推送诈骗和恶意软件的网站。

          一个模仿FBI网络犯罪投诉中心网站的相似域名,在2025年10月返回了无威胁的停放页面(左图),而移动用户则被立即导向欺骗性内容(右图)。图片来源:Infoblox。

          当互联网用户尝试访问过期域名或意外导航至相似的"域名抢注"域名时,他们通常会被带到域名停放公司的占位页面,这些公司通过展示多个付费展示链接的第三方网站链接,试图从这些误入流量中获利。

          十年前,访问这些停放域名后被重定向到恶意目的地的风险相对较小:2014年,研究人员发现(PDF)停放域名将用户重定向至恶意网站的概率不到5%——无论访问者是否点击了停放页面上的任何链接。

          但在过去几个月的系列实验中,安全公司Infoblox的研究人员表示,他们发现情况现已逆转,恶意内容目前已成为停放网站的常态。

          "在大规模实验中,我们发现超过90%的情况下,访问停放域名的用户会被导向非法内容、诈骗、恐吓软件和杀毒软件订阅,或恶意软件,因为点击流量从停放公司出售给广告商,而广告商通常又将流量转售给另一方,"Infoblox研究人员在今天发布的论文中写道。

          Infoblox发现,如果访问者使用虚拟专用网络(VPN)或非住宅互联网地址访问网站,停放网站是良性的。例如,Scotiabank.com的客户如果不小心将域名误输入为scotaibank[.]com,使用VPN时会看到正常的停放页面,但如果来自住宅IP地址,则会被重定向至试图推送诈骗、恶意软件或其他不良内容的网站。同样,仅通过使用住宅IP地址的移动设备或台式电脑访问拼写错误的域名,就会发生这种重定向。

          根据Infoblox的数据,拥有scotaibank[.]com的个人或实体拥有近3000个相似域名组合,包括gmai[.]com,该域名显然已配置了自己的邮件服务器以接收传入的电子邮件。这意味着,如果您向Gmail用户发送电子邮件时不小心遗漏了"gmail.com"中的"l",该邮件不会消失在以太网中或产生退回回复:它会直接发送给这些诈骗者。报告指出,该域名还在最近的多次商业电子邮件入侵活动中被利用,使用附有木马恶意软件的付款失败诱饵。

          Infoblox发现,这个特定的域名持有者(通过一个常见的DNS服务器——torresdns[.]com暴露)已建立了针对数十个顶级互联网目的地的域名抢注域名,包括Craigslist、YouTube、Google、Wikipedia、Netflix、TripAdvisor、Yahoo、eBay和Microsoft。这些域名抢注域名的无害列表可在此处获取(所列域名中的点已替换为逗号)。

          Infoblox的威胁研究员David Brunsdon表示,停放页面通过一系列重定向引导访问者,同时使用IP地理位置、设备指纹识别和Cookie来分析访问者的系统,以确定将域名访问者重定向至何处。

          "在威胁到达之前,通常是一系列重定向链——停放公司之外的一两个域名,"Brunsdon说。"每次交接时,设备都会被反复分析,然后被传递到恶意域名,或者如果他们决定不值得作为目标,则传递到像Amazon.com或Alibaba.com这样的诱饵页面。"

          访问scotaibank dot com时的重定向路径示例。每个分支包括观察到的一系列域名,包括颜色编码的着陆页。图片来源:Infoblox。

          Infoblox表示,另一个拥有domaincntrol[.]com的威胁行为者——该域名与GoDaddy的名称服务器仅相差一个字符——长期以来一直利用DNS配置中的拼写错误将用户导向恶意网站。然而,最近几个月,Infoblox发现恶意重定向仅发生在对配置错误域名的查询来自使用Cloudflare DNS解析器(1.1.1.1)的访问者时,而所有其他访问者将收到一个拒绝加载的页面。

          研究人员发现,即使是知名政府域名的变体也成为恶意广告网络的目标。

          "当我们的一位研究人员试图向FBI的互联网犯罪投诉中心(IC3)报告犯罪时,他们不小心访问了ic3[.]org而不是ic3[.]gov,"报告指出。"他们的手机很快被重定向到一个虚假的'Drive Subscription Expired'页面。他们很幸运只遇到了诈骗;根据我们了解到的情况,他们同样可能轻易地收到信息窃取程序或木马恶意软件。"

          Infoblox报告强调,他们追踪的恶意活动并未归因于任何已知方,并指出研究中提到的域名停放或广告平台并未涉及其记录中的恶意广告。

          然而,报告总结道,尽管停放公司声称只与顶级广告商合作,但这些域名的流量经常被出售给联盟网络,而联盟网络又经常转售流量,以至于最终广告商与停放公司之间没有业务关系。

          KrebsOnSecurity.com 于今日迎来其十六周年纪念!衷心感谢所有读者——无论是新访客、长期关注者还是偶然路过的批评者。过去一年里,各位的积极参与令人惊叹,也确实为一些阴霾日子带来了慰藉。令人欣慰的是,2025年我们的报道贯穿了一个强烈的主题——"恶有恶报",重点关注那些为复杂且全球分布的网络犯罪服务提供便利的实体。

          图片:Shutterstock, Younes Stiller Kraske。

          2024年5月,我们深入审视了 Stark Industries Solutions Ltd. 的历史与所有权。这家"防弹托管"服务商在俄罗斯入侵乌克兰前两周上线,并成为克里姆林宫多次网络攻击和虚假信息行动的主要策源地。一年后,Stark及其两位共同所有者受到欧盟制裁,但我们的分析显示,这些惩罚几乎未能阻止Stark的所有者进行品牌重塑,并将其大量网络资产转移到他们控制的其他实体。

          2024年12月,KrebsOnSecurity剖析了Cryptomus。这家在加拿大注册的金融公司,成为数十家俄罗斯加密货币交易所以及向俄语客户兜售网络犯罪服务的网站的首选支付处理器。2025年10月,加拿大金融监管机构裁定Cryptomus严重违反了反洗钱法,并对其处以创纪录的1.76亿美元罚款

          2023年9月,KrebsOnSecurity发布了研究人员的发现,他们得出结论:一系列针对数十名受害者、涉案金额达六位数的网络盗窃案,源于窃贼破解了2022年从密码管理服务LastPass窃取的主密码。在2025年3月的一份法庭文件中,调查一起高达1.5亿美元加密货币盗窃案的美国联邦探员表示,他们也得出了相同的结论

          网络钓鱼是今年报道的一个主要主题,我们深入探究了几个语音钓鱼团伙的日常运作,这些团伙经常实施精心策划、极具说服力且造成重大经济损失的加密货币盗窃。《一个高产语音钓鱼团伙的日常》 审视了一个网络犯罪团伙如何滥用苹果和谷歌的合法服务,向用户强制发送各种外发通信,包括电子邮件、自动电话以及发送到所有已登录设备的系统级消息。

          2025年,近六篇报道剖析了来自中国网络钓鱼工具包供应商无休止的短信钓鱼或"smishing",他们让客户能够轻松地将钓鱼获取的支付卡数据转换为苹果和谷歌的移动钱包。为了争夺对该钓鱼集团在线资源的控制权,谷歌此后提起了至少两起针对这些团体和数十名未具名被告的John Doe诉讼

          今年一月,我们重点报道了对一个名为Funnull的可疑且庞大的内容分发网络的研究,该网络专门帮助中国的赌博和洗钱网站将其业务分布到多个美国云服务提供商。五个月后,美国政府制裁了Funnull,认定其为被称为"杀猪盘"的投资/恋爱诈骗的主要源头。

          图片:Shutterstock, ArtHead。

          五月,巴基斯坦逮捕了21名据称为Heartsender工作的人员。Heartsender是一个网络钓鱼和恶意软件传播服务,KrebsOnSecurity早在2015年就首次对其进行了剖析。此次逮捕发生在联邦调查局和荷兰警方查获该组织数十台服务器和域名后不久。许多被捕者首次被公开身份,是在2021年本网站的一篇报道中,该报道讲述了他们如何无意中感染了恶意软件,从而泄露了他们的真实身份

          四月,美国司法部起诉了一家巴基斯坦电子商务公司的所有者,指控其合谋在美国分销合成阿片类药物。次月,KrebsOnSecurity详细说明了这家受制裁实体的所有者或许更广为人知的是,他们运营着一个精心策划且历时漫长的骗局,诈骗那些在商标注册、图书写作、移动应用开发和标志设计方面寻求帮助的西方人

          本月早些时候,我们调查了一个由谷歌广告助推的学术作弊帝国,该帝国获得了数千万美元的收入,并且与一位和克里姆林宫有联系的寡头有着耐人寻味的关联,这位寡头的俄罗斯大学正在为俄罗斯对乌克兰的战争制造无人机

          一架攻击无人机广告出现在一个网站上,该网站与俄罗斯最大的私立教育公司——协同大学——托管在同一网络中。

          一如既往,KrebsOnSecurity努力密切关注全球规模最大、破坏性最强的僵尸网络。今年,这些僵尸网络以分布式拒绝服务攻击重创互联网,其规模和影响是先前记录的最大DDoS攻击的两到三倍

          六月,KrebsOnSecurity.com遭遇了当时谷歌所缓解过的最大规模DDoS攻击(我们很感激能受惠于谷歌卓越的Project Shield服务)。专家将此次攻击归咎于一个名为Aisuru的物联网僵尸网络,该网络自2024年底出现以来,规模和火力迅速增长。几天后,Aisuru对Cloudflare发起的另一次攻击,其规模几乎是对本网站六月攻击规模的两倍。此后不久,Aisuru又被指责发动了一次DDoS攻击,其规模再次翻倍,刷新了之前的记录。

          十月,控制Aisuru的网络犯罪分子似乎已将僵尸网络的重点从DDoS攻击转向了更可持续、更有利可图的用途:将数十万台受感染的物联网设备出租给代理服务,以帮助网络犯罪分子匿名化其流量

          您正在阅读的故事是一系列独家报道,它们嵌套在一个更为紧迫的全互联网安全通告之中。所讨论的漏洞已被利用数月之久,现在是时候让更多人意识到这一威胁了。简而言之,您过去对互联网路由器后方内部网络安全性的认知,如今很可能已经过时,并带来了危险。

          安全公司Synthient目前观察到全球有超过200万台设备感染了Kimwolf,主要集中在越南、巴西、印度、沙特阿拉伯、俄罗斯和美国。Synthient发现,其中三分之二的Kimwolf感染设备是内置无安全或身份验证功能的Android电视盒。

          过去几个月,一个名为Kimwolf的新型僵尸网络经历了爆炸性增长。专家称其已感染全球超过200万台设备。Kimwolf恶意软件会迫使受感染系统转发恶意和滥用的互联网流量——例如广告欺诈、账户接管尝试和大规模内容抓取——并参与足以使几乎任何网站离线数日的毁灭性分布式拒绝服务(DDoS)攻击。

          然而,比Kimwolf的惊人规模更重要的是它用来快速传播的邪恶方法:它有效地通过多种“住宅代理”网络隧道回传,进入代理端点的本地网络,并进一步感染那些隐藏在用户防火墙和互联网路由器假定保护之下的设备。

          住宅代理网络作为一种服务出售,旨在帮助客户匿名化其网络流量并将其定位到特定区域。其中最大的服务允许客户通过全球几乎任何国家或城市的设备来路由其流量。

          将终端用户的互联网连接转变为代理节点的恶意软件,通常与可疑的移动应用和游戏捆绑在一起。这些住宅代理程序也常通过非官方Android电视盒安装,这些电视盒由第三方商家在诸如AmazonBestBuy, NeweggWalmart等热门电商网站上销售。

          这些电视盒价格从40美元到400美元不等,以令人眼花缭乱的无名品牌和型号进行销售,并且经常被宣传为可以免费流式传输某些类型的订阅视频内容。但这场交易存在隐藏成本:正如我们稍后将探讨的,这些电视盒构成了目前估计感染Kimwolf的200万个系统中相当大的一部分。

          一些预装了住宅代理恶意软件的非授权Android电视盒。图片来源:Synthient。

          Kimwolf也非常擅长感染一系列联网数码相框,这些相框在各大电商网站同样大量存在。2025年11月,Quokka的研究人员发布了一份报告(PDF),详细说明了运行Uhale应用的基于Android的数码相框存在的严重安全问题——包括截至2025年3月亚马逊最畅销的数码相框。

          这些数码相框和非授权Android电视盒带来的第二大安全噩梦是,它们依赖于少数几款联网微电脑板,而这些板子没有内置明显的安全或身份验证要求。换句话说,如果您与一个或多个此类设备处于同一网络,您很可能可以通过在网络中发送一条命令,同时攻陷它们。

          没有地方比得上127.0.0.1

          这两种安全现实的结合在2025年10月凸显出来,当时罗切斯特理工学院的一名计算机科学本科生开始密切跟踪Kimwolf的增长,并每天与其明显的创建者直接互动。

          Benjamin Brundage是安全公司Synthient的22岁创始人,这家初创公司帮助企业检测代理网络并了解这些网络如何被滥用。Brundage在准备期末考试期间进行了大量关于Kimwolf的研究,他在2025年10月下旬告诉KrebsOnSecurity,他怀疑Kimwolf是Aisuru僵尸网络的一个新的基于Android的变种。Aisuru在去年秋天曾被错误地指责为多起破纪录DDoS攻击的元凶。

          Brundage表示,Kimwolf通过利用全球许多大型住宅代理服务中的一个明显漏洞而迅速增长。他解释说,这个弱点的关键在于,这些代理服务未能充分阻止其客户将请求转发到单个代理端点的内部服务器。

          大多数代理服务会采取基本措施,通过明确拒绝针对RFC-1918中指定的本地地址的请求,来防止其付费客户“向上游”进入代理端点的本地网络。这些地址包括众所周知的网络地址转换(NAT)范围:10.0.0.0/8、192.168.0.0/16和172.16.0.0/12。这些范围允许私有网络中的多个设备使用单个公共IP地址访问互联网。如果您运行任何家庭或办公网络,您的内部地址空间就在一个或多个这些NAT范围内运行。

          然而,Brundage发现,操作Kimwolf的人已经找到了如何直接与数百万住宅代理端点的内部网络上的设备通信的方法,他们只需更改其域名系统(DNS)设置,使其与RFC-1918地址范围中的设置匹配即可。

          “通过使用指向192.168.0.1或0.0.0.0的DNS记录,可以绕过现有的域名限制,”Brundage在2025年12月中旬发送给近十二家住宅代理提供商的首份安全通告中写道。“这使得攻击者能够向当前设备或本地网络上的设备发送精心构造的请求。这正被积极利用,攻击者利用此功能来投放恶意软件。”

          Covenant Health组织已将去年五月发现的数据泄露事件受影响人数修正至近50万。

          该医疗实体最初于七月报告称有7,864人的数据遭泄露,但进一步分析显示实际影响范围更大。

          在完成"大部分数据分析工作"后,Covenant Health目前确认共有478,188人受到影响。

          Covenant Health是位于马萨诸塞州安多弗的天主教医疗保健机构,在新英格兰地区和宾夕法尼亚州部分区域经营医院、护理康复中心、辅助生活居住区和老年护理组织。

          Qilin勒索软件攻击

          Covenant Health于2025年5月26日发现,攻击者早在八天前(5月18日)已入侵其系统并获取患者数据访问权限。

          六月下旬,Qilin勒索软件组织宣称发动了此次攻击,声称窃取了852GB数据,包含近135万份文件。

          Qilin勒索软件在其数据泄露网站列出Covenant Health
          来源:BleepingComputer

          该机构表示泄露信息可能包含姓名、地址、出生日期、病历号、社会安全号码、健康保险信息及治疗详情(如诊断结果、治疗日期、治疗类型)。

          在一份通知副本中,Covenant Health称已聘请第三方取证专家确定受影响的数据范围及人数。

          "审查工作仍在进行中,"该机构表示,但未提供调查完成时间表及其影响评估。Covenant Health称已加强系统安全防护,以防未来发生类似事件。

          该医疗实体正在为受影响个人提供12个月免费身份保护服务,以帮助检测其信息可能遭到的非法使用。

          自12月31日起,该机构开始向可能在五月入侵事件中信息受损的患者邮寄数据泄露通知函。