英国宣布了一项新的网络安全战略,投入超过2.1亿英镑(约合2.83亿美元),以加强政府部门及更广泛公共部门的网络防御能力。

这些新措施是《政府网络行动计划》的一部分,该计划将设立专门的政府网络部门,负责协调风险管理和事件响应,旨在使公民在访问福利、医疗和税务系统等在线公共服务时获得更安全的体验。

数字政府部长伊恩·默里周二表示:"网络攻击可在数分钟内使重要的公共服务瘫痪——破坏我们的数字服务乃至生活方式。该计划设定了新标准,以加强公共部门的防御能力,同时警告网络犯罪分子:我们将以更快速度、更大力度保护英国的企业和公共服务。"

该计划包括建立最低安全标准、提升政府内部网络风险的可视性,并要求各部门保持强大的事件响应能力。新的"软件安全大使计划"将推广最佳实践,思科、Palo Alto Networks、Sage、NCC Group和桑坦德银行等多家大型企业已作为大使加入该计划。

这项2.1亿英镑的公共部门网络安全强化计划,是在新立法出台后推出的,该立法旨在加强医院、能源系统、交通网络和供水系统应对网络攻击的防御能力。今年早些时候,英国还宣布计划禁止公共部门和关键基础设施组织在遭受勒索软件攻击后支付赎金。

《网络安全与韧性法案》(于11月12日提交英国议会)以2018年《网络与信息系统法规》为基础,预计将彻底改革英国保护关键服务的方法。正如政府当时解释的那样,该法案针对日益增长的网络威胁,这些威胁曾导致国防部薪酬系统遭入侵,并引发影响超1.1万个医疗预约的国民医疗服务体系重大中断。

近期在11月,英国最大的移动运营商也承诺升级系统,根据与政府达成的新合作计划,在一年内消除诈骗者伪造电话号码的能力,以打击欺诈行为。

谷歌搜索AI幻觉问题促使谷歌招聘"AI答案质量"工程师

包括谷歌搜索中的AI概述在内的人工智能系统可能出现幻觉,经常编造信息,或在以两种不同方式提问时提供相互矛盾的答案。

一份新的招聘信息表明,谷歌正在招聘工程师来验证AI答案并提升其质量,因为该公司正在重新构想搜索体验。

谷歌在招聘说明中解释道:"在谷歌搜索部门,我们正在重新构想随时随地以任何方式搜索信息的意义。为此,我们需要解决复杂的工程挑战并扩展基础设施,同时维护全球用户所依赖的普遍可访问且实用的体验。"

该职位名称为"AI答案质量工程师",加入谷歌搜索团队的员工将承担提升AI答案质量的任务,特别是针对AI概述功能。

招聘信息写道:"帮助AI答案质量团队在搜索结果页面和AI模式下,为用户困难复杂的查询提供AI概述答案。"

这是谷歌首次间接承认其AI概述功能需要改进,而时机选择颇为微妙。

谷歌正强制用户查看AI答案,却在提升质量方面作为有限

近期更新后,谷歌正将越来越多的用户推向AI模式和AI答案。

事实上,谷歌还在其Discover信息流中为新闻内容更新了AI概述功能,甚至使用AI重写新闻媒体的标题。

虽然谷歌AI概述已取得长足进步,答案质量较过去有所提升,但仍存在一些不足之处。

例如一周前,当我搜索某初创公司的估值时,谷歌编造了400万美元的数据。随后我打开新标签页以略微不同的表述提出相同问题,AI概述却显示该公司估值超过7000万美元。

我通过谷歌生成的引用链接交叉核对了答案,但注意到谷歌两次引用的数值在其声称的参考来源中根本不存在。

这只是谷歌可能出错的案例之一。

近日《卫报》报道称,AI概述提供的健康建议存在误导性或完全错误的情况。

过去几个月谷歌AI答案已有所改进,但仍需继续优化,因为大多数用户倾向于相信谷歌展示的所有信息。

Veeam发布安全更新,修复其Backup & Replication软件中的多个安全漏洞,其中包括一个严重的远程代码执行(RCE)漏洞。

该RCE安全漏洞编号为CVE-2025-59470,影响Veeam Backup & Replication 13.0.1.180及所有更早的13.x版本构建。

Veeam在周二的安全公告中解释称:"此漏洞允许备份或磁带操作员通过发送恶意的interval或order参数,以postgres用户身份执行远程代码执行(RCE)。"

然而,这家信息技术公司将其评级调整为高危,因为该漏洞只能由拥有备份或磁带操作员角色的攻击者利用。

公告补充道:"备份和磁带操作员角色被视为高权限角色,应予以相应保护。遵循Veeam推荐的安全指南可进一步降低漏洞被利用的机会。"

Veeam于1月6日发布了13.0.1.1071版本,以修补CVE-2025-59470漏洞,并解决了另外两个高危(CVE-2025-55125)和中危(CVE-2025-59468)漏洞——这两个漏洞分别允许恶意备份或磁带操作员通过创建恶意备份配置文件或发送恶意密码参数来获得远程代码执行权限。

Veeam的Backup & Replication(VBR)企业数据备份与恢复软件,可帮助创建关键数据和应用程序的副本,以便在网络攻击、硬件故障或灾难发生后快速恢复。

勒索软件团伙重点攻击的Veeam漏洞

VBR在中大型企业和托管服务提供商中特别受欢迎,但也经常成为勒索软件团伙的攻击目标,因为它可以作为在受害者环境中横向移动的快速支点。

勒索软件团伙此前曾告诉BleepingComputer,他们总是瞄准受害者的VBR服务器,因为这简化了数据窃取过程,并且通过在部署勒索软件有效负载前删除备份,可以轻松阻止恢复工作。

Cuba勒索软件团伙和出于经济动机的FIN7威胁组织(此前曾与Conti、REvil、Maze、Egregor和BlackBasta勒索软件团伙合作)过去也被发现利用VBR漏洞进行攻击。

最近,Sophos X-Ops事件响应团队在2024年11月披露,Frag勒索软件利用了两个月前披露的另一个VBR RCE漏洞(CVE-2024-40711)。自2024年10月起,Akira和Fog勒索软件攻击中也利用了同一安全漏洞来针对存在漏洞的Veeam备份服务器。

Veeam的产品在全球拥有超过550,000家客户,其中包括74%的全球2000强企业和82%的财富500强公司。

文件共享平台 ownCloud 今日警告用户启用多因素认证(MFA),以阻止攻击者利用已泄露的凭证窃取其数据。

ownCloud 在全球拥有超过 2 亿用户,其中包括数百家企业和公共部门组织,例如欧洲核子研究组织、欧盟委员会、德国科技公司 ZF 集团、保险公司瑞士人寿和欧洲投资银行。

在今日发布的安全公告中,该公司敦促用户启用 MFA。此前,以色列网络安全公司 Hudson Rock 的报告显示,多家组织的自托管文件共享平台(包括一些 ownCloud 社区版实例)在凭证窃取攻击中遭到入侵。

"ownCloud 平台并未被黑客攻击或入侵。Hudson Rock 的报告明确证实,未涉及零日漏洞或平台漏洞,"ownCloud 表示。

"这些事件是通过不同的攻击链发生的:威胁行为者通过在员工设备上安装信息窃取恶意软件(如 RedLine、Lumma 或 Vidar)获取了用户凭证。然后,这些凭证被用于登录未启用多因素认证(MFA)的 ownCloud 账户。"

ownCloud 建议用户立即在其 ownCloud 实例上启用 MFA,以保护数据免受未来攻击,并防止在凭证泄露时发生未经授权的访问。

此外,ownCloud 建议重置所有用户密码,使所有活动会话失效以强制重新认证,并审查访问日志中是否存在可疑的登录活动。

此警告发布之前,一名威胁行为者(被称为 Zestix)一直试图出售从数十家公司窃取的企业数据,这些数据很可能是在入侵其 ShareFile、Nextcloud 和 ownCloud 实例后获得的。

在其 1 月 5 日的报告中,Hudson Rock 表示,攻击者可能最初是使用 RedLine、Lumma 和 Vidar 等信息窃取恶意软件窃取的凭证,获得了对公司文件共享服务器的访问权限,这些恶意软件感染了员工的设备。

这家网络犯罪情报公司识别出数千台受感染的计算机,其中包括德勤、毕马威、三星、霍尼韦尔、沃尔玛和美国疾病控制与预防中心(CDC)等知名组织网络中的一些设备。

做出海工具站,绕不开的一道坎:收款

海外工具站最常见的支付方案是 Stripe ,
但现实是 Stripe 不支持大陆个人直接注册。

那么 Creem,是目前性价比非常高的一种选择。
Creem 的优势在于:

  • 不需要护照
  • 不需要营业执照
  • 只需要 身份证 + 支付宝
  • 支持用户使用 银行卡 / Google Pay 付款
  • 覆盖大多数海外用户的支付习惯
  • 非常适合个人出海、MVP 阶段

👉 等后期跑通变现、有稳定收入后,再考虑迁移到 Stripe,是一个非常合理的路径。

(原本是想放截图的,但是暂时没有找到插图的方式)

一、注册账号( 10 分钟搞定)

首次注册 Creem 后,需要先 创建一个 Store。这里非常简单:

  • Store Name:直接填写你的网站名即可
  • 不需要复杂描述,后面都可以修改

进入 Creem 后,默认是测试模式( Test Mode )。在测试模式下:所有支付都是 测试卡、不会真实扣钱、适合在本地或测试站调接口

👉 测试卡非常常见,随便找个 AI 问就能拿到。

二、完善账户提现和产品信息

Step 1:账户提现信息(生产环境)

⚠️ 一定要先切换到 生产环境( Production / Live )

切完后,完善提💰信息,Balance → Payout account → Create new account

接下来,按页面提示,逐步完善信息,信息填完后即可提交。

如果有不清楚的地方,可以直接找客服(左下角在线客服,回复速度还可以)。

Step 2:产品信息

1️⃣ 价格设置

这里只遵循一个原则:

你打算怎么卖,就怎么填。

看你想怎么卖你的产品,面向什么用户,单次付费还是订阅,价格区间,看用户能接受什么样的价位和档次。
只要构思好了,表单照填即可。

⚠️ 重要避坑提醒:

测试环境 & 生产环境的产品信息,都需要各填一遍。因为它们使用的是 不同的 API Key,如果只改测试环境,代码还没发版,生产环境数据却变了。用户会一脸懵,你也会一脸懵。

2️⃣ 网站必备页面(审核关键)

先给结论,Creem 审核非常看重以下内容:

Privacy Policy (隐私政策)Terms of Service (服务条款)联系邮箱(如:support@yourdomainfeedback@yourdomain)、检查是否存在违规内容(如:虚假评价、虚假销量,有就删掉)

我第一次提审为什么没过?

我一开始的想法是:

“Creem 应该只审核身份吧?
支付功能我还没完全接好,先提审看看。
等通过审核,再把支付功能接上去。”

于是:网站还没正式接支付、一些页面也没写、就直接提交了审核

一般 48h 内会有回复,结果我收到了一封邮件:未提供网站,信息不完整

后来我才认真看官方文档,发现他们有一整套
Account Review Checklist

如果支付功能还在测试,怎么办?

如果你的支付功能还没上生产环境,可以这样做:提交 正式网站(不带测试支付)、说明支付功能仍在测试阶段、提供测试地址(如 xxx.test)、同时提交产品截图(能看到价格、能看到产品形态 )

这样审核方也好判断:产品是否真实存在、是否可售、是否符合合规要求

⚠️避坑点

1️⃣一定不要出现任何虚假信息。
不管是虚假评价、虚假销量,还是一些看起来“无伤大雅”的营销描述,在 Creem 审核阶段都非常容易被卡。至少在审核期间,建议全部删除,否则基本就是直接不过。

2️⃣二次提审一定要做到“对症下药”。
Creem 的二次提审通常是通过邮件沟通,对方会非常明确地指出你当前不符合要求的地方,这时候不要只回复一句“我已经修改了”,而是要针对每一条反馈逐项解决,并附上对应的证据,比如截图、链接或页面地址,否则很容易再次被拒,甚至进入更长的等待周期。

3️⃣不要反复硬提审。
目前 Creem 并没有公开说明最多可以提审多少次,但不少伙伴的反馈是,提交次数一多,审核等待时间会明显被拉长。结合实际经验来看,只要前期准备到位,认真按照清单补齐内容,三次以内基本都能通过,没有必要赌运气。

我的整个提审周期

从第一次提交审核到最终通过,我前后大概花了 11 天,时间拉长主要是两个原因。

1️⃣我自己没有勤看邮箱。
手机收不到 Gmail 提醒,必须打开电脑、登录 Gmail 才能看到审核邮件,结果提审后一周才发现对方早就回复过我,指出我缺少网站链接。再一对照自查清单,才发现产品截图、价格展示等内容也都没准备齐,于是花了一天时间补齐静态页面,又用一天时间重新梳理产品定价,剩下的时间基本都在 vibe coding 。

2️⃣刚好赶上他们的圣诞节假期。
理论上 Creem 官方给的审核回复时间是 48 小时内,但叠加假期之后,实际大概等了 4 天左右才收到回复,好在后续流程就比较顺利了,再次回复邮件后就直接通过。

小小结

如果你现在正在做 AI 出海工具站,正好卡在「收款」这一步,又不想一开始就折腾海外公司、税务和一整套复杂结构,那么 Creem 这条路径是非常值得参考的。

先把 MVP 跑起来,先把现金流跑通,再去考虑更复杂、更长期的方案,往往是对个人开发者来说性价比最高的选择。

同样是 $1 的 API ,中转站的实际成本为什么差这么多?

最近在对比一些 AI API 中转站(主要是视频 / 文生图 / 大模型),发现一个挺常见、但又不太容易第一眼看明白的问题:

同样标 $1 的价格,实际人民币成本差异非常大。

简单整理了一下逻辑,分享给有需要的人。


一、很多平台的“美元价格”只是第一层

大多数中转站都会对外标注:

模型价格 = 官方原厂价格(美元)

这一步本身没问题,但 真正影响你成本的,其实不在这里


二、实际扣费通常取决于两个隐藏变量

在我观察过的平台里,最终人民币成本通常由 两个因素共同决定

1️⃣ 平台设置的「美元 → 人民币」充值比例

有的平台会宣传类似:

  • 1 美元 = 1 人民币
  • 看起来像是 1/7 折

这一步非常容易让人误判“很便宜”


2️⃣ 模型线路的「倍率(分组)」设置(关键)

这是很多新用户第一次根本不会注意到的地方。

常见做法是:

  • 同一个模型
  • 分成不同线路 / 分组
  • 不同分组有 6× / 8× / 16× 不等的倍率

也就是说:

实际扣费 = 官方美元价 × 线路倍率 × 平台汇率


三、算一笔账,其实很直观

假设官方价格是 $1

  • 平台宣传:1 美元 = 1 人民币
  • 实际使用线路倍率:

那么最终成本大致是:1 × 6 ÷ 7 ≈ 0.86

如果是 8×、16×,那就更明显了。

这时候,“1 美元 = 1 人民币”的优势,已经被倍率吃掉了。


四、另一种相对简单的做法

也有少数平台选择:

  • 直接使用原厂美元定价
  • 人民币只做一次正常汇率转换
  • 不区分模型线路分组
  • 所有请求统一 1× 倍率

这种方式的好处是:

  • 成本可预期
  • 计算简单
  • 不需要反复确认自己走的是不是“高倍率线路”

长期使用下来,反而更接近真实的“便宜”


五、写在最后

如果你平时调用量比较大,或者需要长期跑任务,建议一定要把「倍率」算进去再看价格,不然很容易被表面汇率误导。

如果有不同经验,欢迎补充。

热榜站地址

https://tgmeng.com

榜单数据来源

  • 把最近 1 分钟内全网几百个平台的所有热点,收集起来

榜单生成规则

  • 让 AI 对所有的热点进行分类,分为综合、科技、财经、娱乐、汽车、体育、游戏、民生,这 8 个榜单。然后让 AI 对每个分类下的热点进行标题归一化整理并生成热点级标题,然后进行结合全网情况+时下 AI 对世界的认知,生成一个排名。

榜单时效性

  • 每分钟更新一次,确认永远是最最最前沿的信息

榜单客观性真实性

  • 分析过程不掺杂任何主观意愿、广告信息、推广信息等等,保证绝对是最纯粹的热点排名。

AI 消耗

  • 站内目前每天消耗 token 大约在 25 亿左右,只为给各位带去极致的热点浏览体验。

网站理念

  • 科技不该冰冷、人性不该傲慢

鉴于没有找到一个符合需求的房贷计算器,用 AI 开发了一个,地址: https://calc.wjss.workers.dev/

我的主要需求很简单,就是有一个房贷计算器,能够计算出的还款明细,与银行 App 里的还款记录一模一样。

目前开发这个计算器基本能满足我的需求,并且补充了银行 App 里的还款明细缺少一些信息,比如:利率调整的时间点、累计支付的利息等,以及银行 App 不能模拟提前还贷以及计算节省利息等

欢迎大家体验,默认数据是是根据拿真实案例和中国银行里的还款明细做过比对没问题。如果大家输入的案例发现有算不对的,欢迎提 bug 。希望 bug 里包含: 输入的参数,算错的地方和期望结果。

前情

2023 年初,从华为 OD 跑路并入职央企,留下一篇《[分享] 华为 OD:从入门到跑路》,也收到了不少评论,感谢大家关注。在这个帖子发布的 3 年后,决定写下本篇文章,谈谈入职央企三年来的体验,也算是给自己的一个总结吧。

应聘与入职

如大家在网上看到的,多数央企已经不开放社招渠道,或只招高级别员工。楼主作为小虾米算是赶上了本公司普通岗位社招的末班车,在我入职之后,就没听说本单位有社招入职的同事了。接下来说说央企招聘给我留下的几个印象:

1 、流程很长

央企招聘有非常多的手续和漫长的流程,申请编制、公告、考试、面试、背调、体检、入职、调档等等,楼主从官网投递简历开始算起,到最终入职,差不多花了三个月。和大家想象的不同,申请编制很难得,而候选人中途放弃的很多,所以到招聘的后期阶段,等待公司上会决策的那段时间,HR 都会时不时地联系我,生怕候选人放弃了。

2 、严格合规

我司的背调极其严格,不是 HR 打个电话就行的。在面试结束之后的几个星期,我收到了来自公司发送的背调邮件,告知机构即将联系我进行背景调查,随后背调机构的通过邮件和电话联系到我,只有 3 个小时提交所要求的资料,并签署授权文件,背调会从犯罪记录、过往公司评价、政审、个税、流水等多个角度审查,并且不会告知结果。

⚠️因此建议希望加入类似体制公司的,绝对不能有一分一毫的造假行为(后面还有这部分的内容)

3 、含糊不清

招聘过程往往伴随着神秘色彩,招聘进度不清晰,往往参加完一个环节后就没有了消息,又在隔了一段时间之后临时通知你第二天进行下一个环节;薪资待遇不清晰,央企由于薪资待遇受到国资委的管控,加上社会对其特殊的关注,人事并不会告诉你每月薪资、薪资构成等详细情况,Offer 也不会写,只会在面试时收集期望年薪,并在通知结果时告诉你是不是能够满足期望。

工作体验

相较于华为 OD ,我司的工作体验是遥遥领先的。首先是拥有了归属感,其次是工作流程清晰,最后是公司资源充足。即不存在每天喝茶看报,也不会天天猛猛加班。工作上的考核、绩效之类的肯定有,但对于收入之类的影响并不大,同事多数也比较有钱,所以同事和领导之间相对和谐。

更多详细的工作内容,处于保密问题,不能多透露。

ADD:上面说到,绝对不要在入职阶段造假,因为入职之后会调取你的档案,收编到公司的档案库,并且会复查你的三龄两历(年龄、学龄、工龄、学历、工作经历),还有工作经历中每个公司的劳动合同以及离职证明原件,所以不要有侥幸心理。

薪酬体验

我入职华为 OD 的时候,还处在 OD 没那么恶心的阶段,比较舍得给钱,加上每月月末的加班费,薪资很香的。所以当时其实算是降薪入职,但当我第一次拿满年薪开始,发现会比人事和我说的数字多,也比华为 OD 要高。

工资基本都是当月预发,遇到节假日就提前发,年终在每年 12 月 31 日之前必须发满当年,应该是和国资委要求的当年人力成本必须当年完成支出有关。

但值得注意的是,央企的社保和报税是非常正规且严格的,会按照上一年年薪/12 进行社保缴纳,所以月到手工资基本只有月应收的 70%左右(甚至不到)。当然,公司所支付的社保费用也超出很多人的想象,我时常吐槽公司缴纳的部分给我发现金就好了( Wildest Dreams )

福利待遇

饭堂、六险二金、家庭医疗保险、消费卡、节假日福利这些,体验久了觉得挺麻木的,也不能够非常详细地说明。但可以说的是,很多老牌央企在这方面的待遇还是远远好于市面上的多数公司,甚至远远好于多数人对于国企的想象。对于我本人来说,其实对福利待遇没有特别在意,因为平时自己的消费水平也比较高,但无奈《他给的太多了.jpg 》

假期:假期包含各种法规内的假期(年假、独生子女假、赡养老人假等)之外,还有很多企业奖励假、福利假,资历深的同事基本都是 35 天以上的年假,根本休不完。休假不需要告知原因和去向,只要说个人事务休假即可,领导也不会限制,但当然,如果工作没做完或假期有紧急情况,还是要居家工作的。如果非紧急情况,不论领导还是同事,都会注意不在假期期间打扰你。

我个人最离不开的就是差旅标准还是很高的,而且和大型酒店集团都有协议价,因此我们的差旅体验非常好,所有的交通、住宿都不用也不能自己支付,全部走内部差旅平台。酒店级别也很高,员工假期也可以用于私人行程(当然要自己付钱)

总结与未来

3 年前从 OD 离开,我还犹豫过,因为当时被“为块术”所迷惑,但工友们都劝我赶快走。当时父母是不支持的,觉得我不应该去那么安逸的环境。

但这三年,经历了大放开,然后各行各业凋零,又到现在有些复苏的苗头,我觉得我的选择并没有错。不论是从平台、成长、归属感、安全性的角度来说,我觉得都挺不错的。

毕业这几年,我经历了港企、小破私企(发不出公司)、龙头私企、华为 OD 、央企,我觉得每种体制都有好有不好,但综合对比下来港企和央企的正式工,对于打工人来说会香很多很多。

接下来,我希望跳槽看看外面的机会,找一个自己有机会单干的行业。在这个风雨飘摇的环境,放弃一个准时发工资、高福利待遇的温暖码头,真的很难。但我还想试试,如果能遇到一个正在扩张的企业招人,也是幸运的事情。只是不会再像三年前那样裸辞了(笑)

我希望自己成为自己的码头。

(文笔不好,很多信息考虑到保密和敏感性,不好多说,大家见谅,如果有好奇或疑问,也请讨论)

整理 | 华卫

 

“是时候在工作场景中突破 AI 的应用极限了。”在近期的一档播客节目中,素有 “SaaS 教父” 之称的 Jason Lemkin 表示,这意味着其销售部门将不再招聘人工员工。Lemkin 是全球最大的企业服务创业者社区 SaaStr 的创始人,曾向 B2B 初创公司投资超过 2 亿美元,如今他正领导 SaaStr 全面押注 AI Agent。

 

他透露,公司目前部署了 20 个 Agent,已承接原本需要 10 名销售开发代表和客户主管协作完成的工作。从全人工团队到 AI 主导的转型,SaaStr 的推进速度相当迅速。

两名高薪员工闪辞,创始人直接用 Agent 换掉大半人

今年 5 月时,SaaStr 仅有 1 个 Agent 投入实际运营,用于处理各类数字化任务。然而就在当月举办的 SaaStr 年度大会期间,公司两名高薪销售代表突然宣布离职。Lemkin 回忆道,他随即找到公司首席 AI 官 Amelia Lerutte,明确表示:“我们的销售部门再也不招人工了,要全力用 Agent 突破行业天花板。”

 

在他看来,与其花费 15 万美元年薪招聘一名最终可能离职的初级销售代表,不如启用忠诚度更高的 Agent,这笔人力成本投入完全得不偿失。据 Lerutte 透露,到 6 月时,SaaStr 已开始大幅扩充投入运营的 Agent 数量。她表示:“当时我们只和 Delphi 合作部署了 1 个非核心业务 Agent,直到 6 月初才着手将 Agent 数量从 2 个增至 20 多个。那两名员工离职后,我们审慎决定将部分(非全部)人力预算转而投入 Agent 的研发与部署。”

 

Lemkin 称,让他做出此决定的还有一个原因是,大会筹备期间,Delphi 这个既没受过销售训练、也没做过市场推广的通用 Agent,居然独立签下了一笔 7 万美元的赞助订单。

 

“可能有人会觉得我这么做不够 ‘酷’,但我实在不想再招聘第 28 个注定会离职的销售了。”Lemkin 坦言道。

 

他还提到,如今在 SaaStr 的办公区,原先归属市场拓展团队 10 名员工的工位,都已换上了 Agent 的专属名牌,比如负责客户资质审核的 “Quali”、主打定制化服务的 “Arty”,以及对接代码协作平台 Replit 的 “Repli”。

 

“我坐在办公室最里面,中间的工位全是 Agent。整个办公室安静得不得了。”

“Agent 生产力不输人工,但别自己动手做”

 

如今 SaaStr 的销售团队已发展成为一种全新的运营模式:20 个 Agent 是主力,由 1.2 名员工管理,完成之前由 10 名销售开发代表 (SDR) 和客户经理 (AE) 完成的工作。据介绍,其中

0.2 个人工指的是负责公司大小事的 Lerutte,她只需要花 20% 的工作时间,就能把所有 Agent 的调度和管理都搞定。

 

“用最优秀的员工、最完善的工作流程去训练 Agent,它就能逐步成长为你团队里顶尖销售的‘数字分身’。”Lemkin 指出,SaaStr 正以公司内部顶尖员工为标杆训练 Agent。 抛开安全隐患不谈,Agent 的综合生产力与人工员工基本持平,但优势在于效率更高、且能像软件一样实现规模化复制。

 

Lemkin 表示,现在大部分公司宁愿雇一个 60、70 岁的资深工程师,也不愿意花时间培养新人。毕竟这样做效率更高,这种趋势也在蔓延到销售行业。 只要是价格谈判空间不大,而且 Agent 对产品的了解程度超过人类的场景,顶尖的 Agent 完全能独立完成签单,至少在他们的业务场景里是完全可行的。懂得管理 Agent、与 Agent 协作,而且对自家产品了如指掌的人,价值会越来越高,其他的人则会慢慢被边缘化。

 

“我们的目标不是用 AI 取代所有人,核心逻辑是:AI 正在接管那些没人愿意干的活,淘汰那些业绩平平、能力平庸的岗位。而顶尖的销售人才,AI 会成为他们的‘超级外挂’。”

 

据 Lemkin 预测,靠邮件跟进的销售开发专员、人工筛选线索的岗位,不仅效率低、客户体验也很差,明年这些岗位基本都会消失。至于负责谈单的核心销售岗位,到明年年底还能保住 70% 的工作内容,但长远来看,这个比例会降到 40% 到 50%。

 

此外,他表示,SaaStr 所有的市场推广类 Agent 都不是自建的,全都是直接采购的,并建议大家也别自己动手。“这些工具理论上确实能自己开发,但真的没必要。这类产品的成本不算特别高,完全值得购买。而且 AI 领域的创新迭代太快了,就算你真的自己做出来,可能几个月后就过时了。”

 

Lemkin 坚称,2026 年,不管是哪类公司,都应该有足够的动力去探索 AI 在市场推广中的应用边界。现在所有公司的诉求都很明确:要么靠 AI 提升效率,要么靠 AI 缓解海量客户咨询的压力。那些没跟上 AI 浪潮的公司,增长已经严重放缓,不是 “所有方法都失灵了”,只是效果远不如 2021 年那样显著,投入产出比太低了,企业也没有足够预算去支撑 2021 年那套老派的 SaaS 推广打法。

被批“太激进”,半年前才被 Replit 坑过?

 

SaaStr 的这套 Agent 应用流程,与开发者云端平台 Vercel 的实践异曲同工,后者曾让一名顶尖销售员工全程记录工作流程,耗时六周以此为蓝本训练出一款销售 Agent,使其能够精准复刻这名员工的工作模式。

 

然而,有网友提出疑问:“SaaStr 为何要大张旗鼓地宣布这件事?在 B2B SaaS 行业,客户服务流程是企业运营的核心命脉之一。他如此高调地宣称 ‘再也不招人工员工’,是想达到什么目的?难道他觉得潜在客户会被这种说法吸引还是排斥?依我看,在绝大多数行业领域里,答案恐怕都是后者。”

 

还有人表示,“敢把 ‘让顶尖销售员工全程记录工作流程,耗时六周完成数据采集,再据此打造出能复刻其工作模式的销售 Agent’ 的细节公之于众,胆子可真不小。我敢肯定,这短短六周里,绝对不可能覆盖到所有可能出现的业务场景。还有什么是不可能出错的呢?想必你们自己也无从知晓,毕竟团队里已经没有任何具备一线实战经验的员工可以咨询了。通过技术手段简化工作流程、优化员工的时间分配有很大的操作空间,但这类激进的替代策略,无疑是一场蓄势待发的灾难。”

 

甚至有人开始预测道:“有没有人敢打赌,这出闹剧会在多久之后彻底失控?届时 Jason 和他的团队恐怕只能悄悄叫停 Agent 项目,想方设法掩盖痕迹,再去招揽那些走投无路、愿意回头为他们效力的员工。不如我们把赌注再抬高些:要是后续曝出不当行为引发的诉讼,或是被竞争对手设局诱导 Agent 泄露了所有专有数据,赌注就加倍。”

 

当前,众多企业都在试水 AI Agent 技术,但风险依然不容忽视,其中最突出的隐患便是数据泄露与网络犯罪的威胁。英国阿达・洛芙莱斯研究所高级研究员 Harry Farmer 近期在接受采访时表示:“AI Agent 若要充分发挥功能、顺利接入各类应用程序,往往需要获取其运行设备的操作系统层级权限。”而这种全方位的权限获取,会为网络犯罪分子制造更多潜在的攻击切入点。

 

值得一提的是,Lemkin 在六个月前因为以下事情被热议:他仅用了 9 天就通过 Replit 的新型 AI Agent 构建出一个 SaaS 产品,并将其称之为“价值 100 万美元的产品”。该产品重写了核心页面,改进了用户体验,并快速上线。之后他开启了代码冻结模式,结果 Agent 却无视了该指令,把整个生产环境数据库都删了个精光。

 

参考链接:

https://www.businessinsider.com/godfather-of-saas-jason-lemkin-replace-humans-ai-agents-sales-2026-1

https://www.youtube.com/watch?v=I-R1bc1rlFs

近日,全球权威机构 IDC 发布的《IDC 中国分布式事务数据库市场追踪,2025H1》报告显示,2025 上半年,原生分布式数据库厂商 OceanBase 以 2810 万美元营收,居中国分布式事务数据库本地部署市场第一。这是继 2024 年下半年后,OceanBase 连续两次在该细分市场拔得头筹。

同时,在包含公有云的整体市场中,OceanBase 以 4060 万美元营收位列独立厂商第一、整体第四,持续领跑国产数据库阵营。

 

IDC 统计,2025 上半年,中国分布式事务数据库市场规模达 4.2 亿美元,同比增长 19.6%。其中,本地部署市场增速高达 24.9%,显著高于公有云部署模式,预计 2024-2029 年复合增长率将达 24.2%。分布式数据库正加速向金融、政务等核心系统渗透,在性能、稳定性与综合成本上比肩甚至超越国际产品。

 

IDC 同时认为,当前市场集中度持续提升,前五大厂商已占据 82.5%的市场份额。随着国家数据库测评名单的发布和政策深入推进,具备核心技术能力与成熟实践案例的厂商优势凸显。

 

据了解,OceanBase 是蚂蚁集团 100%自研的原生分布式数据库。IDC 在报告中指出,OceanBase 凭借原生分布式、原生多租户、HTAP、高级数据压缩等技术特性,成为分布式交易型数据库的代表厂商。其“单机分布式一体化”设计,可在同一产品体系下灵活支撑企业从初创到超大规模增长的全周期需求。

 

自 2020 年商业化以来,OceanBase 客户数突破 4000 家,连续 5 年年均增速超 100%,广泛应用于金融、政务、能源、通信、医疗等关键领域。面向 AI 时代,OceanBase 加速“Data xAI”融合,先后发布 4.4 一体化融合版本、AI 原生混合搜索数据库 seekdb 等产品,通过 AI 原生混合搜索、多模融合、TP/AP/AI 一体化等前沿能力,服务数十家头部企业智能化应用。

 

在金融领域,OceanBase 服务全部政策性银行、5/6 国有大行,覆盖超 100 家资产规模千亿级以上银行,支撑 190+核心系统、1000+关键业务,并成功落地汇丰、澳门大丰、老中银行、三井住友等国际金融机构。其中,老中银行在老挝上线基于 OceanBase 的新一代核心系统,性能提升 20 倍、批量处理缩至 30 分钟,成本仅为同类方案 20%,实现中国自研数据库海外银行核心系统的首单落地。

 

在政务与央国企领域,OceanBase 支撑全国约 1/3 省级人社系统、12123 交管平台、北上广深地铁票务系统及多家三甲医院 HIS 系统,并深度服务中国移动、中国联通、中国电信、国家电网、中国石化、中国航信、中国南方航空等大型央国企。

 

在海外支持方面,OceanBase 多云数据库 OB Cloud 已运行于阿里云、AWS、Azure 等七大主流云平台,支持“一套架构、全球运行”,服务 GCash、2C2P、PalmPay 等 50 余家海外客户。

去年,一部由徐峥主演的电影《逆行人生》,将外卖骑手在数字时代下的生存状态推至公众视野的中心。影片刻画了骑手们在车流中穿梭的日常,以一种犀利而写实的方式,揭开了平台算法背后那只看不见的手——它如何无声地主宰着骑手的收入、节奏甚至命运。

 

由此,一个曾经隐藏在订单推送与时限倒计时背后的算法和数据相关议题,逐渐发酵成为当时国内的热门话题。在海外,这一话题同样反复引发争议。

 

近日,一名自称外卖平台“内部举报人”的 Reddit 用户被证实为造假者,其编造的故事曾在全球社交平台引发巨大传播。

事件回溯

 

事件始于 Reddit 上发布的一篇“举报帖”。一名 ID 名为 Trowaway_whistleblow 的用户发帖,自称自己是一位即将离职的 Uber Eats 软件工程师,长期目睹公司通过算法系统系统性剥削外卖员与消费者。他在帖子中写道:“你们总是怀疑算法在暗中对付你们,但现实远比阴谋论更令人沮丧。”

 

该用户声称,自己在醉酒状态下,于图书馆使用公共 Wi-Fi 写下了这篇“长篇檄文”,详细指控公司如何利用法律漏洞,从司机报酬和消费者支出中“无声抽成”。

 

帖子详细描述了该公司如何操纵平台,损害顾客和外卖员的利益:例如,故意放慢普通订单的配送速度,人为地让优先订单看起来更快;以及收取所谓的“监管响应费”,并以此为由游说反对司机工会。

 

这篇帖子中最令人震惊的指控或许是,平台内部有一个从不对外公开的指标,用来评估骑手有多缺钱。该平台会根据司机接单的时间和频率计算他们的“绝望指数”,这也是举报人辞职的主要原因。该用户写道:

 

“如果一个司机通常晚上 10 点上线,毫不犹豫地接受所有 3 美元的垃圾订单,算法就会将他标记为‘极度渴望赚钱’。一旦被标记,系统就会故意停止向他推送高价订单。逻辑是:‘既然我们知道他渴望赚钱到愿意接 6 美元的单子,为什么还要付他 15 美元呢?’我们把高额小费留给‘兼职’司机,以此吸引他们并让他们的游戏体验更加有趣,而全职司机则被榨干最后一滴油水。”

 

这篇帖子最终获得了 8.6 万个赞,登上了 Reddit 首页,浏览量可能达到数百万。用户们向这位举报人赠送了超过 1000 枚 Reddit 金币,这些金币可以用来购买高级功能。该帖子在 X 网站上的截图浏览量超过 3600 万次

这篇帖子之所以具有高度传播力,并非偶然。在美国,外卖平台确实存在过被法律确认的不当行为。以 DoorDash 为例,该公司曾因挪用司机小费遭到起诉,最终在美国支付了 1675 万美元的和解金。这一真实案例,使公众更容易相信“平台算法系统性压榨劳动者”的叙事。

 

同时,在影视作品中,算法被具象化为一种无法逃脱的“系统命运”。在徐峥参与的相关题材电影中,外卖员被描绘为即便拼尽全力,也难以突破平台算法设定的收入上限。这类艺术表达虽非纪实,却强化了公众对“算法不可抗力”的直觉认知。

 

正是在这一现实与情绪背景下,这名 Reddit 用户的爆料被迅速视为“终于有人站出来说实话”。

 

但如今,该帖现已被发布人删除。

 

一场 AI 生成的骗局?

 

科技媒体 Platformer 的记者凯西·牛顿(Casey Newton)注意到了这篇帖子,并尝试对其真实性进行核实。

 

在取得联系后,Newton 与这名自称“举报人”的 Reddit 用户进行了约半小时的交流。

 

Newton 在报道中写道,对方与许多声称掌握内部信息的爆料者一样,最关心的问题是如何保持匿名。他表示愿意进一步分享所谓的内部材料,但同时强调,已有“其他大多数新闻机构”联系过他,并提出了他认为“风险过高”的身份核实要求,因此选择拒绝合作。

 

在交流过程中,Newton 注意到一个明显的异常:这名用户在即时通讯中的拼写和用词错误频繁出现,甚至将“information”(信息)拼写错误,而这些语言层面的失误,在其最初发布、广泛传播的 Reddit 长文中几乎不存在。

 

这一前后差异,成为 Newton 心中逐渐浮现的疑点之一。

 

Newton 向对方明确表示,自己会尽力保护其匿名性,但作为记者,仍需要对其身份进行基本核实。对此,这名用户提出,可以提供一张经过模糊处理、隐藏姓名的员工证照片作为证明,并询问“这样是否可以”。Newton 同意后,对方随即发送了一张照片。

 

这张图片看起来像是一张 Uber Eats 的员工证件,在形式上具备公司标识和员工信息布局,但其真实性仍有待进一步核验。正是从这一步开始,Newton 逐渐意识到,自己正在接触的,可能并非一名真正的内部人士,而是一场精心设计的伪装。

 

一张疑似 Uber Eats 员工证件的照片

 

此外,他还提供了一份长达 18 页的“内部文件”,称文件详细描述了公司如何利用人工智能系统,为每一位司机计算所谓的“绝望程度评分”,并据此动态调节派单、报酬和激励机制。

所谓的“内部 PDF 文件”截图

 

这些材料在形式上高度专业,包含大量技术细节与市场分析。Newton 后来在 Platformer 的文章中写道,在他多年职业生涯中,这类文件“看起来非常可信”,因为其制作成本极高,逻辑完整,很难让人相信只是为了戏弄记者。

 

“谁会花时间精心制作一份长达 18 页、关于市场动态的详细技术文件,仅仅为了骗人?”

 

Newton 写道,“谁又会费尽心思伪造证件?”

 

然而,在进一步核查过程中,Newton 逐步发现这些“证据”经不起验证。文件中的部分技术描述与 Uber Eats 实际业务逻辑存在明显不符,所谓的内部术语和流程也无法在任何可靠渠道得到印证。员工证件的格式与真实样式存在差异,其来源亦无法追溯。

 

最终,Newton 确认,这名所谓的“举报人”并非 Uber Eats 员工,其爆料内容完全是编造的故事。整套“内部材料”极有可能借助生成式人工智能工具完成——这也解释了为何文件在语言风格、结构完整度和技术细节上显得异常成熟,却缺乏真实组织内部文件应有的可核查痕迹

网友怎么看?

 

这起事件并未否认平台经济中真实存在的问题。相反,它凸显了一个更复杂的现实:当算法的不透明性已经成为普遍焦虑,当平台过往确实存在侵害劳动者权益的案例,虚假信息反而更容易披上“合理外衣”。

 

正如 Newton 在报道中所指出的那样,这次经历并非一次普通的谣言,而是一场具有技术时代特征的信任测试——它考验的不只是平台,也考验每一个信息传播者与接收者。

 

随着“Uber Eats 举报人”事件被媒体披露为造假,一部分网友并没有完全接受调查结论,相关讨论迅速在社交平台上分化。

 

在 Reddit 上,有用户对举办贴里面提到的内容深表赞同。他评论道:

 

“外卖平台他们会根据你的使用习惯来判断你对收入的渴望程度,知道你的底线,所以会给你安排你不愿意接的最糟糕的活儿。因此,越不急于赚钱的人反而能接到更好的送货任务。”

 

有用户指出,将事件简单归因为“人工智能造假”本身并不严谨。在他们看来,即便在生成式人工智能出现之前,互联网上就早已充斥着虚假信息,一个逻辑自洽、情绪饱满的长帖,并不需要依赖 AI 工具,普通人在短时间内同样可以完成。

有用户猜测,将所谓的“内部文件”定性为 AI 生成,可能只是平台方的危机公关策略之一,目的是削弱爆料内容的影响力,而非对事实本身作出独立、透明的澄清,该用户评论道:

 

“或许这是 Uber Eats 为了平息事态而采取的反举报策略。或许最初的帖子是真的,但他们这么做是为了制造足够的疑点,让我们最终都释怀。”

 

此外,还有声音对媒体调查的权威性持保留态度。一些网友表示,仅凭记者判断材料“疑似由人工智能生成”,并不足以比原始爆料更具说服力。他们指出,生成式人工智能本身也存在大量错误和不稳定性,因此仅以“AI 痕迹”为依据,仍难以完全证明图片或文件的真实来源。

 

“仅因为某个“记者”发现它是人工智能生成的,并不能比原帖更有说服力。我并非不尊重记者他们的工作,但人工智能经常出错,所以我们怎么知道这张图片真的是人工智能生成的呢?”

 

另一位网友也在质疑媒体的报道。他认为发帖者并不能确定是 AI,因为人们也经常会用 AI 来给自己想说的话润色,但润色不代表他说的话就是 AI 捏造的。

 

这类观点认为,围绕“是否由 AI 生成”的争论被过度放大,反而模糊了对内容本身真实性的判断。

 

这些分歧性的反应表明,在平台经济、算法治理与人工智能高度交织的语境下,即便面对被揭穿的虚假举报,公众对平台、媒体以及技术本身的信任裂痕依然存在,事件所引发的争议并未随着事实澄清而完全消散。

  

参考链接:

https://www.platformer.news/fake-uber-eats-whisleblower-hoax-debunked/

https://www.reddit.com/r/confession/comments/1q5gl9j/removed_by_moderator/

https://techcrunch.com/2026/01/06/a-viral-reddit-post-alleging-fraud-from-a-food-delivery-app-turned-out-to-be-ai-generated/

在  2025 年 9 月的云栖大会上,阿里巴巴集团 CEO 吴泳铭发表演讲认为实现 AGI 是个确定性事件,实现全面超越人类的 ASI 才是终局。

ASI 的概念起源,通常会追溯到统计学家 / 密码学家 I. J. Good 在 1965 年发表的文章: “Speculations Concerning the First Ultraintelligent Machine”,在性质上更接近学术随笔讨论。因此,排除所有面向资本市场的叙事后,如何准确理解 ASI ,某种程度上也决定了阿里云的去路和归处。

吴泳铭认为实现 ASI,需要满足两大核心条件:

  1. AI 能获取真实世界的全量原始数据;

  2. 实现 “Self-learning(自主学习)”,即 AI 能为自身模型搭建训练基础设施、优化数据流程与升级架构;

两个条件的“基础设施味”都很重,再结合阿里广为人知的 3800 亿投资计划,导向已经十分明显:在一段时间内,阿里云都会是企业在 AI 时代的“隐形”支撑者、赋能者和陪跑者。相比于平台注册数据、公有云 Token 调用数据……客户数据 + 基础设施投产进度,是阿里云业务发展更重要的 KPI。

据 IDC 2025 年对中国公有云基础设施市场的追踪报告:阿里云在多个行业市场份额位列第一,典型市场包括金融行业占比 43%、汽车行业占比 40%、游戏行业占比 41%。

阿里最新财报则提到,在 2026 财年第二财季,云智能集团累计收入 398.24 亿元,同比增长 34%,为历史最佳表现。但整个阿里巴巴经营利润为 53.65 亿元,同比下降 85%,主要归因于对即时零售、用户体验以及科技的投入,其中所谓科技投入,特指云 + AI  基础设施方面的支出。有信息指出,泰国、韩国、墨西哥等地新数据中心,都是阿里云在 2025 年开服。

从市场份额增长到利润下降,二者之间的差值,或许就是寻找 ASI 的“路费”。抛开资本市场不谈,普通人很难理解这份“路费”的价值与合理性,大家更乐于见到“Manus 式”的 C 端产品上岸故事,而不是一家云计算公司如何帮助成千上万家实体企业做 AI 提效。

这也使得 2025 年的阿里云极具“反差感”:一方面,它是中国云计算市场的领头羊,决计要做全球领先的人工智能服务商;另一方面,在最热闹的 AI 营销大战中,它又似乎不那么性感。

阿里云的“反差感”之一: AI 不能只靠“热闹”赚钱

从 2025 年初到 2025 年底,国内的 AI 热度实际是由有限的几个 C 端应用串联而成的,包括了:DeepSeek、元宝、千问、豆包、夸克、蚂蚁阿福等。而 AI 原生 App 的月活,在这些应用的影响下,量级也来到了数以亿计。剩下一部分公共注意力,则被具身智能包揽。

AI ToC 应用的火爆,加速了 AI 的落地。

由于 C 端火热,全民对 AI 的前景抱有期待,让企业内部“要不要上 AI”更容易达成共识。此外大量 C 端产品的出现,造成了技术价值外溢,间接推动提示词工程、Agent 工作流、评测方法、开源工具带入企业。

最后,20% 的头部 ToC 产品瓜分了互联网 80% 的流量,作为数字世界入口,它们把 AI 做成默认功能,倒逼企业被动升级对接与治理策略(尤其是权限、数据边界、知识库)。

应该说,过去一年, AI ToC 实在太热闹了,以至于在 AI 时代,市场教育经常是不需要的。

如果将这些 C 端产品的北极星指标定为“用户价值 x 增长效率 x 商业化质量”,前两者看似已经完成了,独独商业化质量成为了“拦路虎”。

北美 AI ToC 类工具,无论是 Coding 工具,还是搜索工具,一般都是付费订阅的,最低档通常为 20 美元 / 月。而国内大部分 C 端 AI 工具,通常是免费的,没有订阅收入。换句话说,“用户愿付费的核心场景”还没找到。当 C 端竞争主要集中在渠道和入口问题上,这种从“热闹”到“留存 / 付费”的落差,成为了 2025 AI ToC 最大的结构性矛盾。

AI 在 B 端的进展,某种程度上要比 C 端的进展更为顺利。至少在业务的核心评估模型上,不存在明显短板。AI ToB 领域以云模式、项目制 / 交付制为主,目标主要包括:

  1. Attach Rate(云挂载率,有多少项目最终绑定了云用量 / 云产品)

  2. Time-to-Usage(从验收到产生稳定用量的时间)

  3. Post-GoLive 90 天用量达标率(交付后 90 天,达到预期用量 / 调用量 / 活跃服务数的客户占比)

  4. 云侧 NRR(“某批上线客户”半年后 / 一年后是否扩张)

  5. 项目对云的“单位获客成本”

五大指标在 AI 的牵引下,都已经进入自增长轨道。

云计算的核心竞争标的是客群,这是阿里云的天然优势。

一方面,庞大且稳定的客群将云变成了复利生意,是将 AI 业务收入越做越厚的基础。另一方面,ToB 的关键在于需求驱动,数以百万计的客户每天反馈的问题和需求,本身就是 ToB 企业最大的护城河。有足够客群的企业,可以在工单中组装未来演进路线;没有足够客群的企业,只能靠猜和跟随。

在 2025 年 12 月底的一场小规模沟通会中,阿里云智能集团资深副总裁、公共云业务事业部总裁刘伟光表示,2025 年他拜访了 146 个客户,包括汽车主机厂、机器人、基础大模型公司、金融、手机、AI 硬件、零售行业、在线教育、物流、制造业、医疗制药、大型跨国企业、食品加工、漫剧短剧、畜牧业等,几乎覆盖了各行各业。

从拜访结果来看,企业引入 AI 改善业务流程和产品的决心,要比 C 端消费者购买一个 AI 语音助手的决心要大得多。更关键的是,企业使用 AI 具有强连续性的。

在重工业制造领域,诸如 AI 顾问、设备维修助手、智能客服、财务助手、工艺标准 AI 助手、试验在线助手这些新兴事物正在形成的过程中,价值空间巨大。

在农牧业,比如国内两家最大的龙头集团,已实现猪兽医领域大模型"猪小新"、实现猪场猪只数量识别、猪死淘鉴定、后备猪筛选、猪异常行为识别等业务场景,通过体貌图片等数据,实时获取猪群健康信息,交由 AI 系统能够在后台快速完成初步诊断。即便是新手员工,也能凭借平台系统辅助,像经验丰富的养殖专家一样快速判断猪群的健康状况,并及时处置指导,降低了对资深专家经验的依赖。

在线教育行业,习题问答、作业批改都已经是成熟场景,终端设备也从 ChatBot 过渡到学习机,甚至是智能教室这样的立体解决方案。

金融行业仍然进展最快的行业之一,在部分场景下,其技术产品的储备速度,已经不亚于国际同行。比如在车险中,从前高度依赖人工的车辆定损和理赔,今天也正尝试交由 AI 来完成。

整体来看,如果不考虑应用深度、改造程度,仅从采用率口径来看, AI 对各行业的渗透将是一个恐怖的数字。

以上共同铸就了阿里云在 2025 年叙事的第一个“反差感”:尽管诸如 Kimi 这般广为人知的模型是在阿里云上训练的,其核心定位仍然偏“幕后”和“服务”,是在推动企业把 AI 写进 KPI、写进工单、写进流程,最后写进预算。

而当 AI 开始从“有没有用过”走向“每天必须用”,衡量方式就会变化:从下载量、DAU、Token 吞吐量,走向成本结构与组织结构的重估。

阿里云的“反差感”之二:流量逻辑失效

无论是下载量、DAU,还是 Token 吞吐量,本质都是在复述流量逻辑,复述移动互联网时代的增长规则。

在 AI 时代,尤其是 ToB 领域,这显然不不合时宜。

尤其是 Token 的吞吐量,恐怕是 AI 时代集精准、模糊于一身的最矛盾指标。

一方面,Token 的吞吐量等同于模型用量;另一方面,所谓模型用量只是 MaaS 平台上的模型调用,仅为全量市场的九牛一毛,且非价值单位,不能代表模型价值。

实际上,IDC 报告里的“中国公有云调用率”,这个定语本身就存在限制:大量 AI 使用根本不是调用公有云 MaaS API ,因此不可见。

而不可见的部分至少包括:

  • 通过公共云租赁 GPU 部署模型(需要大规模部署特定领域模型的企业);

  • 采购 GPU 服务器进行开源大模型私有化部署,创建私有化推理平台内部使用(金融、制造、能源等对数据外流高度敏感行业);

  • 汽车、具身智能等端侧模型闭环(时延与隐私决定无法上云实时调用);

  • 模型蒸馏后的边缘推理(云上训练、端侧运行,消费不表现为 token);

  • 下载开源大模型在企业内部使用(诸如 AirBnb 的模式);

  • 开源衍生模型的长尾使用(下载、微调、再分发,统计口径天然缺失)。

如果只按 MaaS 平台上 Token 调用量去计量,开源生态里发生的微调、蒸馏与私域部署都会被系统性抹掉。仅 Qwen 系列模型,就已有 18 万+全球衍生模型和 全球 7 亿 + 的模型下载量——这部分‘消费’不以 Token 形式出现在公共统计数据里,却已经进入企业内部的实际生产环节。

概而言之,如果把全量的 AI token 比作一座冰山,MaaS 平台上可统计的部分只是冰山露出水面的一角而已。

我们必须重置对企业 AI 用量的认知。

来自阿里云的数据显示,截止到现在,在阿里云上调用 MaaS  API 的客户,与使用 GPU 的客户重合度竟然达到 70%,这说明中国第一批深度拥抱 AI 的客户在全方位的选择不同的方式使用 AI 技术。

所以,一批正在形成“智能预算”的企业。他们既买 Token,也买算力——他们不是在做选择题,而是在做场景分级:哪里需要公有云 Token,哪里必须结合自己数据进行后训练,哪里要端侧小模型,哪里值得自建“智能工厂”:

  • 轻量场景 用 API/MaaS:客服质检、内容生成、企业知识库问答、基础办公 Copilot、翻译审核等,强调易用、快接入、低门槛。

  • 中等复杂度场景 做后训练:把业务规则、私域知识、历史行为数据灌进模型里,用微调、RAG、强化学习把“能用”推到“稳定可用”。

  • 重资产场景 直接训 / 蒸馏 / 端侧部署:自动驾驶、具身智能、摄像头多模态理解、工业设备诊断等,强调时延、隐私、安全与闭环。

这也直接改变了对企业级 AI 用量的统计算法: “公有云用量 + 专有云用量 + 开源衍生模型用量”不等于真实用量,三者存在很大的重叠部分。

另外一个问题是,模型越先进,消耗的的高质量 Token 其实越少。所谓 Token ROI ,对于深度使用 AI 的企业而言,是核心经营概念。虽然 Token 的单价下降了,但是 Agentic AI 兴起后,一次调用产生的 Token 总数也被放大了。

因为 Token 单价会越来越便宜,所以刻意忽视企业在为更多低效 Token 而付费的事实,颇有点掩耳盗铃的味道。用“吞吐量”当成唯一指标,会把“高效智能模型”误判成“低活跃”,把“唠叨模型”误判成“高消费”。

这也是为什么阿里云不断把叙事从“Token 工厂”拉回“AI 超级工厂”——后者强调的是全链路供给能力,而不是单一化的 Token 吞吐。模型能力,是背后价值兑现的关键。

2025 年 4 月底,阿里发布了 Qwen3,成为国内首个“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可使用低算力“秒回”,对复杂问题可多步骤“深度思考”。 AIME25 测评 81.5 分,刷新开源纪录;LiveCodeBench 评测超过 70 分,超过 Grok3; ArenaHard 测评 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。

同时,  4 张 H20 即可部署 Qwen3 满血版,显存占用仅为性能相近模型的三分之一。开源版本丰富,包含 2 款 30B、235B 的 MoE 模型,以及 0.6B、1.7B、4B、8B、14B、32B 等 6 款稠密模型,每款模型均斩获同尺寸开源模型 SOTA(最佳性能)。

开源是阿里云在模型竞争力上最为关键的一步棋。这允许企业可以在不签大合同、不押单一供应商的前提下先跑通 POC,这对中国企业尤其重要。

AI 价值锚点在 AI 原生市场、中国企业级市场和全球化

毋庸置疑,AI 原生企业天然地拥抱 AI,深度使用 AI,它们是中国 AI 市场的“种子用户”。

在阿里云的观察里,除了 AI 原生企业,第一批深度拥抱 AI 的企业还往往具备以下共同特征:

  • 数据治理相对成熟:Agent 上限取决于模型与数据质量——这不是口号,而是工程现实。

  • 业务流程重且连续:用量曲线更像复利而非潮汐。

  • 对安全与合规敏感:这决定了“MaaS / 云上专有环境 VPC / 私有化部署 / 端侧闭环”会长期存在,市场不可能被一种形态吃掉。

这简直是对上云并能用好云的客户的精准侧写。

这意味着:阿里云如果要把“AI 超级工厂”的投入摊薄到足够低的边际成本,并把技术优势兑现为现金流,它必须走向更大的、付费更坚实的企业级市场。

这一轮中美 AI 竞争的胜负手,就在于谁能用 AI 提升改造各自的支柱产业,带来生产力的变革。

当前,中国 AI 的第一波市场聚焦在娱乐、陪聊等消费端场景;从美国 AI 市场发展看,SAP、Salesforce 等 SaaS 软件对 AI 大模型的调用量最大,其次是 AI 编程。

Open AI 和谷歌的报告也显示,ChatGPT 和 Gemini 的企业客户调用量远超 C 端个人用户调用量。

所以,“领头羊”阿里云想要做的是,让 AI 深入到各行各业,用 AI 提升生产效率。

与此同时,当中国的 AI 原生企业在海外遍地开花,当中国的第一、第二及第三产业客户纷纷出海,使得阿里云加速剑指全球化。

刘伟光表示, 2024–2025 ,中国企业的出海,不再只是把供应链优势搬出去,而是把 AI 能力当作产品溢价的一部分

  • 新能源车出海:没有智能化能力就很难维持差异化;

  • 家电、照明、厨具等传统硬件出海:正在被“自然语言对话 + 多模态理解”重新定义交互方式;

  • 机器人、安防、摄像头等品类出海:本质上都需要端云协同的模型能力。

对阿里云来说,这类客户天然会提出“海外部署”的硬需求:低时延、数据合规、跨区域运维、弹性供给,以及在海外可用的模型服务与训练推理能力。也因此,2025 年阿里云在泰国、韩国、墨西哥等地新建数据中心的动作,不只是“基建扩张”,更像是在给下一轮 AI 应用出海提前铺路。

当然,全球化竞争,激烈程度远超国内:

  • 模型能力只是门票:语言、coding、多模态缺一不可。

  • 工程化才决定可用性:稳定性、时延、SLA、合规、跨区域交付能力,决定企业是否敢把核心流程交给你。

  • 生态与接口决定渗透速度:当软件与工具链 MCP 化、API 化,云厂商能否把“可调用的能力”变成“可组合的系统”,决定了 Agent 落地的上限。

这也是为什么阿里云正在“把 3 万多个产品的 API 服务全面做 MCP 化开放”。海外更像一个“标准件市场”,一旦你能用标准件快速交付,就能更快形成规模。

阿里云的 2025 可以被理解为一场“前置换轨”:

  • 在国内,它用开源与超级工厂体系抓住最先动起来的 AI 企业,把 AI 从“试用”推向“连续使用”;

  • 在海外,它需要把这套能力转化为规模化商业闭环——不是为了讲更大的故事,而是为了让故事具备财务可持续性。

其核心在于:先把路修出来,再等车流出现。

“这十多年来,中国云计算市场各种概念曾层出不穷,价格战屡见不鲜,但阿里云始终在牌桌上。如果用更长的时间去穿越周期洞察未来,技术能力和技术布局的前瞻性永远是核心竞争力。”刘伟光说。

上学时,就为背单词头疼。后来工作了,也没有进一步增加词汇量的需求,所以英语一直保持着 3000 个单词的水平,聊胜于无。

最近,因为个人工作原因,订阅了一些英文邮件通讯,才深感专业词汇的不足。为了更好的阅读领域材料,我想针对性记忆一些领域常用的单词。

为了解决这个问题,我尝试了很多方法,但是发现一个问题:传统的背单词软件大部分都是为了考试而准备的,与我只想学习自己用得着的单词有所冲突。

经过多次尝试,通过 Mac 的「快捷指令」+「大模型」+「滴答清单」的组合,我终于摸索出了一套适合自己的个性化单词学习方案,分享给大家。

下面是快捷指令的分享链接,如果不想修改的话,直接输入你的 API Key 并设置快捷键之后就可以使用了。感兴趣的朋友可以继续阅读后文的思路说明。

下载链接

使用快捷指令的前提条件

上述快捷指令需要提供大模型的 API Key 和安装滴答清单。

  • 大模型:我推荐使用国产之光——DeepSeek,每百万 token 不到 3 元。只是背单词的话,估计一辈子也用不到 10 元钱,简直等于不要钱。直接在官网注册、申请就可以,具体流程不赘述。亦可自行更换为其他兼容 OpenAI API 的提供商。
  • 滴答清单:是我用的比较多的任务管理软件,功能强大、界面简洁,免费版本就能满足日常使用需求。很多任务管理工具只有简单的提醒,但滴答清单内置了 「艾宾浩斯记忆法」重复模式。在滴答清单中,你只需将单词任务设置为该模式,它就会根据科学的间隔(1 天、2 天、4 天、7 天、15 天……)自动弹出提醒。你不需要自己去规划复习进度,只需要在收到提醒时看一眼单词卡片即可。当然,如果你有其他软件同样支持快捷指令和艾宾浩斯记忆法,也可在后续指令中替换。

运行效果

整个流程分为五步:

1. 即时查词:阅读英文内容时,选中生词并按下指定的快捷键组合(默认为 Option-D)。

在浏览时,选中单词,按快捷键

2. AI 解析:系统会自动调用 DeepSeek 大模型,并在弹窗中展示该词的音标、中文含义和例句。

自动弹出自定义翻译和解释

3. 一键入库:点击「确定」后,单词及所有解析内容会自动保存至滴答清单的专用文件夹中。

加入清单成功提示

4. 重复模式:浏览完文章后,进入滴答清单对应的列表,将单词的「重复」模式改为艾宾浩斯记忆法。

重复记忆设置

5. 自动提醒:在查看滴答清单每日任务时,单词及其读音、解释就会根据设置自动出现。每天花上几分钟简单记忆,自然形成单词的长期记忆。

设计思路和制作过程

在完成申请大模型的 API Key 和创建单词清单之后,就可以进入快捷指令页面,点击「+」号,开始「新建快捷指令」。

Matrix 首页推荐 

Matrix 是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。 

文章代表作者个人观点,作者所提供的内容及视角基于其个人的资料整理,并不构成少数派官方立场的旅行建议。少数派仅对标题和排版略作修改。


引子:我的年度目标又全部实现了,你呢?

2025 年过得很快。转眼间就是 2026 年了。我在 2025 年年初写下的、有关「新年计划」的文章,居然又被少数派推荐了一次。在过去的一年里,我并没有写完并发布「之后继续讨论」的文章。这件事就一直搁置到了现在。

值得我个人庆幸的是,我从没有把「写文章」作为 2025 年的目标,也从未把它优先放在这一年的计划里。偶尔有几次,我在制定短期计划的时候,以为自己有空,就把「写完某文章」顺手塞进去,作为一个优先级很低的项目。然后,在做完一些优先级更高的事之后,我发现自己用光了时间和精力,于是(第 N 次)搁置了这些低优先级项目。——也即,虽然没做,但是无所谓。

 

2025 年 1 月 1 日,我在自己全年的 Block Year Planner 上列出了这一年三个最重要的目标,以及相应的时间节点:

  • 通过 2025 年 5 月的马伽术 Expert 1 考试
  • 通过  JLPT N3(如果有可能,甚至 N2)的考试
  • 完成至少三个桌面游戏设计专案

还有一个没有写但是默认的目标,是顺利完成我在科隆体育大学的各项学业任务。

少数派可以印一个「水獭版」出来卖 ^_^

2025 年 12 月 31 日上午,我从墙上取下这张 Planner 的时候,上述目标的完成情况如下:

  • 马伽术 Expert 1 考试顺利通过;
  • JLPT N3 已通过,N2 成绩尚未公布;
  • 完成了四个桌面游戏专案:两个已出版,第三个完成众筹,第四个即将下厂生产;
  • 本年度内的所有考试全部通过,总平均分保持在 2.0(德国 5 分制)以内。

目标就是用来实现的。计划就是用来完成的。如果在制定年度目标和计划时就已经担忧「可能无法实现」,为什么还要花时间去做这些无用功?

你那些曾经想过但没有做的新年计划,也是无关紧要、做不到也没所谓的吗?或者,你是否有过一些自认为很高优先级的计划,但是在新年开始后不久就因故一再延期、一再停滞,直至被抛诸脑后,直到年终总结时又追悔莫及?如果后一种循环在你的 2025 年(或者之前)曾经发生,而你并不想在 2026 年(及以后)重蹈覆辙,本文或许会对你有些帮助。

出发点:别把想法太当回事

在制定计划前,我们要先考虑自己的目标是什么,以及我们为什么想要实现这些目标。根据自我决定理论,一个目标可能联系到我们的三个基本需求:自主、胜任和归属。相应地,我们的目标可能是掌握、结果或过程。实现一个目标的动机可能是更加内驱的,或者更加外部的。相关的概念和讨论,可以参照我的上一篇文章。

六十年前的理论家认为,只要有强大的环境因素和自身信念的影响,个体的行为就会发生改变。但事实果真如此吗?几年前,我的一位朋友向我请教如何减肥。我看到了他的身材,确认他体检中有异常指标,听到了他有关「健康很重要」的笃定信念,也了解了他的生活习惯。于是乎,我建议他「今年可以先从戒烟开始,少吸一点也好」。

他说,这个改不了。

我说,那先戒掉酒精和含糖饮料。

他说,这也没法改。

我说,那要不然先从不熬夜开始?

他说,这更改不了。

另一次,某位符合重度肥胖标准的朋友,在微信群里非常坚决地问我「如何做运动才能减肥」。我听说了他的运动量和饭量,替他稍微估算了一下热量平衡,建议他戒掉含糖饮料、改变饮食习惯,同时每天按我建议的强度运动 30 分钟。

他听完之后,回了我六个字:这么难,放弃了。

Health Belief Model by Rosenstock (1966)

是因为计划不够详细、不够合理、不够可行吗?诸如 SMART 之类的计划制定原则,大家应该耳熟能详。但即使制定了计划,也未必就能保证执行,更无法保证效果。多年前我在高校心理咨询中心任职,接诊过颇多自称「拖延症」、渴望学会「战拖」的来访者。有些来访者在咨询中会自主制定计划,在结束咨询前又重申了计划,但下一周来访时就会表示并未有效执行。在此情况下,来访者会以各种方式找借口,例如「总之就是没有动力做事情。」但这些借口本身并不重要。无论你驳倒多少借口,他们总会找出新的借口。又或者,他们可能会直接放弃咨询——但就是打死不执行自己的计划。

「结构化拖延」的关键在结构化,不在拖延!

我举这些例子是想说明,你可以就需求、目标类型和动机水平向自己提问。你也可能就此得出非常笃定的回答,抱持非常坚决的信念。但态度上的坚决和重视,不必然意味着你可以制定计划,甚至不意味着你能够开始行动。我们嘴上所说未必代表心中所想,心中此时所想未必等于彼时所想。行为的意图和行为本身之间,可能存在着一些看不见的鸿沟。你可以选择直面人性的弱点,勇敢地和这些鸿沟战斗(并继续失败)。或者,你也可以选择离它们远一点儿。

先计算代价,再思考收获

我无意讨论「如何制定个人年度计划」的技术细节。你可以在其他一些文章里读到。但我不认为你应该从这些细节开始。如果你此刻正在思考一件自己想做的事,或者一种自己想达到的状态,并犹豫要不要将它列为年度目标或列入年度计划,我建议你先问自己另一个问题:

为了做到这件事,或者达成这种状态,我愿意失去什么?

或者更直白一些:

我愿意为此付出多大的代价?

人的时间和精力是有限的。用游戏来做类比,你只有 100 个行动点。你在一件事上投入了行动点,就没有行动点去做另一些事。你可以在网上找到各种「经验帖」「行动指南」「计划模板」「跟练」甚至「陪跑服务」……所有这一切都可以提高你的效率,减少你的行动点浪费——但不会把你需要投入的行动点减少为零。你的年度目标越多、计划越宏大,需要的行动点总数也会更多。

Through the Ages: A New Story of Civilization Game Review – Meeple Mountain
有些行动可以增加你的行动点,但这些行动本身通常要消耗大量行动点

在校学生有必修课程。职场人有日常工作。除此之外,你也需要一定的行动点用于睡眠——例如,每天 7~8 小时,或者说总数 1/3 的行动点——否则你未来一段时间的行动点将会严重减少。吃喝拉撒当然也要占用行动点。如果在此之外你还想专注地做一些事、实现一些目标,就必须做出取舍。

除了行动点,游戏里的其他资源也会制约我们的行动选择,包括但不限于金钱。一些能帮助你节约行动点、提高效率的服务或信息是付费的。许多行为(包括考试)本身也是要花钱的。钱花在一些事上,就不能花在其他地方。你是否同样做出了取舍的觉悟?

收益高 50% 的行动,消耗的金钱也许是两倍、三倍

以我 2025 年的马伽术 Expert 1 考试为例。为了参与考试,我必须前往以色列参加国际马伽术联盟(IKMF)总部的集训。为了顺利通过考试,我要自己花时间和精力进行预备训练。为了有钱去以色列,我放弃了许多其他的享乐和社交机会。为了在学期中可以请假(且不挂科),我在出行前后的几周里额外赶工、完成了许多课业任务。所有这一切都是我实际付出的代价。如果什么事都不舍得放下,什么代价都不舍得付出,你准备从哪里、投入多少行动点和其他资源,用于那些你自以为「非常重要」的年度计划呢?

 

对代价的思考,是目标设定前期很重要的一项工作(Bird et al., 2024)。在现实层面上,这是一个很好的「确定优先级(Prioritization)」的问题。结合代价(或者说,目标达成的难度)以及潜在的获益两个维度,我们可以很好地回答「是否值得」的问题。如果实现一个目标收益极高,那么只要代价没高到无法接受,都可以考虑优先列入年度计划。反之,如果一个目标带来的收益不高,但代价却相当高,或许你就不该因为心血来潮把它丢进自己的「目标清单」。

在心理层面上,思考代价是一个很好的准备工作。愿意为某个目标付出高代价,可能代表了更加内部化的动机,也代表了更坚定的承诺。但这里的高代价不等于幻想中的「不惜一切代价」。事实上,如果你在思考某个目标时,内心突然冒出「不惜一切代价」的声音,我会建议你停下来,冷静地思考这个代价的上限。超出理性范围的代价,往往代表了不合理性的诉求或冲动——例如「宁可饿死,也要掉秤 20 斤」。如果这恰好是你的情况,你也许需要接受心理咨询,甚至去医院精神科就诊。最后这句话不是玩笑。

正因如此,我建议你在思考 2026 年的年度目标并制定计划之前,先想清楚自己有多少资源、愿意付出多少代价。

首要建议:把目标变成考试

当你意识到「想」和「做」之间存在鸿沟,并愿意付出一些代价之后,我们就可以谈谈「如何设定年度目标和计划」了。如果我只能就此提出一个建议,那这条建议一定是:

把每一项年度目标都变成一次「考试」。

我们从小到大经历了无数的考试。有些人可能听到「考试」两字就已经开始焦虑。但我这里提出的考试并非一种恐吓、打垮甚至羞辱应考者的手段,而是一个规模有限的、可量化的、可以做到的、切合实际的、有明确限期的检验——嗯,你可能已经发觉了,这不就是一个符合 SMART 原则的目标吗?

没错。每一次「通过考试」都是一个 SMART 的目标。每一个 SMART 的目标也都可以转化为一个「考试」。

几乎所有的「掌握型目标」都是可以变成考试的。例如,「学好英语」是一个很笼统的、一点都不 SMART 的目标。只要你稍微把它细化,最终总可以找到一个相关的考试与之挂钩:希望在职场上做到「基本的沟通交流」,可以考托业;想要达到一个较高的语言能力水平(例如 CEFR C1),可以是雅思或托福的高分;想要具备高水平的学术读写能力,可以选择 GRE 或 GMAT。……总有一款考试适合你。也即,如果你真的有个目标叫做「学好英语」,不如把它细化为「在某个具体的英语能力考试中,达到某个具体的分数水平」。

托福TOEFL & 雅思IELTS 考試我該選擇考哪ㄧ個? 有什麽不一樣呢? - 葛瑞特留遊學
如果连标准都不敢对齐,你的「学好」会不会永远是一句空话?

为什么一定是考试呢?掌握型目标的本质就是「自身能力水平达到某种标准,或者足以完成特定任务」。好的考试总是根据一个能力标准设计的,而且总是涉及特定的任务完成或问题解决。你当然可以自己构思一套具体的能力框架,并且为自己规划一些有待完成的任务——但既然已经有相关领域的专家做了这些事,何必再自己发明一遍轮子呢?直接付钱去报名一次考试就可以了。

何况有很多考试(或者模拟考试题)其实是不要钱的!

仍然以「学好英语」为例。很多嘴上说着要「学好英语」的人,其实是不知道自己的英语水平到底有多差(或者多「好」)的。此时最有效的检测手段莫过于一次考试。找一套完整的托福模拟题,花两小时做一遍,对照阅读和听力部分的标准答案,并让人工智能给你的口语和写作评分,我们就会对自己的水平有个直观的认识。在此基础上,想想自己平均每周愿意付出多少小时学英语,一年之后想要把能力提升到托福多少分对应的水平,并报名一次考试。这样一来,你就有了一个不得不学好英语的理由,一个具体的学好英语的计划——以及,一个可能用来展示(或丢人)的结果。

考试分数是量化的掌握型目标,也是结果型目标:你考了托福 80 分,别人考了 100 分,双方的结果好坏一目了然。能够量化的结果型目标本身也可以变成一种考试。另一些结果型目标很难量化,不能转化为考试分数。但我们至少可以罗列一些质性的标准,以「通过与否(Pass or Fail)」或者评价等级(Grading)的方式将它们变成给自己的考试。所有的过程型目标(是否做了某些行为)也可以照此处理。

Image
每一项 pass or fail 在输入权重之后,也可以转化为一个考试总分

以「想要运动健身」为例。运动心理学家 Simon J. Sebire 等人(2008)将与「锻炼」有关的目标划分为以下 5 类、20 种:

1. 社会归属(Social Affiliation)目标

  • 与他人产生有意义的互动
  • 与关心我的人分享运动体验
  • 结交一些好友
  • 与他人建立密切的情感纽带

2. 形象(Image)目标

  • 让体型整体得到改善
  • 提升外貌
  • 令自己变苗条、以便更具吸引力
  • 改变身体特定部位的视觉观感

3. 健康管理(Health Management)目标

  • 提高自身对疾病的抵抗力
  • 提升自身的活力水平
  • 增进整体健康程度
  • 增强耐力和体能

4.  社会认可(Social Recognition)目标

  • 让别人觉得我很好
  • 获取别人的尊重
  • 得到别人的积极评价
  • 令别人认可我是一个「运动者」

5. 技能发展(Skill Development)目标

  • 学习/体验新的运动项目
  • 学会并练习新的技术
  • 成为某个运动领域的高手
  • 提高整体的动作技能水平

列表中的大部分项目都是可以量化的,最典型的例子是「增强耐力或体能」和「增进整体健康」。无论你的目标是三大项的总重,跑步的配速,围度的增减,体脂率和体重的下降,或是体检生化指标落入常态范围……你总可以把它量化为一个类似考试分数的数值。

另一方面「与他人建立密切的情感纽带」「令别人认可我是一个运动者」虽然是结果型目标,但较难量化。「学习新的运动项目」「与他人产生有意义的互动」则是根本无法量化的过程型目标,例如。但即使是诸如此类的目标,我们仍然可以把它变成一种考试:

  • 我在 2026 年参与了某项具体的运动(有,还是没有?)
  • 我在参与这项活动的时候,与其他人产生了有意义的互动(从 1 分到 10 分,我的主观满意度可以打几分?)
  • 别人认可我是一个运动者(有大约百分之多少的人这样认为?)
  • 我和家人建立了密切的情感纽带(从 1 分到 10 分,我对我们的关系打几分?家人呢?)
  • ……

《如何学习》(How We Learn) 的作者 Benedict Carey 认为,考试可以很有效地促进学习、帮助成长。我对此深信不疑。作为马伽术教官,我们甚至认为,人生的每一次挑战都是考试,考试就是人生的一部分。有时候我们考过了,有时候没有。有时候考不过只会伤心,有时候考不过则会丧命。如果你对「考试」这个词感到有压力,把它换成游戏中的「目标(Objective)」也并无不可——毕竟,游戏中完不成目标,也是会遭到惩罚的。

How We Learn: The Surprising Truth About When, Where, and Why It Happens :  Carey, Benedict: Amazon.de: Books

从目标到计划:习惯的养成与持续

有了「考试」的目标,结合你愿意付出的代价,我们总是可以制定出一个具体的计划。所谓计划,无非就是每周多少次、每次多长时间、每个具体的时间里做什么。视具体目标和个人情况不同,我们的计划并无统一的模板。你可以少量多次,也可以多量少次。但绝大多数考试,只要不是考「背书」也没有「重点范围」或「机经」,几乎都是不可能通过短期突击考过的。同理,你的资源总量即使固定,频次和时间跨度的分配也不可能无限压缩。

正常智力的学生,从六级 500 分到托福考试 110+,可能需要 400~500 小时的总学习时间。你可以每天花两小时复习备考,以 6~7 个月完成总体学习计划。你也可以每天学 6 小时,在三个月后应考。但你无法连续 20 天不吃不喝不睡觉应考,也不可能通过 3 天、每天 16 小时练出足够好的口语。又例如,为了增肌,你可以进行为期三个月、每周三次、每次一小时的力量训练,但不能在三天里每天力训 12 小时。这意味着你必须在一段时间里规律、连贯地投入资源并执行某些特定的行为——或者说,养成并实践一系列的习惯。

Atomic Habits: An Easy & Proven Way to Build Good Habits & Break Bad Ones :  Clear, James: Amazon.de: Books

我在这里所说的习惯(habit)遵循 Laborde 等人(2020)的定义:一种习得的刺激-反应联结,引导个体在特定情境下自动化地执行特定行为。简而言之,我们在固定的情境下总是做某件事,不断重复,直至「不假思索」,就养成了一种习惯。一旦养成习惯,我们就不需要再主观思考或者推动自己去做一件事,从而节约了心智资源。另一方面,习惯是我们行动的「基线」,能帮助我们在压力和疲劳的状态下维持同样的行为。最简单、最大众化的例子就是晚上刷牙:无论情绪多糟糕、身体多疲惫,在大多数情况下,你总是会刷过牙才睡觉。

人类养成一个习惯到底需要多少天?这个问题并无统一定论。所谓「21 天」的说法最初来自 1950 年代一位名叫 Maxwell Maltz 的整形医师:他发现在整形手术后,患者至少需要 21 天才能习惯自己新的身体形象。显然,这个规律未必适合你的新年目标,以及对应的计划。根据心理学家 Lally 等人的一项研究(2010),行为达到「自动化」程度所需的时间范围是 18~254 天。如果你的目标与健康生活方式(包括运动)相关,根据行为转变的跨理论模型(TTM),从最初行动到养成初步的习惯约需 6 个月(Prochaska et al., 1992)。

《掌控习惯(Atomic Habits)》和《微习惯(Mini Habits)》等作品给我们一个重要的启示:在初入一个新领域、第一次做某件事的时候,切忌贪大求全,最好从养成「小到不可能失败」的习惯开始。列举上面这些研究和理论,也是为了强调同样的原则。如果某个年度目标是你之前生活方式的延续和发展,它当然可以更进阶,于是计划也可以更宏大。否则,年度目标最好定小,计划也要从简。

仍然以健康为例。如果你业余跑步多年,不时游泳,目标是在 2026 年首次完成铁人三项比赛,这就无可厚非。我一点也不会担心你的计划和执行。但如果你是运动小白,拿着年度体检有脂肪肝的报告,打算 2026 年完成一次全程马拉松,那我就要建议你调整目标、缩减计划,也许从每周跑两次三公里,年度完成一个半马开始。又或者,如果你打算增肌,想练力量,却从未有过规律的身体活动,或许办张卡、每周去两次健身房都可能太过艰难——也许要从每天花三分钟、完成 20 个波比跳起步。

从小的目标和计划开始,养成小的习惯,看似「成果」不彰,但在「过程」和「掌握」方面意义非凡:一旦在一个新领域养成行为习惯,你就可以在此基础上把它扩大、加深。如果你在 2026 年用了 12 个月养成「每天三分钟运动」的习惯,你的一只脚就跨入了上图中的「维持阶段」。在 2027 年,或许你就可以把它扩大为「每周 2~3 次,每次 30 分钟,中等以上强度运动」了。

站在「meta level(类似当代汉语中的「底层逻辑」)」的角度来说,你越是习惯「养成习惯」这件事,将来要执行新的计划和目标也就越容易。你身边总有一些人,年年叫嚣着「学一门新外语」,但从未超过三分钟热度。也有另一些人,每天只刷了五分钟多邻国,两三年之后至少达到了 A1(能简单喵两句)的水平。

——我的德语就是这么学的。

找到一些办法,设置一些提醒,引入一些奖励,把你想要养成的微习惯也变成一个多邻国。

小结:「做不到也没关系」的限度在哪

2025 年 7 月,我报名了 12 月的 JLPT N2 考试。按照计划,我应该每周平均用 6 小时学习日语。但从 2025 年 11 月初开始,我把自己的学习时间降低到了接近于零,而且在考前没做任何一套模拟题。也即,我其实是以准裸考的状态走进考场的。

为什么要这样调整计划呢?我们的秋季学期课业任务很重,而且我同时有好几个桌面游戏专案要赶工。更要命的是,在 10 月初和导师讨论之后,我发现毕业论文的准备工作也提前压了下来。随着任务量和工作负担超出预期,我的行动点也严重地不够用了。11 月初的某个周末,我生了一场重病,HRV 一度降到了个位数。我的身体在提醒我:再这样下去,咱就死给你看。

 

这正是我前面提到过的「通过代价权衡收益」。JLPT N2 的成绩对我有重要意义,但重要性相比其他几件事并不算高,而且绝对不紧急。这个目标暂时超出我的支付能力。为了节约行动点,我毫不犹豫地把它精简了。

这个例子或许过于极端,但有助于说明我们在何种情况下可以调整(甚至放弃)计划:如果目标和计划对资源的需求影响到了你的基本生存和健康,占用了你正常吃饭、睡觉的时间,令你完全绷紧、没有放松的余地,你就应该考虑降低目标、削减计划。在对「年度计划」动刀子的时候,你总是应该优先砍掉那些不紧急的、重要性较低的、收益较少的、占用资源相对较多(效率不高)的事项。

游戏中总有一些行动相对更加高效,另一些略显鸡肋

常规的 80-20 原则,在目标和计划领域依然适用。某一天没有做到某件计划中的事,不必过于懊恼——下一次照常做到、避免「连续两次或多次失败」就好。你可以按周或按月定期回顾、定期复盘,看看过去这一段时间里的总体完成率:如果达到了 80% 或更高,一切如常;如果只有 60%、70%,归纳可能的原因,思考如何应对;如果连续两个或多个阶段只做了 40~50%,甚至更少,认真想想「我是不是不愿意付出这么多代价」「我是不是应该调整目标和计划」。

如你所见,我并不喜欢「计划赶不上变化」这个说法——喜欢讲这句话的人,多半是用它作为借口的。为什么要强调行为-意图的鸿沟、主张从代价开始思考、建议从小习惯开始?一个重要的考量正是「预见到一些可能的变化,并为其留出余地」。上考场前一晚不睡觉,临开考前不撒尿,考砸了怪状态差,是非常无趣的。

你不需要做对所有的题目才能通过考试。你总是应该先做完那些有把握拿分的题,把偏题、怪题和刁钻的难题留到最后解决。玩游戏也是同理:简单的、紧急的、收益高的、主线的任务在前,不重要的支线任务留到最后,不做也没关系。

人生既是考试,也是游戏。哪怕有些考试没考过,有些任务没做完,只要为主线剧情支付过代价,也就足够了。抱着游戏的心态,在 2026 年的每一场考试中尽力拿分吧——给自己一个最好的交代。


References:

  • Laborde, S., Kauschke, D., Hosang, T. J., Javelle, F., & Mosley, E. (2020). Performance habits: A framework proposal. Frontiers in Psychology, 11, Article 1815. https://doi.org/10.3389/fpsyg.2020.01815
  • Lally, P., van Jaarsveld, C. H. M., Potts, H. W. W., & Wardle, J. (2010). How are habits formed: Modelling habit formation in the real world. European Journal of Social Psychology, 40(6), 998–1009. https://doi.org/10.1002/ejsp.674
  • Matthew D. Bird, Christian Swann & Patricia C. Jackman (2024) The what, why, and how of goal setting: A review of the goal-setting process in applied sport psychology practice, Journal of Applied Sport Psychology, 36:1, 75-97, DOI: 10.1080/10413200.2023.2185699
  • Sebire, S. J., Standage, M., & Vansteenkiste, M. (2008). Development and validation of the goal content for exercise questionnaire. Journal of sport & exercise psychology, 30(4), 353–377. https://doi.org/10.1123/jsep.30.4.353
  • Prochaska, J. O., DiClemente, C. C., & Norcross, J. C. (1992). In search of how people change: Applications to addictive behaviors. American Psychologist, 47(9), 1102–1114. https://doi.org/10.1037/0003-066X.47.9.1102

    据报道,OpenAI正准备在ChatGPT中测试广告功能

    作者:
    发布时间:
    08:30 PM

    多方报道表明,OpenAI正持续推进在ChatGPT中加入广告的计划,但该实验初期将仅限于内部员工。

    记者Alex Heath报道称,OpenAI应用部门负责人Fidji Simo近期在内部会议上向员工透露,公司正在内部版ChatGPT中酝酿广告植入方案。

    这意味着OpenAI将首先面向员工测试ChatGPT的广告功能,但尚不确定何时向公众用户开放。

    目前也不明确OpenAI是否会对付费订阅用户(例如Go、Plus和Pro套餐)隐藏广告。若需推测,我认为OpenAI不太可能在Plus和Pro套餐中展示广告,但鉴于Go套餐订阅费用较低(部分市场低于5美元甚至免费),未来可能会植入有限广告。

    据称ChatGPT广告将优先展示赞助内容

    假期期间,The Information曾报道OpenAI确实在考虑多种广告形式,包括在AI回答中优先呈现赞助内容。

    报道指出:"AI模型可能会优先展示赞助内容,以确保其出现在ChatGPT的回复中。据知情人士透露,近期的广告模型设计包括在ChatGPT主回答窗口侧边栏展示赞助信息。"

    此后OpenAI也确认公司正在探索"广告方案",但未透露更多细节。OpenAI发言人对The Information表示:"随着ChatGPT能力提升和使用范围扩大,我们正在寻找持续为所有人提供更智能服务的方式。为此,我们正在探索产品中广告的呈现形式。用户与ChatGPT已建立信任关系,任何方案都将以尊重这份信任为前提进行设计。"

    OpenAI拥有可用于投放个性化广告的用户数据,但这种方式真能奏效吗?Perplexity在广告领域尚未取得显著成效。

    首页 www.people.com.cn 似乎是没证书?

    这里 http://finance.people.com.cn/是有的,但也显示是不安全?自签的?

    公用名(CN)	default.chinanetcenter.com
    组织(O)	网宿科技股份有限公司厦门分公司
    组织单位(OU)	<不是证书的一部分>
    公用名(CN)	DigiCert Basic OV G2 TLS CN RSA4096 SHA256 2022 CA1
    组织(O)	DigiCert, Inc.
    组织单位(OU)	<不是证书的一部分>
    颁发日期	2025 年 11 月 3 日星期一 08:00:00
    到期日期	2026 年 11 月 17 日星期二 07:59:59
    证书	692ac821f10acfab5654d6fa167d31b70701951ffe7da8cdeb5a29de805c9cbd
    公钥	fa89e334653e647b8b30cf56ac16e8d5f446eaee50c60c9885c5c95366417806
    
    

    花费了好几天迭代优化,自用感觉可以了,给大家分享一下,送 50 个永久激活码。

    截图:

    官网:https://subflowai.nocmt.com/

    功能:

    • 支持通知栏/悬浮窗显示
    • 支持自定义语音识别服务
    • 支持自定义文本翻译服务
    • 支持自动保存字幕文件
    • 界面清爽无广告终身可用
    • 提供 ASR 后端服务二进制文件(一键启动)

    文档地址(包含软件下载):https://www.yuque.com/u5007695/za0zmx/kaecw73nq7pmgbpr?singleDoc# 《实时字幕翻译软件配置指南》 密码:hsyu

    兑换地址:https://redeem.ym.si/IUYUSL
    兑换状态:SubFlow AI 实时字幕兑换码( 50 个) 兑换状态

    [小红书文章链接] http://xhslink.com/o/9TgssCFrIsB
    [哔哩哔哩] https://b23.tv/8TScjKT

    欢迎点赞、评论、转发,谢谢。

    另外也推荐一下我做的跨平台同步剪贴板软件 --烽翎,都快饿死了~~ :(

    项目主页: https://001sms.dev

    从运营商朋友那里淘来的临期卡,正好适合拿来接码的场景。所有号码都是实体卡/eSIM ,没有 VoIP 号码,所以能过很多有 VoIP 限制的验证。站点 1 刀起充,用多少充多少。

    已经适配了 Google, Google Voice, Claude 等常见的接码场景。


    下面每个充值码都可以为账号充值$3

    4U4YJDDATSVMN33A

    EX7SXQ9BG6DBWC9M

    UPEMR6JNFJACGZKT

    Y57TR3UMDDTHAHR9

    9JUTEFR3KVQMXWU5

    SSQ7UHP3MPYEKBNY

    BBFW8QFYYBBRXJRQ

    ET48PCF322KAECD4

    X27EEA6P24B6AC2V

    H8A7YPABNBM9XJ56

    3RUQUV6UFQPSEU58

    NTNR4HYG28FG6PD2

    W3SJN278EXGC8KZX

    6BFS5TXSNZG6DD2G

    WXGZE6C9SEB7XT4C

    N4G3EPMNRA7EQDB5

    Y7YEG5BEVMZBM7JK

    JAGMDBBFQHBJ7V3Q

    CAN2RXE9S6TAWGX7

    UB733DV343PHUN35

    Repo 地址,欢迎 Fork,Star。
    我发现新的有意思的 prompt 的或者发现目前 prompt 有优化空间都会第一时间 push 上去

    特别推荐

    用于问答的增强 prompt
    使用方法:问问题的时候直接把 prompt 贴在原 prompt 结尾即可

    插件推荐

    这个 prompt 配合这个插件使用更方便

    PromptHelper - 跨平台 AI 助手油猴脚本,支持 ChatGPT/Claude/Gemini 等 8 大平台的模板管理

    Repo 简介

    一个用于收集和整理优质 Prompt 的个人仓库。这里汇集了我自己设计的以及从互联网各处发现的有趣、实用的提示词。


    目录结构

    prompts/
    ├── 实用工具/     # 日常实用场景的提示词(健康、学术、问答等)
    ├── 越狱破限/     # 用于绕过 AI 限制的各类越狱提示词
    ├── 角色扮演/     # 角色扮演、虚拟人格相关的提示词
    ├── 写作辅助/     # 翻译、内容创作、文生图等写作相关提示词
    ├── 元提示词/     # 用于生成或优化其他 Prompt 的元提示词
    └── NSFW/         # 成人内容生成相关提示词 

    📌 转载信息
    转载时间:
    2026/1/7 19:29:57