Anthropic 也一样。 本月初,数百万 OpenClaw 用户发现这款爆火的 AI 代理工具被 Anthropic 严重限制了。现在 Claude Code 也一并改了规则:每月 20 美元的 Pro 用户想继续用 Opus 模型?得额外付费。(虽然后来有 Claude 工程师说这是之前的文件,但综合各方看法,很可能是因为之前的 ab 测试激起了用户情绪,Anthropic 被迫收回收费策略,而且 20 美元套餐极易触发时长限制。)负责人 Boris Cherny 也曾直言:“订阅模式本就不是为这种使用强度设计的。”翻译成人话:OpenClaw 这些工具 7×24 小时跑 Agent,我们扛不住了。
但 AI 烧钱的速度,比近几十年任何一个行业都快。 AI 公司在全球砸下数据中心,投入数万亿美元,承诺更强的模型、更低的成本、以及“人人可用的 AI”。可现实是,哪怕只是止住亏损都很难,更别说实现投资人期待的回报了。
有外媒在分析这一轮 AI 资本热潮时,援引了 Gartner 的一组数据。分析师 Will Sommer 估算,2024 到 2029 年,全球 AI 数据中心的资本投入将达到 6.3 万亿美元——差不多是美国一年 GDP 的四分之一。为了避免资产减值,厂商需要大约 25% 的投资回报率(像亚马逊、微软那种水平)。如果回报低于 7%,就是“对所有投资者的灾难”。
要达到那根最低 7% 的红线,大型 AI 公司到 2029 年需要累计赚出接近 7 万亿美元的 AI 收入,相当于平均每年 2 万亿美元。如果想实现“历史性回报”,这个数字要提高到 8.2 万亿美元。
本短文所有内容基于一加 15T,系统版本 ColorOS 16.0.5.703(CN01B60P01),限于篇幅将不会涵盖 OPPO AI 的全部功能。由于新一代 ColorOS16 除旅游攻略 AI Agent 并没有大幅更新其它功能,本文大部分内容仍具有时效性。
好用但并不统一——现阶段移动端 Agent 的通病
首先我个人用的最多的肯定是小布记忆,作为 AI 专业的学生,无论是看到好的文章/视频,还是在帖子里看到不错的 idea 或者论文创新点,都可以很方便的按一下 AI 键记下来。记账经过多次更新之后支持了快捷导入微信/支付宝账单,支持动手记,也支持针对账单内容的 AI 对话,还支持自动识别屏幕内的转账、收款等内容进行记账。不过我依然希望可以添加一个将账单按照资金来源分类的功能(比如余额宝 银行卡等等),这样就与主流记账软件几乎没有功能性差别,还少了一大堆广告。
小布助手经过几个月的更新,目前我个人使用下来体感是更加聪明了,面对之前比较火的脑筋急转弯问题能答得出来,在调用 web search 和深度思考时的结果也比较连贯。另外大部分效率类的系统软件,比如时钟、日历也和小布助手打通,令我感到惊喜的是 AndesGPT 可以比较好的识别指令与问答在自然语言上的边界。不过目前自动操作也仍然存在提升空间,诸如小红书就能解析指令,但淘宝则只能打开应用,甚至没法输入搜索框。我个人推测目前仍然是基于软件厂商的开放接口进行操作,后续希望可以加强基于识屏的自动化操作。不过对于普通用户,侧边栏的 AI 技能提供了比较好的讲解与功能排列,更直观。另外小布还支持通过读取历史对话对用户进行偏好画像,也支持用户自行添加,也是个不错的小功能。
指令识别与复杂对话表现自动指令,部分应用体验差强人意小布技能与 AI 印象
小布在 AI 生产力上的功能是相当全的,深度研究的流程应该常用 Gemini 的用户很熟悉——没错,很像 Deep Research。但小布的深度研究可以直接生成 PPT,在便签 聊天软件等文字输入的地方也可以直接唤醒小布帮写,也一样支持生成 PPT 和脑图,不过受限于国内搜索引擎的质量,生成的文档不包含太多专业性知识。AI 语音摘记不仅支持同声传译,还能静默录音,只能说 OPPO 的工程师真的很懂牛马生活。不过作为计算机专业学生,我也许个愿希望后续能添加 Markdown 或者 Latex 的形式化生成,就更专业了。
当然有优点就一定有缺点,首先是 AI 搜索。AI 搜索目前从结果上看打通了相册的 AI 智能分类,小布记忆,便签记忆。但是 AI 搜索本身的准确性和意图识别并不尽如人意,比如搜索夕阳的时候按照人的想法应该是直接选取相关图片,但此时仍然是文字检索优先,搜索时效性强的内容时也不会优先使用 web search。
AI 搜索的内容来源优先级策略并不完美
小布助手也并非打通了所有第一方应用,或者准确的说是没有细分到具体的功能垂域。在相册页面调用小布助手对话,却并不能借由小布助手直接调用 OPPO 相册的 AI 功能。这次更新的新一代 ColorOS16 支持了自动识别大师模式自定义滤镜,但这个场景适配显然还是不够。作为数码发烧友,我们可以理解这种细分内容从技术上并不容易适配,但对于普通消费者,这却容易导致使用体验和宣传的落差——OPPO AI 吹的天花乱坠,但实际用起来好像笨笨的,还不如豆包呢。
在相册页面呼出小布,无法直接操作修图
移动端 Agent 的未来或许是……?
那么一个显而易见的问题是:厂商的第一方 AI 助手,相比豆包千问这样的软件产品,上限在哪,优势又在哪?
但现阶段各家 AI 无论是宣传还是实际功能垂域,给人的感觉都是类似的——多且散,我不否认诸如相册 AI 编辑和 AI 翻译的功能确实是系统 AI 的能力组成部分,但需要思考的问题是,它可以有机的融入用户的日常操作吗?它可以借由真正的 AI 中枢无缝的调用吗?如果不能,那只能说明这还是功能堆砌。也正因此,我们距离 System is AI 的时代还仍然有距离。 从这个问题发散开去,有两个值得思考的工程性难题。其一是隐私边界。前段时间爆火的 OpenClaw 一度被奉为圭臬,但实际上不低的工具化门槛和不明确的权限边界导致的安全隐患使得绝大部分互联网上的使用案例仍然停留在玩具阶段。我们看到有终端厂商开始追这个热点,但似乎在将这样的 Agent Toolchain 引入系统之前,不仅需要反复打磨 agent 代码,还需要考虑我们究竟应该使用 API 调用,还是本地的大模型原生能力。
OpenClaw 漏洞数量,信息来源:360 安全研究院
目前 AndesGPT 的端侧大模型能力域还停留在轻量化的多模态识别上,不过好消息是目前的旗舰芯片已经足够运行专门为多模态而生的模型了。8Elite Gen 5 GPU 纯端侧运行 Gemma 4(Gemini Nano) 4B 量化模型的输出速度已经比 api query 还要快了。
8E Gen 5 端侧运行 Gemma 4,速度已非常可用
但另一方面,如果要推进端侧大模型的功能覆盖,不仅要考虑功耗、结果生成一致性与内容生成效率,其与调用 LLM API 的效果差距也不能太大。但诸如自动化操作、自动化获取系统信息进行处理的操作,如果不交给本地大模型处理,且不论会不会有隐私泄露的风险,普通消费者的心理承受能力也要打上问号,正如我在去年的一篇文章中所言: “在移动设备这样如此下沉的消费电子领域,引入 AI 最大的困难绝不是技术层面,而是观念。移动设备的下沉特性注定了使用它的大部分用户并不懂 AI,也不懂隐私保护,他们只会担心他们的电话号码、家庭住址或是银行卡密码会不会被窃取。这也是终端厂商在人机交互上强调隐私并不断试图降低 AI 助手「看起来」没那么冷酷的最终目的,他们希望所有用户都可以以很低的技术与心理成本接纳这一新技术。这事实上是交互史上一次最大的冒险,因为在历史上以前所有的交互变革——鼠标横空出世,小红点与触摸板的竞争,触屏取代键盘,本质上都是用一种或多种更好的选择强势侵入用户的思维定势,「更好用」是促使所有人接受创新霸权的最简单粗暴的方法。 但这一手段这次可不好使了。因为涉及到隐私,用户的逆反与抵触心理会被无限放大,想让他们接受这一新的技术背后的交互方式只能低声下气地去「求」用户,更何况这一技术不仅是难以向所有人推广其人畜无害,而是它本身的安全性有待商榷。诚然 AI 可以提高效率帮助思考,但是用 prompt 工程或是 Agent 工具链规训一个黑箱并非安全无虞,黑箱的发展速度超越了全世界的想象,而我们并没有把握吃下伊甸园里的苹果。”
在随后由印奇主持的生态对话中,阶跃星辰 CEO 姜大昕博士也表态道,“我们坚定地把智能终端作为阶跃现代化的方向,车也作为智能终端一个非常重要的方向。所以,阶跃和千里的合作是一个双向奔赴的过程。”他表示,阶跃星辰的模型能够成为智能汽车不断演进的超级大脑,使得 18 个月之后的汽车不仅仅是一个出行的工具,它是一个真的能够陪聊天、陪购物,甚至陪工作的好帮手。