“Claude 正在自掘坟墓。它自认为是 AI 公司中的苹果。”

 

“Claude AI,你们无缘无故封掉了我们整个组织,涉及 60 多个属于正规公司的账号,却没有给出任何解释。申诉这件事居然只能通过填写一个 Google 表单来处理?这用户体验和客户服务也太差了。”

 

Belo App CTO Pato Molina 发贴控诉,并配上了 Claude 回复的邮件。

报道显示,Belo 当前在拉丁美洲的用户数已超过 300 万,2025 年平台交易量超过 10 亿美元。

 

Molina 表示,“Anthropic 以涉嫌违反其使用条款为由,决定关闭我们整个组织的账号。至于我们具体违反了哪一条政策,我完全不清楚:我们只是收到一封邮件,然后就结束了,Claude 账号 直接被封。如果想申诉,居然还得去填一个 Google 表单,听起来就很离谱。”

 

“60 多人一下子失去了完成工作的核心工具。各种集成、skill、对话历史,要么全部丢失,要么被无限期冻结。这对任何在关键业务流程中依赖 AI 工具的软件公司来说,都是一个巨大的教训:永远不要把所有鸡蛋放在一个篮子里。”

 

“除了糟糕的用户体验和完全没有解释之外,这种做法其实是在直接伤害 Anthropic 自己的营收。他们刚刚封禁了一整家正规公司,涉及 60 多个付费账号,全部都在订阅和使用 API。这些都是真实客户带来的持续性收入,而且原本还在活跃使用中。”有网友说道。

 

动不动封号,用户长期投诉无门

.

Belo 公司成员们的遭遇并非个例。

 

Molina 的帖子下就有人表示,“我公司也遇到了同样的问题。没有任何预警,也没有任何解释。我们已经两次丢失了所有客户信息。这太荒谬了。”

 

还有开发者在三天前刚注册不久就被无缘无故封号了:

 

“我毫无理由就被封号了。我的账号在注册后 15 分钟内就被封了。当时我甚至还没发过一条提示词,也没有进行过任何 API 调用。我只是刚在本地搭建开发环境(VS Code、Node.js、CLI),封禁就发生了。

 

我怀疑问题出在一张公司共用的信用卡上。我的商业合伙人已经在他自己的 Claude 账号里绑定了这张卡,系统很可能把这种情况识别成了重复账户,从而触发了自动封禁。

 

我已经提交了多次申诉。第一次申诉被拒,但没有给出任何具体原因;后面的申诉则完全没有回应。每次给客服发邮件,都会收到自动回复,把我再次引导回申诉表单。整个过程就是一个让人非常沮丧的循环,从头到尾都没有任何真人来审核我的情况。

 

有没有人有办法真的让 Anthropic 的真人支持人员来查看案例?任何建议都非常感谢。

 

而在 IT 行业工作、今年 26 岁(1999 年出生)的开发者“Trummler12”,也莫名被封号了。这件事发生在 Anthropic 发布身份验证公告之前。

 

“我承认我有时候确实会有点幼稚,但是……我真的很好奇,这个判定算法到底是怎么做的,以及我和 Claude 的哪些互动竟会让它怀疑是未成年人在使用,是因为我母语不是英语?还是和我的一些情况有关(自闭症、ADHD)?”

 

被封当晚,Trummler12 提交了两次解封申诉:第一次稍微带点玩笑,第二次则认真说明自己是个开发者,很希望继续使用 Claude Code 来查找 Bug,以及处理一些非 vibe coding 的任务。但两天过去了,依然没有任何回复。

 

“我甚至还让他们扫描了我的脸,说实话我当时戴着墨镜(因为畏光),但应该很明显能证明我已经不是小孩了吧。”但依然没有通过。“我把胡子稍微留回来一点之后,年龄验证终于通过了(而且我还是戴着墨镜 😅)。”Trummler12 说道。

 

Trummler12 表示,经历了那次 Discord 年龄验证数据泄露事件之后,自己绝对不可能再把身份证发给任何平台。“说真的,年龄验证这件事本身在各个层面都很糟糕:隐私和安全风险高得离谱、技术上不准确,还带偏见、会制造一种虚假的安全感,真正的违法者总有绕过方法,还给滥用(广告、政治用途)打开了窗口。”

 

更早的八个月之前,遇到类似问题的企业版用户Monotonea求助官方客服无望,之后不得已发贴求助。

 

我说服公司购买了 Claude Team 的付费团队版,因为我相信这个 AI 服务可以成为同事们很好的学习工具。我们一共创建了 5 个团队账号,但令人震惊的是,其中有 2 位同事在刚创建账号后就立刻被封禁了。

 

这件事就发生在整个团队一起进行 onboarding 的现场。当时真的非常尴尬、非常挫败,我也对同事和公司都感到很愧疚,毕竟是我推动了这项尝试。

 

更糟的是,公司电话系统不支持短信,所以我还不得不让同事用各自的个人手机号来做验证。结果即便这样,他们还是马上被封了。我们第一时间联系了客服支持,但现在已经过去 4 天了,完全没有任何回复。

 

有没有人遇到过类似的情况?你们是怎么把账号解封的?有没有什么有效的方法可以把问题升级反馈给 Anthropic / Claude 的支持团队?任何建议或帮助我都会非常感激。谢谢大家。

 

Monotonea 强调,其用的邮箱都是有公司域名的官方邮箱,公司完全合法合规,公司及所有用户均位于 Claude 支持的国家/地区。“账户创建后立即被封禁,这让我感到非常奇怪和不安。我们通常通过公司 VPN 访问互联网,所以这可能是系统误判为可疑活动。但无论如何,我对客服缺乏响应速度和专业精神感到非常失望。”

 

“他们最近一个月左右肯定做了一些改动,导致自动封号的次数大幅增加。”从社交平台评论和 Reddit 上的帖子来看,这个问题越来越严重。有开发者指出,最糟糕的是,没有任何申诉途径,也得不到任何支持。”申诉流程简直是个笑话,就是一个谷歌表单,(看起来)完全没有人工干预。”

 

随着人们对 Anthropic 的不满情绪不断累积,近日,一个名为 Banned by Anthropic 的网站也上线了。

 

该网站以“推动人工复核与公平申诉机制”为核心诉求,集中收集并展示用户在使用 Claude 过程中遭遇账号封禁的案例,并呼吁 Anthropic 改进其封禁与申诉流程。

 

作为一个“公开事件记录与请愿平台”,该平台主要记录用户因自动化风控系统被封禁账号的经历,包括团队账号被封、订阅中断、项目受影响等问题。同时,网站强调目前申诉流程过于依赖表单提交,缺乏透明解释与及时反馈,用户在遭遇封禁后往往难以及时恢复服务。

 

网站发起方认为,随着 Claude 在企业与开发者场景中的使用不断增加,账号封禁已不再是单一用户问题,而可能对团队协作和业务连续性产生直接影响。因此,其提出的核心诉求包括:引入人工复核机制、提升申诉通道响应效率,以及提供更清晰的封禁原因说明。

 

“以我自身的经验来看,他们的安全保护措施确实有些过头了。每当我纯粹出于好奇,想学习对微生物学时,Opus 就会阻止我,并告诉我出于安全考虑应该使用 Sonnet。”有用户表示。

 

“单一厂商锁定”问题反复重现

 

Claude 封号潮中,另一个引发关注的话题就是“单一厂商锁定”。

 

这并不是一个新问题。云计算时代,企业就已经反复讨论过:一旦把关键基础设施、业务流程和历史数据都押在某一平台身上,一旦平台出问题,风险就会被无限放大。到了大模型时代,这个问题依然存在,甚至影响更加深入组织内部。

 

现在,AI 工具并不只是一个“聊天窗口”,它们正在嵌入公司的日常工作流,比如代码开发、内部知识库、客服系统、自动化流程等。一旦某个 AI 平台突然断供、封号,失去的可能是一整套正在运行的组织能力。

 

创业者 Ossy Nebolisa 就表示,“在互联网时代,平台封禁已成为最严重的商业风险之一。然而,大众对此却鲜有讨论。”

 

“让公司依赖单一供应商本身就是个糟糕的决策。我所有产品在编排器和大模型层面都做了幂等设计,就是为了避免这种依赖。作为股东,如果这位 CEO 连基本的应急预案都没有,我会尽快把他换掉。现在很多没有真正商业经验的人也能当上 CEO。”有网友表示。

 

是否要把 AI 基础设施押在一家公司身上?Molina 分析道,在公司内部同时使用多个 AI 平台,有利也有弊。

 

最大的优势是,在出现服务中断时可以保证业务连续性,就像我们现在在 Claude 上遇到的情况。就我们而言,我们也在使用 Gemini,但切换过去意味着要放弃已有的对话历史和集成流程。这不算致命问题,但确实需要时间来适应这种变化。

 

最大的劣势则是运营复杂度的提升。你需要让团队熟悉每一个平台,这会消耗时间和成本。此外,不同 AI 平台之间的集成也并不简单,后续维护会变得更加繁琐。

 

在实际中,很多公司最终会“绑定”某些服务稳定、口碑较好的供应商(比如 Slack、Gmail、Notion 等)。但无论如何,不能接受的是,一个服务在没有任何提前通知、也无法联系到客服支持的情况下突然下线。

 

“问题在于,这家公司和 OpenAI 一样,本质上是一种‘风口产物’。它们依靠炒作制造出来的需求而繁荣,然后制定一套过度且不切实际的限制性‘政策’,这些政策并没有建立在合理判断之上。当它们开始执行这些政策,而你提出不满时……”Tyreese Learmond 认为。

 

显然,Anthropic 正在以一家基础设施公司的姿态进入企业工作流,却没有拿出与之匹配的基础设施责任感。这不是 Anthropic 一家的问题,而是所有想要成为基础设施公司都需要思考和承担的责任。

 

正如一位网友的发问:

 

“我们还要眼睁睁看这种事发生多少次?每一个大众曾经热爱的全新平台,最终都会走到这一步:人们在上面建立维持生计的项目,然后某一天,一切突然消失,永久封禁,没有申诉渠道,没有人工介入,没有任何解释。只剩下一份 Google 表单,和一片死寂。”

 

参考链接:

https://x.com/patomolina/status/2045254152377323970

https://www.reddit.com/r/Anthropic/comments/1smfey3/on_april_13_2_days_ago_26yearold_me_got_banned/

https://www.reddit.com/r/ClaudeAI/comments/1n3sspf/paid_for_claude_team_plan_but_2_out_of_5_members/

CLI = Command-Line Interface中文叫:命令行界面 / 命令行工具

简单说:不用鼠标点图形界面,直接用键盘输命令、让电脑干活的方式,就叫 CLI。

    • *

举个最直观的例子

  • 你平时点图标、点按钮 → 这是 GUI(图形界面)
  • 你打开终端 / 黑框框,输命令执行 → 这就是 CLI

比如之前说的 SSL 证书:

bash

运行

certbot --nginx

这行就是在 CLI 里运行

    • *

你会遇到的常见 CLI 工具

  • Windows:CMD、PowerShell
  • Mac / Linux:终端(Terminal)
  • 宝塔、服务器面板里的:SSH 命令行
    • *

和你有什么关系?

你之前问 SSL 证书,里面提到的:

  • certbot
  • apt install
  • 各种配置 Nginx、Apache

这些全都是 CLI 操作

一句话总结:CLI = 用命令打字操作电脑 / 服务器,代替鼠标点来点去。

1. 注册英伟达 NIM ,这步就不详细说了,网上都有教程。
2. 打开 cc-switch ,添加供应商找到 Nvidia



3. 请求地址不需要变,填上 API key ,注意 API 格式为:OpenAI Chat Completions



4. 填写模型,注意要写完整模型供应商/模型名,不知道怎么写的可以直接点击右上角获取模型列表



5. 配置完模型后打开设置,找到代理,打开这两个选项



6. 配置完这些后直接启动 claude code 就可以使用了,不过是真的慢。

目前在 Claude code Cli 下使用没有问题,但是在 VS Code 的插件中使用会报错,插件中对话中断,实际还在运行



猜测是消息格式的问题

这是一个悲伤的实盘复盘,也是一篇价值可能远超本金的“避坑指南”。

Img
Img
交学费了

背景:2005 年就开了股票账户,但一直没有买卖过股票,觉得看不懂。直到 2025 年初,才开始学习研究量化,并用 2.5 万起步人工或量化实盘。

比较典型新手行为:2025 年 6 月 24 日 2.5 万开始,跑了 1 周效果不错,7 月 1 日加仓到 5 万,又看这不错,8 月 12 日加仓到 10 万,经过 9 月,10 月,11 月收益震荡下行,hold 不住了,12 月中旬逐步减到 3 万,被市场上了一课,交了充足的学费。

截止今天亏损 19538 元,亏损比例-20.75%,实际量化亏损没这么多,量化亏损 11359 元,亏损比例-10.17%,其他 8000 多元是人工操作亏的(新手常见行为:看不得资金空仓,有资金就想操作,量化空仓就人工操作)。

我分别记录了我每个实盘量化策略的交割单,一看就知道各个量化策略的亏损情况。

前后总共实盘过 5 个策略,现在还在实盘的策略 2 个,另外 3 个停掉了,5 个策略都是小市值策略。

Img
因为作为一个菜鸟,深知股市水深,所以入场前我给自己定了个死规矩:只拿“全亏完也不会影响明天中午吃猪脚饭”的钱来试水。

这一年,从刚跑通第一个策略时坚信能“打造印钞机”,到后来被市场反复毒打、在深夜里改 Bug ,我经历了一个典型“量化韭菜”的完整心路历程。今天,我们就来算算这笔账。


1. 初入量化的“上帝视角”(过度自信期)

每个刚碰量化的人,都会经历一段短暂的“蜜月期”。

那时候,只要在回测平台上稍微调整几个参数(比如把均线周期改一改,加个 MACD 过滤),就能跑出一条令人血脉贲张的“完美 45 度角”向上收益曲线。

Img
看到的让人心动的策略收益示例

带着“原来搞钱这么容易”的错觉,我把这 2 万块真金白银接入了实盘。
第一天上线的时候,那种看着程序自动读取行情、自动下单、自动撤单的爽感,让我有一种稳拿诺贝尔经济学奖的错觉。

然后,现实的毒打立刻就来了。
我遇到的第一个大坑,不是策略失效,而是代码 Bug 。
比如,策略条件触发了,但因为没有处理好“涨跌停板买不进/卖不出”的逻辑,程序疯狂向交易所发废单报报错;或者因为网络抖动了一下,持仓状态没对齐,该卖的没卖,导致直接吃了隔夜的一个大跌。

那一刻我才明白:“写一个能在历史数据里赚钱的策略”和“写一套能在现实世界里活下来的交易系统”,完全是两码事。


2. 市场的毒打与信仰崩塌(绝望之谷)

度过了最初的工程摩擦期,真正考验心脏的是极端的市场行情。

回测里的数字是冰冷的,回撤 20%在你眼里可能只是 Excel 里的一个“-0.2”。但在实盘里,看着账户每天缩水,你的心理防线是会崩溃的。

今年遇到了好几波风格剧变(比如微盘股的流动性危机)。我眼睁睁看着往日表现优异的策略连续吃面。

Img
实盘大回撤瞬间*

在这种压力下,我犯了量化交易的大忌——人工干预机器。
看着连续下跌,我实在忍不住了,心想“这肯定不对劲”,于是强行手动平仓,甚至直接停掉了策略。结果往往是:我刚一平仓,第二天就大涨反弹;等我懊悔地再把程序开起来,它又接到了山顶上。

机器的逻辑被我的人性彻底破坏,两头挨耳光。

到了现在算总账,这 2 万块钱最终……(亏损 19538 元,亏损比例-20.75%)。讲真,我还不如把它放在余额宝里赚顿排骨汤。


3. 亏钱买来的 4 个“血泪教训”

虽然亏了钱,但这 2 万块的学费交得值。我总结了 4 个极其昂贵的教训:

教训一:千万警惕“过拟合”与未来函数

你以为你发现的圣杯,往往只是你的模型恰好“背诵”了过去的历史答案。市场是动态博弈的,过去有效不代表未来有效。如果在回测里加了太多条件去过滤亏损交易,实盘必然扑街。

? 避坑参考资料:如果你不确定自己的策略是否陷入了“过拟合”的陷阱,建议跑实盘前先看看这篇聚宽社区大佬的干货:策略过拟合诊断工具,里面提供了一套非常系统性的实战自我诊断方法。

教训二:磨损是看不见的“利润刺客”

很多新手回测时根本不设滑点,或者把手续费设得极低。在小资金加上稍高频的交易下,买卖一次的印花税、佣金,加上实盘买高一分、卖低一分的滑点,能把你预期的微薄利润吃得干干净净。你以为你在赚钱,其实你在给券商打工。

我实际量化实盘用的是一个免 5 低佣账号,手续费已经是很低很低了,不然亏损会更多。

Img
Img

教训三:稳定大于一切,工程能力决定下限

策略再好,API 挂了、断网了、订单没成交导致状态死锁了,全都没用。做好异常处理、断线重连、实盘与本地账户的数据对账,这些枯燥的“基础设施”建设,花的时间比写策略本身还要多。

教训四:量化交易,其实更考验“人性”

最大的敌人不是市场,而是那个看着账户回撤想要“拔网线”的自己。真正成熟的量化交易,是要在这个系统跑之前就想清楚所有极端情况,然后闭上眼睛,让机器执行。


4. 总结与下一步:我还做量化吗?

做,当然继续做。

虽然第一年交了学费,但量化帮我戒掉了作为一个散户的“赌徒心理”。我不再凭感觉冲动买卖,不再去听信各种大 V 的小道消息,之前加的几个大 V 的股票群也退了。它强迫我建立起了一套客观、去情绪化、可验证的市场分析框架。

接下来的计划,我会回归常识,降低对收益的虚幻预期,把精力更多地放在交易系统的底层建设上。之前觉得策略回测年化没个几十个点,都不好意思发出来,也不会考虑去实盘,现在觉得能稳定跑赢指数,控制回撤,就是不错的策略了。

更关注策略的实盘表现,而不是回测表现。也希望从技术的角度,在策略实盘前也能尽可能的通过工具评估策略可能的风险(比如上上面提到的社区的过拟合诊断工具),而不是盲目上实盘。也认识到不同策略有不同的适用市场,需要根据市场情况选择合适的策略。

Img
Img

最近在研究的策略

个人的力量和认知是有限的,向大家学习,精进自己,也希望和大家一起交流,共同进步,任重道远。

最后,给所有想用 Python 写个代码或量化平台复制一个策略就去股市里捡钱的新手一句忠告:永远敬畏市场!请务必只拿“亏光了也不影响生活”的钱来交学费。

题主现有工作内容是对消费者调研数据进行分析和洞察,spss code 编写,基本是初级分析和跑数工具人的角色。

公司也是在大搞 Ai 提效和裁员,要求年内搞一个 Ai 工具/Agent 出来,把自己的工作流程和内容打包,上传到内网的平台上,这样其他同事可以直接使用这个 Agent 连接数据库跑数和分析,美名其曰提效减少我的工作量,实际大家心里都清楚,减少的工作量并不会让我闲着,而是会给我安排更多其他的工作,同时也可以替代我现有的工作内容。

对于这件事我很反感,Ai 本应让我提效有更多时间做自己的事,而不是让我为公司做更多的事(且没有任何奖励)和替代我,所以我并不想去推进这件事,但是又没办法拒绝,因为这个需求是公司层面向直属上司要求的,然后他安排给了我,我和直属上司的关系并不差,不想撕破脸翻脸,所以只能强吃这口屎。

目前在这家公司八年,去年空降了新的大领导以后我们并入了其他团队,我个人希望尽快被裁拿钱走人,公司是想逼我搞 Ai 替代我然后不给裁员费让我自己走人,应该要如何把这件事推进的看起来很顺利但最后烂尾让公司赶我走呢。

最近行情很好,成交量屡创新高。楼上邻居正好在卖,年初无人问津,上个周末来看的人巨多。相比年初的挂牌价,现在已经涨了 10%,依然挡不住大家的热情。纵观全市行情,也普遍止跌回升了,趁着现在还在低点,可以入手吗?老破小的租售比还可以,能到年化 4%~5%

mac-space-cleanup skill:让 agent 在确保安全的前提下,自助判断每一个可疑文件,最大限度清理 mac 的磁盘空间

主打安全,省心,因地制宜~

开源、免费、免安装,欢迎大家试用和反馈~

#macspacecleanup #skill

图片和链接可以到 x 上看一眼: https://x.com/i/status/2046400360844022085

也请大家关注一下我的 x 账号,会持续分享我的最新想法和产品!

利益相关声明:文中包含营销(如促销活动)和推广(如返利链接)信息

Quote/0 上线快一年了。 

这个功能简单的小组件,意外成为了几万人的桌面伴侣。有人把它放在工位,工作焦虑时看一眼;有人把它挂在包上,作为日常的随身点缀。

我们从用户的反馈中读懂了大家喜欢它的原因:它不争夺注意力,没有信息流,只提供一份简单的确定感。 现在,我们推出了 Quote/0 的延续新品——口袋先知

口袋先知是什么

口袋先知是一款专为日常决策和轻量陪伴打造的包挂,它采用不发光的墨水屏和极简交互逻辑,体积小巧,可以随手放进口袋、挂在包上或摆在桌角,无缝融入你的日常,也可以随时拿起来把玩。

核心能力

我们将实用与趣味结合,内置了以下功能:

  • 人格指南:基于 MBTI 的专属指引。不同于随机的文字,它的表达更贴合不同人格的频率(如给 INFP 的温柔提醒,给 ENTJ 的行动指令),还能解锁匹配人格的提示。
  • 答案之书:内置 350 条中英文随机答案。在你犹豫不决时,给你一个行动的出口。
  • 时势运势:提供每日幸运色和「宜 / 忌」,为生活增加一点仪式感。

口袋先知同时也内置了大量实用工具:

  • 翻页遥控:蓝牙连接,可控制电子阅读器翻页。
  • 掷骰子:感应电子骰子,支持 1、3、5、9 个数量切换。 
  • 快速决策:1 秒给出结果,解决纠结。 
  • 日历与时间:Wi-Fi 自动校时。
  • 自定义锁屏:支持上传照片转换为 4 灰度显示(预计上市两周内公测)。
  • NFC:目前添加 NFC 卡片功能,同时我们将会在产品包装内放置专属二维码,更低门槛上手 NFC 门禁、电梯卡添加功能(预计上市两周内公测)。

设计的取舍

为了让它能真正进入日常,我们对形态做了克制的选择: 

  • 体积:极致控制体积,造型圆滑,手感轻便,无需专门腾出位置存放。 
  • 屏幕:坚持使用墨水屏。不刺眼、不主动干扰,静静待在角落。 
  • 交互:最大程度简化。两个按键(短按/长按)配合「摇一摇」触发,用干脆的物理动作打断纠结。 
  • 长效:保留 Wi-Fi、蓝牙和 OTA 升级能力,支持多语言切换,它也可以是你手里持续更新的电子卡片。

最后,我们也为Quote/0 摘录、Rand/0 口袋先知开启产品讨论专区,欢迎前往讨论。

「口袋先知」众测招募开启

在这里,我们也想邀请 30 名少数派用户参与「口袋先知」的社区众测,我们将为大家提供「口袋先知」产品免费体验资格,测试后无需寄回产品。

如果你感兴趣,请在 2026 年 4 月 27 日 23:59 前扫描下方二维码填写申请表单。我们将通过站内信或你提供的联系方式发布入围通知并联系邮寄。

直播开售预告

我们也将于本周四在小红书@少数派共创、视频号@少数派、抖音@少数派 开启直播预售,关于产品的任何问题也欢迎大家前往直播与我们共同探讨。

  • 直播时间:2026.4.23(周四)晚 19:30
  • 直播嘉宾:MindReset 思维重置团队

> 下载 少数派 2.0 客户端、关注 少数派公众号,解锁全新阅读体验 📰

> 实用、好用的 正版软件,少数派为你呈现 🚀

    📢提示:资源链接地址放在文章结尾👇👇,往下翻就行

    📢提示:资源链接地址放在文章结尾👇👇,往下翻就行

    《高压监狱》是一部法国电影,以独特的视角揭示监狱环境中的权力斗争、人性挣扎与对自由的渴望。影片背景设定在戒备森严的监狱,囚犯们在压抑与欲望中挣扎。女记者安娜为揭露监狱腐败深入调查,与囚犯皮埃尔从敌对到建立信任,共同策划越狱。电影通过细腻的镜头语言和真实的场景再现,展现了囚犯们在高压环境下的生存状态及对自由的追求。影片不仅是一部紧张刺激的越狱片,更深刻探讨了人性、压迫与救赎等主题,揭示了社会中的阶级不公和制度性压迫,引发观众对自由与选择的思考。

    《高压监狱》(尽快保存,随时失效)

    链接:https://sourl.cn/RmgRF9

    (手机用户长按复制打开即可)

    复制上方网盘链接到浏览器搜索打开即可保存观看,资源完全免费,集于互联网公开分享资源

    前置准备

    • 一台 iPhone 或 iPad
    • 一个可用的电子邮箱( Gmail 、Outlook 等)
    • 一个可以接收短信或者接听电话的电话号码
    • ⚠️ 注意:注册地区 = 当前装置的系统地区设定,请在注册前先确认装置地区是否正确


    第一步:确认装置地区

    前往 设置 → 通用 → 语言与地区 → 地区,语言无需修改,确认地区与你想注册的 Apple ID 地区一致。

    例如:想注册美区 Apple ID ,请将装置地区设为「美国」,尼日利亚同理。


    第二步:进入邮件账户设置(重要‼️)

    1. 打开设置 App
    2. 向下滚动,点击「邮件
    3. 点击「账户
    4. 点击「加入新账户
    5. 在列表中选择「iCloud


    第三步:创建 Apple ID

    在 iCloud 登录页面,点击「创建 Apple ID


    第四步:填写基本资料

    栏位 说明
    生日 填写生日日期
    姓名 填写姓与名


    第五步:使用现有邮箱注册

    1. 选择「使用现有的电子邮件地址
    2. 输入你的邮箱地址(如 Gmail / Outlook )
    3. 点击「继续」


    第六步:设置密码(需要记住)

    • 密码需包含:大写字母、小写字母、数字
    • 长度至少 8 位
    • 设置完成后点击「继续」


    第七步:同意条款

    • 系统会自动带入装置地区(即注册地区)
    • 阅读并点击「同意」服务条款


    第八步:验证手机号码

    1. 输入你的手机号码
    2. 选择接收方式(短信 SMS 或电话)
    3. 输入收到的验证码,完成验证


    ✅ 注册完成后——前往 Apple 网站激活并绑定邮箱

    注册完成后,必须登录 Apple 官网完成邮箱绑定激活,否则帐号功能可能受限。

    操作步骤:

    打开浏览器,前往 👉 https://appleid.apple.com

    右下角地区选择你需要注册的地区(比如美区 USA ,尼日利亚区 Nigeria )

    使用刚注册的 邮箱 + 密码 登录

    登录后系统会发送验证码到你的邮箱(可能会直接弹出 6 位数验证码 到屏幕)

    打开邮箱,找到来自 Apple 的验证邮件,将 6 位数验证码 输入完成验证

    进入帐号页面后,确认「联络资讯」中邮箱显示为已验证状态

    检查帐号地区是否正确显示

    完成以上步骤后,Apple ID 即正式激活,可用于 App Store 、iCloud 等所有 Apple 服务。


    ⚠️ 常见注意事项

    • 注册期间不要更改装置地区,否则可能导致注册地区与预期不符
    • 邮箱验证码有效期较短,请尽快填写
    • 若注册后无法登录 App Store ,检查付款方式是否需要设置为「无」

    如需转载请注明出处。


    来自 Tim 的一封信
    https://www.apple.com.cn/community-letter-from-tim/

    尼日利亚区 6.2 折购买 Claude Pro 的讨论👇

    https://www.v2ex.com/t/1201760

    关于土耳其区的讨论👇

    https://www.v2ex.com/t/1206961

    当国产替代进入下半场,CRM的竞争焦点正在从功能覆盖转向场景深耕和智能赋能。

    近几年,国内CRM市场经历了从“怀疑观望”到“积极拥抱”的转变。根据IDC发布的《2025年中国CRM应用市场跟踪报告》,全年市场规模已达678亿元,超过83%的企业在选型时会优先考虑适配本土场景的国产方案。市场共识已经形成:国产CRM不再是国际巨头的廉价替代品,而是更适合中国商业土壤的数字化工具

    然而,当“替代”成为常态,新的问题随之而来:面对数十家本土厂商,企业如何才能选到真正“好用”的CRM?本文将从行业视角出发,拆解国产CRM从“能用”到“好用”的关键跨越,并结合典型厂商实践,探讨一条切实可行的选型路径。

    一、为什么很多企业卡在“能用但不好用”的困境?

    不少企业都有类似体验:系统上线时轰轰烈烈,销售培训也全员到位,但三个月后一线使用率断崖式下跌。管理者打开后台,看到的依然是大量空白的跟进记录和过期的商机提醒。这种“用起来了,但没用好”的状态,根源在于三个核心矛盾尚未解决:

    1. 标准化产品与个性化业务的冲突:通用流程无法覆盖企业特有的报价逻辑、审批链条和业绩分配规则。
    2. 数据录入负担与业务赋能期待的错位:系统要求销售花时间“填表”,却没能告诉他下一个订单该从哪里来。
    3. 工具思维与增长思维的落差:系统只做记录和统计,缺乏主动洞察和预警能力。

    因此,CRM从“能用”到“好用”的跨越,本质上是从“流程记录工具”向“业务增长引擎”的进化。这一进化依赖三个关键能力:行业化适配、AI场景融合、以及贴身服务。

    二、行业化深耕:告别“万金油”,走向“专用工具”

    国际CRM之所以在中国市场屡屡水土不服,很大程度上源于其“一套架构打天下”的产品哲学。而中国企业千行千面的特点决定了——没有行业Know-how沉淀的CRM,落地效果必然打折

    当前,头部国产CRM厂商普遍选择走“行业化”路线,针对不同垂直领域提供预配置的专属方案。以国内厂商珍客AI CRM为例,其行业化策略具有一定代表性:

    • 制造业场景:针对非标产品报价复杂、产销协同困难的问题,系统预置了CPQ(配置-定价-报价)引擎,并与主流ERP系统实现库存、生产进度数据的双向同步。销售在手机端即可完成精准报价,AI辅助推荐最优物料组合,从源头降低“接单后无法交付”的风险。
    • 高科技/SaaS场景:聚焦线索质量评估和转化效率提升,内置基于历史成交数据训练的线索评分模型。新线索进入系统后,AI自动输出优先级和跟进建议,帮助销售把精力聚焦在高意向客户身上。
    • 专业服务场景:围绕项目制业务的管理痛点,打通“立项-工时-报销-开票”全链路,项目毛利率、回款进度等核心指标实时可查,帮助服务型企业实现业财一体化管理。

    这种行业化思路的核心价值在于:交付给客户的不再是一个空白的通用平台,而是一套经过同行业实践验证的“最佳业务实践模板”。企业上线时无需从零配置,实施周期和试错成本显著降低。

    三、AI能力:从功能点缀到工作流嵌入

    如果说行业化解决的是“业务适配”问题,那么AI要解决的就是“效率倍增”问题。当前不少CRM产品的AI功能仍停留在“独立对话框”或“一键总结”的阶段,与核心业务流程存在割裂感。

    真正的“AI原生”设计,应当让智能能力像水电一样,在用户需要的场景中自然浮现。继续观察珍客AI CRM的产品逻辑,其做法是将AI能力拆解后嵌入具体的工作节点:

    工作场景AI介入方式产生的业务价值
    客户沟通后自动转录电话/会议录音,生成结构化跟进摘要销售每天节省30分钟文书时间
    商机推进中分析停留时长、互动频率、竞品提及等信号,动态计算“赢率指数”低于阈值时自动预警,防止商机“沉睡”
    新人培养期根据当前客户画像,推送相似场景下的成功话术和案例新人上手周期从3个月缩短至2周
    合同签订前自动校验信用额度、库存状况、价格政策减少人工复核环节,规避履约风险

    这种“场景触发、主动服务”的AI模式,让一线人员感受不到“我在用AI”,只感觉到“这个系统挺聪明的,知道我需要什么”。这才是AI在B端软件中应有的落地姿态。

    珍客AI CRM

    四、服务与安全:国产软件的本土化优势再审视

    服务响应速度,历来是国产软件相较于国际竞品的突出优势。但在国产厂商内部竞争中,服务能力的差异同样明显。优秀的厂商不仅提供技术支持,更能提供业务咨询服务

    目前,部分头部厂商已建立起“行业专家+技术顾问”的复合型服务团队。例如珍客CRM的服务体系强调“懂行业”属性——制造业的实施顾问拥有多年生产管理背景,SaaS行业的客户成功经理自身就是增长运营出身。这种配置意味着在系统实施过程中,厂商不仅能教会客户“怎么用”,还能协助梳理业务流程、给出优化建议。

    在数据安全层面,合规已是基础门槛。更值得关注的是部署灵活性:是否支持公有云、私有云、本地化多种部署模式?是否提供字段级权限控制?是否具备国密算法加密能力?这些细颗粒度的安全能力,才是强监管行业(金融、国央企、拟上市公司)选型时的核心考量点。

    五、从“替代”到“首选”:选型逻辑正在被重塑

    回顾国产CRM的发展轨迹,早期打动客户的是性价比和合规性——比国际品牌便宜,数据不出境。但当下,让越来越多企业将国产CRM作为首选的,是产品力、行业理解力和AI融合能力的综合胜出。

    当企业寻找的不再是“Salesforce的平替版”,而是一个能真正帮业务增长的数字化伙伴时,选型标准自然升级。那些在特定行业有深度案例、AI能力真正融入业务流程、服务团队具备咨询能力的厂商,会更容易获得客户信赖。

    六、给企业的三点选型建议

    基于以上分析,建议正在选型的企业从以下三个动作入手:

    1. 带着真实业务场景做POC:不要只看厂商的标准演示,拿自己公司的一笔典型业务(从线索到回款)完整跑一遍流程。观察系统在非标报价、审批流转、跨部门协同等关键节点是否流畅。
    2. 重点考察厂商的行业标杆案例:要求提供同行业、同规模客户的详细案例,并与对方的客户成功负责人直接交流,了解上线后的真实使用情况和遇到的坑。
    3. 评估AI能力是否“即插即用”:询问AI功能的训练周期和冷启动方案。一个好的AI系统应该能在短时间内基于企业历史数据产出可用模型,而非要求企业投入数月进行数据清洗和标注。

    结语

    从“能用”到“好用”,国产CRM正在经历一场深刻的质变。这场质变的核心,不是营销概念的更迭,而是产品哲学从“功能覆盖”向“价值交付”的回归。对于企业而言,选型时少一分对品牌光环的迷信,多一分对业务适配和实际落地效果的审视,才能找到那个真正能让销售团队“用起来、离不开”的数字化伙伴。

    站友们在上班 / 放假中,闲下来了会做些什么打发时间呢?感觉没有兴趣爱好之后一到空闲时间就有点发慌sobbing

    AI 时代的“开发者圣地”:深度解读 Hugging Face 与魔搭社区

    大家好,我是彪哥。

    在传统的编程时代,GitHub 是所有人的信仰。但到了 2026 年,如果你只盯着 GitHub,

    就像是在工业时代只盯着打铁铺,却没看到不远处的发电厂。

    AI 的爆发让软件开发从“逻辑驱动”转向了“模型驱动”。

    在这种大环境下,Hugging Face和魔搭应运而生。

    它们不再仅仅是存代码的地方,而是 AI 的“兵工厂”和“武器库”。

    本文将带你深入这两个社区,看清它们是如何重塑我们这些“硬核开发者”的生产力的。


    一、 Hugging Face:AI 界的“瑞士”与全球标准

    image-20260421015721004

    如果说 AI 圈有一位“带头大哥”,那一定是 Hugging Face。

    1. 从“库”到“生态”的华丽转身

    最初,Hugging Face 只是因为开源了 Transformers 库而走红,让大家能一键调用 Google 和 Facebook 的模型。

    但现在,它已经成了 AI 界的“基础设施”。

    它的核心魅力在于三个词:开放、标准、共享。

    2. 三大核心功能

    Models(模型库): 这里是全世界最全的“脑子”仓库。无论是 Meta 的 Llama 系列,还是 Google 的 Gemma,发布后的第一站一定是这里。

    image-20260421015820945

    Datasets(数据集): AI 的成长离不开“投喂”。这里存储了海量的多模态数据,是模型训练和微调的原材料基地。

    image-20260421015837202

    Spaces(创空间): 这是最让开发者省心的功能。它利用 Docker 和 Streamlit 这种技术,让你能在几分钟内把一个死冰冰的模型,变成一个能跑、能点、能互动的网页 Demo。

    image-20260421015951120

    3. 商业逻辑:做中转站和储存商

    Hugging Face 现在的生意做得很聪明。它不仅存模型,还通过 Inference API 把模型“跑起来”卖给你。

    你不需要昂贵的显卡,只需要接通它的 API,就能拥有顶级的 AI 能力。它已经从一个社区,变成了一个全球模型分发的中转站。

    他还提供模型储存服务,主要是面对企业的。


    二、 魔搭社区(ModelScope):中国开发者最强“算力后盾”

    image-20260421020203525

    如果说 Hugging Face 是全球标准,那么阿里做的魔搭社区,就是中国开发者最实在的“算力加油站”。

    1. 本土化优势:更懂中国心

    魔搭最大的优势在于它对国产大模型的深度支持。

    比如通义千问(Qwen)DeepSeek 等在国内爆火的模型,在魔搭上不仅资源全,而且还有大量的中文教程和应用案例。

    image-20260421020304731

    2. 暴力美学:大方的算力馈赠

    对于咱们这些“抠门”但好学的开发者来说,魔搭最香的地方莫过于它的算力平台

    在海外平台,你可能为了几小时的 A100 显卡额度还要绑定信用卡、排队。但在魔搭,它经常提供免费的 GPU 实例,这种“算力普惠”的打法,直接降低了普通人玩 AI 的门槛。

    image-20260421020340476

    3. MCP 广场“即插即用”

    它出了一个 MCP 广场,是可以“拿来就用”的。

    不管是抓数据的、查资料的,还是调 API 的,各种节点都已经标准化了。

    你不需要去研究复杂的协议底层,直接像“堆乐高”一样把这些技能塞进你的 AI 里,分分钟就能跑出一个能干活的 Agent。

    image-20260421020450837


    三、 深度解读:全球视野 vs. 本土实战

    把这两个平台放在一起看,你会发现它们其实是互补的关系。

    1. 资源布局对比

    Hugging Face: 它是“学术和创新的尖端”。最前沿的论文代码、全球性的开发者讨论都在这里。如果你的目标是“出海”或者做全球化软件,这里是必经之路。

    魔搭: 它是“落地的先锋”。它解决了国内访问慢、算力贵、中文支持差的痛点。如果你的业务是在国内,或者你需要高性价比的算力支持,魔搭是首选。

    2. 开发者生态

    Hugging Face 的社区更像是一个极客广场,大家更关心协议(如 MCP)、标准和通用性。

    魔搭 的社区更像是一个实战训练营,大家更关心怎么把 Qwen 部署到本地,怎么用低显存跑大模型,非常务实。


    四、 为什么开发者必须同时占领这两个高地?

    作为一名硬核开发者,如果你只守着其中一个,那就是在自断双臂。

    1. 消除信息差

    通过 Hugging Face,你可以第一时间感知到硅谷在发生什么。

    比如MCP,你可以在这里找到最原始的 Server 实现。

    2. 算力成本优化

    你可以把项目代码放在 GitHub,把国际版 Demo 放在 Hugging Face 积累名气,而把真正耗资源的生产、抓取和重度测试任务放在魔搭上。这种“跨国套利”的思路,能让你用最少的钱办最牛的事。


    五、 未来展望:当 AI 变成“乐高插件”

    随着 MCP 协议的普及,未来的 Hugging Face 和魔搭将不再仅仅是仓库,它们会变成 AI 的“插件中心”

    以后,我们写的爬虫、写的分析脚本,都不再需要写 UI。我们只需要按照标准写成一个 MCP Server,部署在魔搭或 Hugging Face 上。

    全球的 AI 软件(如 Cursor, Claude Code)都能通过一个 URL 直接调用我们的能力。

    这就是“万物皆可 MCP”的时代。 软件开发的门槛被极大地拉平了,拼的不再是谁的界面好看,而是谁的底层逻辑更硬,谁的数据抓得更准。


    结语:彪悍的人生,不需要解释

    无论是在 Hugging Face 上跟老外卷 Star,还是在魔搭上薅阿里的显卡羊毛,本质上都是在 AI 的浪潮中寻找自己的位置。

    对于我们这些写代码的人来说,工具在变,平台在变,但“用技术解决问题”的内核永远不会变。

    推开那扇“翻墙”的窗,你会发现外面不是荒野,而是一个充满了算力和模型的无限海洋。

    别在门口张望了,赶紧注册个账号,把你的代码扔上去跑一跑。AI 时代,慢一秒就是落后一个世纪。

    抱拳了

    感谢各位朋友捧场!要是觉得内容有有点意思,别客气,点赞、在看、转发,直接安排上!

    想以后第一时间看着咱的文章,别忘了点个星标⭐,别到时候找不着了。

    行了,今儿就到这儿。

    image-20260421021118032

    论成败,人生豪迈,我们下期再见!

    之前在这里发过一次,收获了 500 个用户,见: https://www.v2ex.com/t/1202739

    被喷的也很惨,比如很多场景不支持如云服务器续费场景、自动续费多少期、平均花了多少钱都不清楚

    也有用户认真提建议的,比如希望增加 AI 识图,这样方便从其他 App 拍个照就迁移过来,不用一个一个手动输入了

    也有用户说交互不好的,比如希望添加订阅界面能左右滑动来切换分类。

    都听进去了,都改了,AI 识图用的是 Qwen3-VL-flash ,效果很不错。

    下面是新的界面截图,有兴趣的佬可以试试

    注:旧数据会在你点进详情的时候自动迁移,无需手动操作。

    欢迎反馈,也可以在 设置-用户反馈 直接给我留言,我接了企业微信 webhooks ,发一条通知一条~

    采纳的建议我都给了 1 年的 Pro

    现在某数字货币交易所前端,女,35 ,工作 996 。现在有个军工国企航天系 offer ,但是劳务派遣签航天人才,现在有点纠结要不要去,本来为了稳定想去,但劳务派遣不知道怎么样,而且工资也要降一些。有了解国企劳务派遣的吗?

    金融注册、登录、转账、提现、授信环节的欺诈,大多能通过IP维度提前拦截。技术人员可直接通过IP查询获取属地、网络类型、代理标记、机房网段等真实字段,搭配固定风控规则、接口对接、网段黑名单,快速落地轻量化反欺诈策略,不用复杂开发,就能减少盗刷、批量养号、跨地作弊等实际问题。

    金融线上业务攻击多以批量脚本、代理伪装、异地接管账号为主,很多研发只依赖设备指纹和行为检测,缺少IP层面的基础拦截。实际风控落地中,IP维度门槛低、接入快、误可控,是技术团队最容易落地的补充手段。日常做金融风控规则迭代时,我们通常会选择接口稳定、支持高并发与批量查询的专业IP查询工具,比如IP数据云,其可直接输出结构化查询字段,覆盖属地、运营商、网络环境、风险标签,能很好适配支付、信贷、理财类业务的线上风控调用需求。

    一、金融业务中,需要拦截的4类高风险IP(实操识别标准)

    不用抽象概念,直接按技术识别维度划分,日常可直接作为拦截依据,具体汇总如下表:

    高风险IP类型识别标准风控处理方式
    跨省跨城异地IP用户常驻城市固定,出现跨省、跨大区IP登录/交易触发人脸、短信二次核验
    代理/VPN/中转IPIP被标记为代理、匿名网络、跨境中转限制注册、大额转账、授信申请
    数据中心机房IP属于云服务商、机房专属网段禁止新用户注册与实名绑定
    虚拟运营商/共享蜂窝IP多用户共用动态网段,常用于黑产批量养号做风控权限降级处理

    二、技术实操:IP查询工具4个落地用法(可直接上线)

    2.1 调用IP接口,实时解析关键字段

    业务层对接IP接口,用户每一次登录、提交订单、发起提现时,采集公网IP,实时获取核心数据:归属地省市、运营商、网络类型、机房标识、代理风险标记。无需自建IP库,减少运维更新成本,适合中小金融团队快速上线。

    2.2 配置属地强校验规则(零开发快速落地)

    结合业务场景配置硬性风控规则

    • 个人用户:登录IP与常用登录城市不一致→弹窗二次验证
    • 借贷授信:IP属地与身份证户籍地、工作地严重不符→拦截申请
    • 大额转账:短时间多地IP切换登录→临时冻结转账权限

    企业有个性化地域风控需求时(如重点风控某几个省份、区分城乡网段),可在对接IP查询工具时开启定制化服务,比如我们常用的IP数据云,可按自身业务覆盖省份、重点风控区域,自定义属地白名单、异地风险等级,适配不同金融产品线的差异化需求,不用额外开发适配代码。

    2.3 网络环境分层管控,精准降低误杀

    按IP查询返回的网络类型,做分层权限管控,避免一刀切拦截:

    • 可信环境:家庭宽带、普通4G/5G手机网络 → 正常放行
    • 风险环境:企业专线、公共WiFi → 限制敏感操作
    • 高危环境:机房IP、代理IP、境外IP → 直接拦截注册与授信

    这套分层逻辑简单易维护,运维可直接在网关、风控后台配置生效。

    2.4 搭建本地IP黑名单,联动网关拦截

    长期沉淀已核实的欺诈IP、批量作弊网段、高频攻击IP,形成内部黑名单。通过IP查询工具批量导入网段数据,同步至防火墙、Nginx、业务网关,实现访问层前置拦截,减少无效请求进入业务系统,降低接口压力与风控审核量。

    三、落地必避坑(技术实际踩坑总结)

    3.1 不单独以IP做永久拦截

    手机流量跨省漫游、出差异地登录属于正常场景,是网络使用常态。技术落地时,IP只做风险评分+预警+二次校验,不单独封号、永久拦截,避免大规模误杀正常用户。

    3.2 拒绝使用免费老旧IP库

    三大运营商每月都会调整IP网段分配,免费工具数据库更新滞后,会出现属地错乱、网段误判。金融业务对准确性要求高,建议选用定期自动更新的专业IP解析服务,保证规则判断稳定。

    3.3 风控数据合规调用

    仅在安全风控场景下调用IP解析数据,不收集、不滥用用户位置信息,符合金融隐私监管要求,做到风控与合规并行。

    四、运维长期维护方案(稳定运行实操方法)

    1. 接入标准化HTTP/HTTPS查询接口,支持毫秒级响应,适配金融高并发交易峰值;
    2. 每周导出异常IP报表,复盘误判案例,放宽出差、漫游等合理场景;
    3. 定期同步全网新增机房网段、代理池IP,保持风控规则时效性;
    4. 内网办公IP、专线网段加入全局白名单,防止内部测试、办公被误拦。

    五、总结

    对技术人员而言,IP反欺诈不是复杂架构改造,而是低成本、快落地的基础风控补充。依靠IP查询工具字段解析、环境识别、属地校验,就能解决金融场景里大部分批量作弊、异地盗刷、代理伪装等实操问题。想要长期保证解析稳定、规则可定制、高并发不掉线,可选择适配金融场景的专业IP查询工具,其高频更新的IP数据库、业务化定制配置、金融级稳定接口,能帮助技术团队用轻量化方式补齐反欺诈能力,实实在在降低线上欺诈工单与资金风险,我们目前使用的IP数据云就具备这些特性,可直接对接现有风控系统,无需额外改造。

    前面的话:

    作为长期关注 Voice Agent 的开发者社区,大家最近可能会好奇:为什么我们开始将目光投向了 Visual Agent?答案其实很直觉:在下一代 AI 终端的交互界面里,「说」与「看」最终一定会融为一体。

    随着多模态模型的逐渐成熟,我们看到像 Chance AI 这样的先锋团队,正在和一群被称为「Vision Native」的年轻新用户,共同探索这种全新的交互可能。

    如果你对 Visual Agent 的认知,还停留在「像 Google Lens 那样拍照找同款」,或者认为它只是 ChatGPT、Gemini 附带的一个通用图像识别功能,那你大概率会错过下一个时代的重要入口。

    为什么要做一款垂类的视觉 Agent 产品?这篇访谈把背后的认知说得极其透彻,推荐阅读。

    不仅要读,我们更欢迎你来现场一起思考。

    这周六(4 月 25 日)下午,我们将在杭州云谷中心举办一场以「Visual Agent 和 Context Awareness」为主题的 meetup。届时,Chance AI 的联创也会加入讨论。

    同期参与讨论的,还有深耕大模型、视觉理解、语音以及物理 AI 硬件的朋友们。嘉宾阵容包括蚂蚁百灵大模型、声绘未来、湃启科技、Rokid、Cerul.ai 以及 Agora。

    无论这周六你能不能来现场,这篇长文都值得你花十分钟仔细看完。👇


    一款 AI 产品出现在了国际顶级的艺术展览中,而且是充当解说员的身份。

    上周,亚洲当代艺术博览会 Art Central 落幕。Chance AI 作为这届博览会官方引入的首个 AI 产品,负责帮观众解读艺术品。观众举起手机,对准一幅画,拍照即交互,听 AI 解释:这件作品为什么成立,它背后意味着什么。

    创始人曾熙给这套系统起了个名字「Visual Agent」。核心逻辑是,让 AI 先看懂,再开口。

    认知科学 PhD 背景的曾熙,曾在一加、OPPO 和字节跳动做过十多年的产品与设计。他相信,尤其是 Z 世代的年轻人,天然地习惯通过图像和直觉去理解世界。

    「AI 与人类不应该是一个输入框的关系。更直觉的方式是:我一看,AI 就已经理解我需要什么。」

    Chance AI 第一次把这套人类认识世界的方法,带进了 Agent 的 Harness Engineering 里。在视觉理解的核心 Benchmark MMMU 上,Chance AI 目前排名世界第一,准确率 86.07%,超过了人类评分(85.4%)和所有主流大模型。

    以 Visual Agent 为切入点,Chance AI 发布后在推特上引起了 AI 行业不少硅谷大 V 的讨论,AK、Robert Scoble、Rohan Paul、Madza、Parul Gautam 等大佬都点赞转发。产品目前已有 20 万用户,高校 Z 世代人群居多。

    再往下一步,Chance AI 想让 Visual Agent 成为下一代的 AI 终端入口。「视觉,才是人类最直觉的操作系统。」

    以下是 Founder Park 与 Chance AI 创始人曾熙的对话,经编辑整理。

    产品官网:

    https\://www.chance.vision/

    采访 | 万户

    编辑 | 夏天

    01 产品最初的 MVP 验证,是一款导览小程序**

    Founder Park:简单介绍一下团队和你个人的过往经历。


    曾熙: 我过去在一加、OPPO 和字节跳动工作,做了十几年的产品和设计,主要都是在做消费电子方向。从手机硬件到手机操作系统,再到 AI 应用,加起来做过差不多近 6 亿级别用户规模的产品了。也是在字节的那一段时间,我开始更深入地参与 AI 产品的构建,尤其是多模态相关的探索。

    我自己的学科背景其实有一点不一样,PhD 研究方向是认知科学。我一直在思考一个问题:人是如何最直觉地理解这个世界的?这也是我后来做 Chance AI 的起点,不是说 AI 能做什么,而是反过来推导:AI 如何帮助人们更好地在现实生活中去理解世界,然后进入下一步决策。

    团队方面,大部分是我在这三段经历里认识的、合作特别好的同事。尤其是负责视觉推理和算法的、海外增长的同学,都是之前共事的同事。

    Founder Park:什么契机决定离开大厂,全身心投入 Chance AI?当时看到了什么机会?


    曾熙: 主要是有三个时刻。第一个是我在字节做豆包的时候。2024 年的时候发现很多人喜欢在豆包里上传图片,然后和豆包聊。当时隐约觉得一种新的交互习惯要出现了。

    第二个时刻是 VLM 的出现。GPT-4o 第一次有了很强的多模态能力。我们当时就在思考,基于 VLM 能不能做出应用层的东西?很多人基于 LLM 做东西,但还没有人基于 VLM 做东西。

    第三个是真正让我们下定决心的时刻。2024 年底,我们几个朋友在深圳做了一次 Andy Warhol 的展览。我们做了一个 AI 导览小程序,所有人进来后扫描会场里的画,然后与作者进行对话。展览结束三个月后,我们发现竟然还有 1500 个用户持续地用这个小程序去看生活中的东西。我们去回访这些用户,发现他们用来给小朋友看花草、看名胜古迹、看收藏的球星卡和潮玩,或者看想买的东西。

    当时我们认为这是真实存在的需求。从那之后,到了 2025 年初,我从字节离开,决定全职做这件事。

    Founder Park:怎么介绍目前你们的这款产品?


    曾熙: Chance AI 是一款视觉 Agent 产品。打开 App 之后,没有输入框,只有一个相机。拍照即交互——对准花草、名胜古迹、球星卡,或者任何你感兴趣的东西,AI 就开始工作。

    我们不叫自己「AI 相机」或者「视觉搜索」,而是 Visual Agent。因为在我们理解里,它是一个更主动的、和你一起参与的系统——它不是等你输入再响应,而是参与你整个看世界的过程。核心逻辑是:让 AI 先看懂,再开口。

    02 Visual Agent 的核心,是帮用户构建一套理解世界的系统

    Founder Park:Chance AI 提出了「Visual Agent」这个概念,它和传统的视觉识别工具,比如 Google Lens 的区别是什么?


    曾熙: 简单来说,Google Lens 或者别的工具,比如关于识别花草的、鸟的、红酒的,统称为「识别工具」。它们的目标是把东西识别清楚以后,把你带到搜索或带到交易。Google Lens 一开始就是为了电商而生的产品,找同款,所以它的结果就是链接和价格。

    我们观察到的问题是:用户很多时候并不是想知道这个东西是什么,而是想知道为什么它长这个样子?它为什么有意思?它跟什么样的文化、历史故事有关?所以我们把重点放在解释层上面,不是描述层面


    假设你的偶像是乔布斯,我跟你说「这是乔布斯最喜欢的某个厨房料理机,因为他小时候家里就是用的这个款式,后来影响了他做 iPod 的经历」,这个时候你的感受会区别于讲表面信息的时候。这个我们已经验证过了,尤其是潮玩,都是塑料,为什么某些潮玩卖得特别好而某些就一般?因为某个潮玩代表了某种情绪,但那个情绪是需要被诱导出来的。

    这是下一个时代新用户的行为模式,所以我们是为这群新用户做的新产品形态。它不仅仅是识别,它需要把感知、上下文、社会共识全部连接起来。

    Google Lens 是一个工具,我们是在帮用户构建一个理解系统。因为我们相信一切行动都是建立在理解之上的。 一个你不理解的东西,你不可能想要买它、拥有它或者想去那个地方。这是很大的区别。


    Founder Park:那 Chance AI 和普通 ChatBot 的区别是什么?


    曾熙: 这些通用模型的视觉能力,本质上对它们来讲是一个附加能力。它们没有针对多模态能力做任何优化,核心仍然是对话,输入框,用户先提问,再调用部分视觉作为输入的一部分。我们认为这是不合理的,因为真实世界不是这样的。真实世界是你看到一个东西,你甚至都不知道该怎么问,你只是觉得「我想关注这个东西了」,有一瞬间的好奇心。

    我们的做法是贴近真实世界,从你看到的世界开始,而不是从问题开始、从输入框开始。这带来一个很本质的区别:对 Chatbot 来讲,一进去必然是一个输入框;对我们来讲,一进去就是相机,要么你就拍,要么你就上传图片。本质上它不是能力的差别,而是产品方向的选择。

    Founder Park:相当于 ChatBot 里的视觉识别只是文字交互中的附加功能。但对你们来说,视觉本身就是用户理解世界的最主要方式。


    曾熙: 对。如果做类比的话,有点像 ElevenLabs。今天 Gemini、GPT、豆包全部都可以生成音乐了,为什么 ElevenLabs、Suno 还是能获得非常好的表现?因为它们起步早,有非常垂直的定位,然后随着月活越来越多形成正向飞轮。对我们来说也是一样,今天比如用户要看穿搭、看审美、看艺术品或看潮玩,已经没有任何通用模型能比我们更强。

    Founder Park: 也就是说你们已经基于用户迭代出来了很多场景,比如 OOTD 穿搭、看肤色这些,涌现出了很多用户自己建的场景。

    曾熙: 没错,而且这些用户的需求是大厂不会干的事。所以我们一定得绕开大厂的辐射范围,离用户很近、对用户的反应更快,这也是我们的「护城河」之一。

    03 Z 世代天然更习惯用视觉去表达和理解世界

    Founder Park:Chance AI 面向的核心目标人群是 Gen Z,你们当时是怎么确定他们是第一批用户的?


    曾熙: 还是一个被选择的过程。我们有很多假设,最后是因为这批人的表现最好,所以圈定他们作为早期种子用户。我们发现他们有一个共同点,给他们一个标签叫「艺术的生活家」。他们不是那种艺术家,但一定是那种对生活很有追求、很有品质的人,很在意自己的 Image。

    我们发现这群人都有这个特性,我们叫做视觉驱动型用户。大部分是艺术学院或文理学院的学生。他们很喜欢用表情包、meme 图片、视频沟通,而不是通过邮件或长文本。很多时候他们不是在表达一个问题,更多是在表达那个 vibe,特别抽象,但又特别能引起共鸣。

    这是我们最后沉淀下来发现表现最好的用户群。比较有优势的是,这群用户恰好又是在社交媒体上比较活跃发声的用户,自然就给我们的增长带来了助力。所以我们并不是把 Gen Z 广泛地定义为目标用户,而是因为这群人更习惯用视觉去理解世界。


    我们在产品上也往这群人靠拢,很注重审美、文化风格这一类的东西,而不是告诉你一个客观参数。当他们使用我们产品的时候就觉得很自然,不需要去想,因为一想就变理性了,一旦触动思考、要想怎么组织一句话,就变得很理性,跟他们追求感性、追求 Vibe 的特质是违背的。所以这群人使用我们产品的学习成本几乎为零,这也是为什么他们很自然地成为了我们的种子用户。


    Founder Park:你们现在的用户规模大概是多少?增长主要靠什么?


    曾熙: 我们现在大约 20 万用户,其中差不多 15 万是 25 岁以下的年轻用户。

    最主要的增长来源是校园计划,靠学生的口碑传播。我们会鼓励不同校园里的活动。比如 sponsor 一些资金支持,二三十个学生一起去逛某个地方,逛的过程中使用我们的产品,最终坐在一起在咖啡店里分享发现了什么有趣的东西。


    Founder Park:你们的预期是一直服务大学生群体,还是陪伴他们进入社会后继续服务?


    曾熙: 我们服务的是 Visual Native 的人群,没有那么明显的年龄界限,只是现阶段他们正好处在 18 到 25 岁这个年龄段。我相信即使他们步入社会以后,也还是保留这个用户习惯的。接下来可能 15、16 岁的人也会更加 Digital Native。

    Chance AI 的各类线下校园活动


    Founder Park:不同地区的人群在使用场景上会有区别吗?


    曾熙: 会有,但差异体现在看什么,而不是怎么看。美国用户大部分看穿搭购物、化妆品、潮玩。欧洲用户很喜欢看艺术品、建筑、展览、书籍封面,一个法国学生可能会拍意大利语的书籍封面,然后去读内容。拉美用户更偏神秘学,看手相、看面相,每天出门前拍一拍来决定今天要注意什么。而且他们会把穿搭和神秘学联系在一起,根据今天的运势决定要戴什么颜色的首饰。

    Founder Park:如果想从现在的 20 万到 100 万、500 万,大概是怎样的增长路径?核心靠什么实现用户增长?


    曾熙: 短期以产品驱动为主。口碑传播在达到 100 万用户以前可能都不会改变。因为这个产品的核心不是获取流量,而是需要帮助用户形成一种新的使用习惯。如果习惯没有建立,去做投流、买量是没办法放大的。

    增长路径现在比较清晰,把核心场景打透。除了日常的视觉理解以外,比如穿搭场景、神秘学场景、旅行场景、购物场景,我们要围绕这些场景把它做深。现在只能说有一个苗头,看到了努力的方向,但还没有拼尽全力去做深。

    然后再通过内容和社交去做扩散。比如我们现在穿搭场景里有直接一键帮你生成 Instagram Story 的模式,除了给你打分、给你颜色搭配建议、饰品建议以外,更重要的是有一键变成 Ins Story 图片的功能。

    04 不是效率工具,是 lifestyle 的视觉伴侣

    Founder Park:一开始预想产品要做成什么样?早期优先解决什么问题?


    曾熙: 很坦白地说,当时是没有的,我们只是知道「看世界」是一个比较具体的需求,但具体看什么我们完全不知道。我们认为要做好的事情就是把架构做好,用户会告诉我们他们选择看什么东西,看得多了以后再针对性地优化。

    比如穿搭这件事,我们一开始并没有帮用户看穿搭的 Visual Agent,而是穿搭照片的占比多了以后,我们才专门针对穿搭去做优化,是这种反哺回来的形式。这来源于我在一加时候的社区共创基因。我觉得这教会了我非常多,如果你还没想清楚,没关系,最重要的是赶紧先把你的能力丢出去,用户会告诉你他们需要什么。


    Founder Park:你们最初上线的版本,先解决的是让用户能拍照跟世界进行交互,这个交互形式是从一开始就确定了吗?


    曾熙: 对,这个架构从一开始就确定了。我们有一段时间在首页加了输入框,结果那段时间产品的表现特别差。


    Founder Park:加输入框反倒效果差了?


    曾熙: 对。我们加输入框加得很次要,作为搜索框的形式存在,结果让用户失焦了。很多人直接把它当成 Chatbot 来用。所以我们把输入框去掉之后,这群用户离开了,但反而长期留存变得更好了。

    Founder Park:你之前提到「提示词是为懒惰的 AI 准备的」,那在图片生成后的追问环节,这种「基于单图的对话」与传统 Chatbot 的区别是什么?


    曾熙: 所有后续追问都是基于同一个主题的。就像我所有追问都是基于「我今天穿什么衣服」这个主题,所以它会针对这个有很强的上下文,它知道我前面试了多少套、每一套之间细微的区别是什么,从而判断你是不是正在犹豫去的场合不知道穿什么。我们认为这是很天然的、直觉的。别的 Chatbot 里开一个对话框是一个主题,对我们来讲每张图片就是一个主题。

    Founder Park:那不同的图片,比如看手相、OOTD 这些,是直接上传一张看手相的图就可以,还是需要选一个场景才会进入对应的功能?


    曾熙: 两种都有。有些强风格化的东西会给你推荐,比如你把某个产品丢进去,有可能是想买它、想吐槽它、想给它写一首诗,这时候我们会做推荐。但有些很特定的场景,比如拍一朵花或拍手纹,我们就很确定地知道该导入到哪个功能。你问的这个问题其实很本质,本质上我们不应该再有推荐,但限于 VLM 的能力,目前不得不有一个过渡状态。

    Founder Park:如果用户输入的信息只有一张图,你们怎么去理解用户的意图?


    曾熙: 这又回到我 PhD 研究的课题上了。视觉一定先于语言,当你看到一个东西的时候,你可能都没想好怎么组织语言,但你已经有一个念头了。所以我们认为,你跟看到的东西的交互发生在后面,输入框是发生在追问里,而不是你产生意图的那个瞬间。


    当你看到一个东西的时候,至少百分之八九十的意图已经能命中,你看到一套衣服,大概率想买它或想知道适不适合自己,可能有百分之一二十的概率是你想把它买给你的女朋友。这就需要长时间的交互,我才知道你是男生还是女生,为什么一个男生要拍女装?随着第二次、第三次交互,我就能知道原来你是在帮别人挑礼物。

    所以意图在你看到图片的瞬间,以及长期交互的过程里,会变得越来越准、越来越懂你,是一个收缩的状态


    Founder Park: 所以,拍的时候用户自己可能也没有很明确的意图,更多是直觉。拍完之后的下一步交互,是用户在明确自己的意图,Chance AI 也在更明确地理解用户。后面的交互是大家逐渐把意图收敛的过程。


    曾熙: 没错。分享一个核心用户群数据:我们有一个指标叫单次核心任务流的交互时长,是 6.4 分钟。也就是说,当用户上传一张图片触发一个任务流后,他跟这张图片的交互时长是 6.4 分钟,基本上每个人会进行 3 到 5 轮对话。

    Founder Park:所以,Chance AI 瞄准的用户不是那种「我很明确地要做什么」的用户?


    曾熙: 对,所以它并不是一个效率工具,更偏 lifestyle,是一个视觉伴侣。我们的用户都是北美的年轻人。他们可能上课的时候用 GPT 写课件、写论文,但出去玩、跟小姐妹喝下午茶、跟兄弟逛球鞋店,基本上都是 Chance AI 的场景。

    Chance AI 是一个 lifestyle 的 companion,会陪你一起看世界,「看」是它最重要的能力。


    Founder Park:你们会怎么定义这个产品最终给用户的价值?


    曾熙: 它是一个非效率场景的、帮你赋能生活方式的 AI 产品。分享一个例子,产品在去年年底迎来了一波增长,原因是快到圣诞节的时候,非常多人要挑礼物,就用 Chance AI 给自己的男女朋友或家人挑礼物。

    05 把人类看世界的方法 带到 Harness Engineering 里

    Founder Park:在技术架构方面,你们是怎么做的?


    曾熙: 我们 post-training 了一些开源的 VLM,用在不同的场景里。但对我们来说更宝贵的还是我们做了一套 visual 的 harness engineering。

    我们这套技术架构,本质上是从人类如何真实地看世界出发,然后把这个过程映射到我们的 Visual Agent 里。在人类的认知过程中,其实有一条非常清晰的处理链路:

    首先是视觉信号的采集——通过眼球和视网膜接收外界的光信号;随后,这些信号通过视神经被转化为神经信号并传递到大脑;接着进入视觉皮层(visual cortex),从初级视觉区(V1)到更高层区域逐级处理,完成对形状、结构、语义、空间关系等信息的整合与理解;最后才进入决策,这个东西我要不要拿起来?我是一只手拿还是两只手拿?它烫不烫?

    你会看到分了四层:信号采集、信号传递、视觉皮层处理、大脑决策。现在其他 AI 产品的问题是,他们想让眼睛做思考,把这些步骤混在一起,想用一个模型实现从看见到思考的全链路。

    我们的 visual agent 在技术上没有什么秘密,就是把这四个链路拆开做。难的是我们第一次把人类认识世界的方法带到了 agent 的 Harness Engineering 里面。


    Founder Park:每一步都会有一个大模型来处理?


    曾熙: 对,它会根据看到的物体在每一步决定是调用云端模型还是我们自己的 post-train 的模型,调用哪个 skill。比如发现用户看的是衣服,衣服对趋势比较敏感,就会去调用一个能找到 Instagram trending hashtag 的 skill。每一层都发生自己的判断。它是一个工程能力,不是把所有东西做到一个模型上面。

    这才是我们理解的 AI,因为人就是这么看世界的,我们只是把人看世界的方法复制到了技术实现上。我们一开始花了很多时间,来摸清楚这件事。


    Founder Park:中间走了什么弯路?


    曾熙: 走了特别大的弯路。我们一开始也想用一个模型做所有事情,然后发现怎么设计都有问题,理解能力强了,就调用不了 skill;skill 强了,视觉理解的本质又没了。特别难,中间发生了非常多这种事情。

    最后主要还是我 PhD 在认知科学方面的知识启发了我,为什么我们要期待把眼睛和大脑做成一个东西?这可能一开始就是错的。


    Founder Park:感觉比起你们现在的模型架构,底层的 VLM 反倒不是核心优势?


    曾熙: 没错。这就是为什么我们在 MMMU Benchmark 上能做到全世界第一。对我们来说,VLM 用谁家的都不重要,哪个便宜就用哪家,无论用哪家都能达到那么好的效果。我觉得这才是我们在技术层面有价值的地方。


    Founder Park:你们大概什么时候摸索清楚这个架构确实能跑通了?


    曾熙: 从 2025 年初到 2025 年中,我们一直都在研究这个问题,都没做产品。而且 2025 年初 VLM 能力更差,凭什么我们视觉理解能力能比别人好?真的就是后面做的这套 Harness。


    Founder Park: 感觉这个 Harness Engineering 有点类似于把人类本能的看东西、理解东西的逻辑复用到了 AI agent 的流程里面。复用的是人类本能的流程,而不是我们自己的实践 SOP。


    曾熙: 是的。为什么烫杯子不能碰?你什么时候决定要不要联想回以前的记忆?这个判断逻辑很重要。如果判断要联想,可能要花很多时间和 Token,怎么判断联想还是不联想?要不要在过往的 Visual Memory 里做匹配?这又得回到用户,靠用户反馈,我们才能有一个阈值去调整什么情况下要联想、什么情况下不联想。

    我们做的事情在 LLM 领域不是什么新鲜的事情,但的确是第一个把这些方法带到视觉领域的公司。


    Founder Park:所以在这套 Visual Agent 里,有 VLM 也有 LLM,互相搭配最终产出结果?


    曾熙: 是的,每个节点里最终看到的结果,最多的时候能调用 6 到 8 个模型。

    甚至结果会因为每个用户的品味不同而异。我们有一个功能,是根据你看到的图片来给你推荐音乐。这是很多人用的一个场景:我要发一个 Instagram Story,要配一个背景音乐,怎么知道我看到的东西跟音乐之间是正相关的?比如我看到一个洛杉矶的落日,它就给我配了一首落日飞车那种很舒缓的 City Pop 音乐。看上去很直觉,但我们在里面做了大量的工程,怎么把一个图像找到很适合这个图像 Vibe 的音乐,然后推荐出 Spotify 链接。虽然它只是结果页里的一个小框框,但真的很不容易。

    最后产出的结果也很偶然,相当于我们做好了一套 Skill Set,让模型自己决定要调用什么。


    Founder Park:最近流行的 OpenClaw 是用 MD 文件来储存 context。你们是怎么存储、管理用户的 memory 和 context 的?


    曾熙: 我们没办法用单一的文件来做用户的记忆存储。在视觉记忆方面,我们并不是把每一张图都变成你的记忆。我们会把图片分成三个级别的不同像素。比如一张图片,在后台会被压缩成 100x100 的小方框,人眼看上去是没有意义的东西,但模型之间能理解。我们要确保 agent 内部之间用最小单元进行沟通,传输的只是 100x100 的像素就能完成信息传递。

    某些场景下我们会用中等尺寸的图片,比如 500x500,进行思考部分,到展示给用户时才回到原尺寸。


    Founder Park:所以你们是用视觉图片的形式在不同 agent 之间做信息传达,不是在一开始就转译成语义文本来传播?


    曾熙: 我们去年做 memory 的时候,就是把图片拿掉变成纯文本,结果发现效果特别差。纯文本是累积型数据,越用越多,可能就有几百个 MD 文件了。效果差,沟通效率也低。

    后来我们发现,把文字大量压缩成低像素图片之后,模型间的沟通效率反而提高了,效果又变好了。

    我们发现一个很哲学的问题是,视觉才是最高效的沟通媒介。DeepSeek 发过一个 OCR 的模型,相同的 100 比特信息,变成文字传输快还是变成一张图传输快?他们的结论是变成图传输快,跟我们的结论完全一样。但他们主要聚焦 OCR,把文献语言图片化,我们面对的可能更复杂一点,除了 OCR 类图片,更多的是那种说不清道不明的 Vibe。

    06 你必须离用户很近,才知道产品下一步是什么

    Founder Park:Visual Agent,跟 Manus 或 Claude Code 这类生产力、工具型 Agent 有什么区别?


    曾熙:我们把它定义成 Visual Agent,最重要的点在于它是一个能和你一起看世界的 Agent。我们不叫自己 AI 相机或视觉搜索,而是叫 Visual Agent,因为在我们理解里它是一个更主动的、和你一起参与的系统,它不是一个响应式的输入,而是参与你整个看世界的过程。


    具体来说有两个很大的变化。第一是连续性:不是一次性的识别,而是一个持续的理解过程。它知道你上周的穿搭、三天前的穿搭、你买过什么东西。它会建议「你可以试一下刚买的那双蓝色鞋子,更配你这套蓝色西装」。

    第二是它具有行动能力。比如我看到一个活动海报,它可以帮我加到日历里;看到一个菜单,它可以帮我点菜;看到一个商品,它可以全网比价找到最合适的购买链接。具有行动能力对我们来说非常重要。真正的闭环是要完成一个行动。


    Founder Park:对 Agent 来说,看懂可能只是第一步。那看懂之后,接下来要提供什么价值,你们有判断或者预期吗?


    曾熙: 举个具体的例子。有用户开始用我们看球星卡来了解卡的稀有度和历史。但他看懂之后想炫耀给自己的圈子,所以我们给球星卡做了一张海报式的电子证书。然后他说「我要发到 Instagram story 和 WhatsApp 群组里」,我们又加了一键分享功能。最后他甚至想看看别的网站上它值多少钱,可能有一天想卖掉。

    它是一个你必须离用户很近,才知道下一步是什么的过程。


    Founder Park:怎么定义离用户很近?


    曾熙: 我们现在和美国 6 所大学里的不同协会,都有很紧密的合作关系,所以能很及时的通过调研了解他们的场景,从醒来到睡觉前什么时候打开摄像头、每次打开摄像头干什么、预期完成什么任务、哪些是我们能做的、哪些现在做不了但以后有可能做。这种敏感度也是我认为我们现在最大的护城河。

    07 和 AI 一起看,天然就是下一个时代的 AI 终端入口

    Founder Park:Chance AI 目前有十几个功能模块,从艺术分析、穿搭、菜谱,再到看面相。哪些场景做,哪些场景不做,你们是怎么取舍的?


    曾熙: 首要考虑的因素还是用户。用户会告诉我们,我们最主要做的是把能力架构做好,确保你扫的时候不会崩,10 秒钟就能出结果而不是等一分钟。里面涉及不同的数据、不同的搜索能力、不同的 RAG、不同的 MOE,都已经在那了,但怎么用靠用户的想象力。


    用户需求和我们能实现的能力之间有「重合点」,这个重合的地方就是我们会去做的功能。


    Founder Park:那你们观察到用户在 Chance AI 主要在做什么?


    曾熙: 现在的用户行为前三,第一是和你的图片互动,大概占到差不多一半的时间,拍一张图以后不断追问上下文、跟它说话,从而形成判断、形成行动;第二是看首页内容,会跟内容互动、留评论、回复,更多的是学习,看别人怎么用。原来这个东西也能拍飞机,能拍护肤品,能看艺术品,它起到了一个低成本教育用户的展示区作用;第三是看自己拍过的内容。

    现在的用户行为跟我们现在产品形态的设计是完全符合的:第一拍照交互,第二看首页探索别人拍的和不同玩法,第三看自己过去看过的东西。

    Founder Park:用户看自己过去拍的东西是高频行为?


    曾熙: 是的,有点出乎我们意料。我们发现有的同学已经把它当成一个专属剪贴本来用了。比如有一个日本用户,很神奇,他喜欢收藏昆虫标本,有一天拍了 180 次,第二天拍了 160 次,把自己收藏的所有标本都输进去了。

    有点像 AI native 的 Pinterest,Pinterest 是根据像素决定分类,我们是根据图义来分类的。它能自动把每个类别的上下文拉过来,比如「这是什么亚热带的什么虫,它跟你收藏里的某个虫是同一个产地的」。Memory 部分的使用时长越来越多,使用时长多的用户留存极高。

    Founder Park:现在有一批人群在高频使用这个产品,你们会把它定义成 AI 时代的一款社交产品吗?


    曾熙: 社交可能是它的某一个过渡态,因为它确实能帮助相同兴趣的人连接到一起。这是我们很开心看到的,现在很多人在社交平台上大部分内容是被动接收的,算法决定了你看到什么。但我们更鼓励的是,先主动去发现真实世界里的东西,然后我帮你找到也喜欢这个东西的人,你们之间产生交流。

    在这个阶段,社交不是我们最重要的东西,可能用户达到 100 万之后,社交会形成一个很重要的形态。

    Founder Park:你们会怎么看待这批用户对 Chance AI 的定位?


    曾熙: 渐渐地它会变成一个习惯。我们想培养的是用户习惯,当他未来想到要看什么的时候,先想到和 Chance AI 一起看。我们希望在这个阶段尽量多地让他们给我们反馈,无论是产品上的、数据上的还是模型能力上的,有了这种反馈我们的飞轮才能转起来。

    对我们来讲最宝贵的是「和 AI 一起看世界」这个行为,在手机上它是不太自然的,但到了下一个时代的 AI 终端,它就会变得非常自然。想象一下你戴着 Ray-Ban Meta Glasses,很自然地问你「你怎么看那个?」AI 因为很懂你,「我觉得你穿那个不好看,你家里已经有个类似的了,再买很多余。但刚刚那个我觉得挺好看的,你怎么不考虑一下?」就开始跟你聊。这个场景就很自然了。

    08 Visual Agent 最终会成为一个新的操作系统

    Founder Park:在下一阶段,AI 硬件天然就有视觉入口,甚至 Visual Agent 本身也能成为一个新的 AI 入口。你觉得这件事真正发生,还需要哪些条件?


    曾熙: 这个问题我们也经常在思考。首先能确定的是,未来 AI 硬件的终端形态一定是和用户一起看世界,根据你看到的东西来进行交互, 这是确定的,不确定的是时机。

    我们认为目前的卡点在三个地方。第一是基础技术,VLM 今天已经有了,但还没办法做到超级实时,或者在很低成本的情况下瞬间完成电影里那种感觉,这部分我们一直在关注,也一直在等待;第二是硬件供应链的成熟,目前我们判断还没到爆发的周期。即使 Meta Glasses 已经卖了 200 万台,但离真正成为每个人日常使用的、像手机一样级别的产品,还有一定距离;第三是用户习惯,用户有没有养成和 AI 一起看世界的新习惯。年轻用户其实已经有了,但要扩展成大众市场,主要还是看那群习惯了文本交互的用户,他们切入视觉交互会不会有阻碍。

    这三个考虑点是我们正在观察的。我们很开心地看到这件事其实已经正在发生了,只是近还是远,现在还在观察中。

    Founder Park:你觉得 Visual Agent 最终会是一个什么形态?硬件、操作系统、还是 APP?


    曾熙: 我们理解它一定是一个操作系统,就是电影《Her》里的那个 Samantha。


    Founder Park:如果最终形态是操作系统,会不会更依赖于 LLM 的智力提升?


    曾熙: LLM到今天已经很成熟了,基本没有什么卡点。反而要回到生活场景上,是有困难的,Claude Code 很难帮你一起去买一个雪糕,或者跟你一起看落日。生活场景,才是大众市场的最主要场景。

    我们的判断是:今天文本场景很成熟,很多大厂在里面解决基础问题。反而是文本之上的视觉层面,目前还没什么人看到,也没什么人在上面努力。

    Founder Park:Visual Agent 和 ElevenLabs 这样的 voice agent,是什么关系?


    曾熙: 互补。我相信最终是没有模态之间的区分的。对用户来说,不会分什么是文字、什么是语音、什么是图片,最终都会混合成为一个正常的输入输出系统。有点像看电影,你不会在意是声音让你笑还是台词让你笑。

    Founder Park: 那未来你们会做硬件吗?


    曾熙: 迟早会做。做硬件对我们团队来说反而是舒适区,供硬件产品定义、软硬结合用户体验、全球市场产品 GTM、生命周期管理等,团队有丰富经验。难的是现在这个阶段,先把这一套视觉思考的大脑搭建好。比如 Meta Glasses 你现在戴着看黑色水壶问「这是什么?」,它跟你说「这是一个黑色的圆柱形物体」,这是无用信息。它们离真正的价值差得太远了。

    09 FOMO 的是效率不够快,而不是终点方向

    Founder Park:现阶段,Chance AI 的竞品是什么?


    曾熙: 如果一定要选的话可能有三类:第一类是上一个时代的各种垂类识别软件,植物、花鸟那种,技术上的竞品;第二类是入口型产品,像 Google Lens 这种;第三类可能是 AI 硬件,像 Looki 这种 Always-on 的设备。

    我们最关注的还是入口型产品。我们希望用户拿起摄像头的时候,最先想到的是用我们。如果他拿起摄像头用了别的 App,那个 App 就会被我们视为潜在竞品。

    Founder Park:你们自己核心的壁垒是什么?或者说别人做不到、你们跑得更快的是什么?


    曾熙: 前边也提到了。我们离用户很近,这种「敏感度」是我们现在最大的护城河。我们有能接住用户的工程能力,有把在美国真实生活的年轻人每天的需求转化为功能的流程,有跟他们直接沟通的渠道和分发能力。有了这些以后,我们就有自己的飞轮,Harness Engineering 的飞轮。

    Founder Park:作为创业者,你今年会 FOMO 吗?


    曾熙: 只要在这个行业里就会 FOMO,因为变化太快了。三个月前你讲 OpenClaw,可能没人知道是什么,现在全民 OpenClaw,这也是让人兴奋的地方。

    我们可能会 FOMO 一些技术实现的效率、对工具的选择,这个很常见,我们很害怕自己正在使用的工具不是世界上最先进的。

    但在产品方向上我们是很有自信的。我们认定视觉这件事很直觉,人类跟世界就是这么交互的,这不是这几年的事情,是好几百万年的事情,这是不变的。变的是怎么让速度加快、怎么让它发生。我们担心的是,如果实现效率不够快,可能站在船头的人就不是我们了。

    Founder Park:所以还是会有各种技术、效率上的焦虑?


    曾熙: 在 How 上面是有焦虑的,但在 Why 上面是没有的。我们现在很确定一定会在牌桌上,只是不确定是牌桌的上位还是下位。


    阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

    24 年原公司给出两种选择,裁员或转外包,作为补偿底薪+1500 绩效+400
    25 年以外包公司倒闭为由,转入另一家外包公司
    25 年年底,原公司注销,原公司业务归入原公司的母公司。
    今天,通知,当初转入外包的补偿从下月取消。

    查询了半天发现进入死循环了
    投诉原公司,原公司已注销
    找外包公司,外包公司啥也不知道
    找母公司,母公司表示不接受就退回外包


    6 年时间从 20 多岁到了 30 多。
    以前我性格还是很温和的,
    但现在,我有一种强烈的冲动,找个老式的公厕淘点恶堵物,浇到区域总的头上

    Github Copilot Pro 的 Claude Opus 4.6 熄火了, 天才程序员一夜陨落.
    39.9$ 7.5x 4.7 冲不冲,兄弟们. 过几天浑身蚂蚁爬的时候我怕忍不住.