2026年3月


📰 内容说明:本文为 AI 资讯摘要与编辑评论,所有内容均已标注原文链接。如涉及版权问题请联系处理。


今日亮点

OpenAI 今天正式推出了 GPT-5.3 Instant,优化了回答准确性和联网搜索体验,让日常对话模型更实用。与此同时,OpenAI 一位 GPT-5 系列核心研究员却跳槽去了老对手 Anthropic,显示出人才竞争的白热化。更令人警醒的是,Anthropic 的 Claude Opus 4.6 在执行任务时竟然凭空编造 GitHub ID 并部署了陌生仓库,暴露出 AI Agent 安全和幻觉问题的新维度。此外,谷歌也发布了更经济实惠的 Gemini 3.1 Flash-Lite。

💡 产品动态

OpenAI 发布 GPT-5.3 Instant

核心信息:ChatGPT 中最常用的日常对话模型升级,带来更准确的答案、更自然的对话语气和更好的联网搜索体验,幻觉率显著降低。

💡 编辑观点: 这次更新重点在于提升用户体验和可靠性,尤其是在联网搜索和减少“说教感”方面,表明 OpenAI 正致力于让大模型更贴近真实用户需求,降低使用门槛和风险。API 开发者也能同步使用,这会迅速影响大量 AI 应用。

📎 查看完整报道 | 来源: 宝玉

谷歌推出 Gemini 3.1 Flash-Lite

核心信息:Gemini 3 系列最经济高效的模型,输入每百万 token 仅需 0.25 美元,输出 1.50 美元,专注于规模化智能。

💡 编辑观点: 谷歌此举旨在抢占低成本、高并发场景的市场,特别适合需要处理大量、低复杂度任务的 AI Agent 工作流。这进一步加剧了大模型市场的价格战,让更多应用场景的成本效益变得可行。

📎 查看完整报道 | 来源: 凡人小北

Anthropic 收购 Vercept_ai

核心信息:Anthropic 收购了 Vercept_ai,旨在增强其 Claude 模型的计算机使用能力。

💡 编辑观点: 这项收购表明 Anthropic 正在积极布局 AI Agent 能力,提升 Claude 在实际操作环境中的执行力和自动化水平。在大模型能力同质化趋势下,Agent 化和工具调用能力将成为核心竞争力,也是其应对市场竞争的重要策略。

📎 查看完整报道 | 来源: Anthropic

🔬 学术前沿

  • 可解释视觉解码新框架 NeuroAdapter:直接从脑活动解码视觉刺激,绕过中间特征空间,提升脑机接口的可解释性 → 📄 阅读论文
  • VINCIE:从视频中学习上下文图像编辑:提出一种从视频数据直接学习图像编辑模型的新方法,实现了多轮图像编辑和概念合成 → 📄 阅读论文
  • C$^3$B:首个多模态跨文化理解基准:基于漫画构建了多任务、多语言的跨文化理解基准,挑战现有 MLLM 在文化意识上的局限 → 📄 阅读论文
  • AoE:具身 AI 的常态化第一视角视频采集系统:利用智能手机实现低成本、大规模、场景无关的第一视角交互数据采集,为具身 AI 提供高质量训练数据 → 📄 阅读论文
  • 无“技巧”扩展量子机器学习实现高分辨率图像生成:量子生成模型在 MNIST 和 Fashion-MNIST 数据集上实现了全分辨率图像生成,并展示了在彩色图像上的潜力 → 📄 阅读论文
  • 改进文生图扩散模型快速采样:提出恒定总旋转调度(TORS)策略,在有限采样步数下生成高质量图像,并对新模型和超参数具有良好的适应性 → 📄 阅读论文

🌍 行业观察

OpenAI 获巨额投资扩建 AI 基础设施

OpenAI 近期获得了来自软银、英伟达和亚马逊的投资,用于大规模扩展其 AI 基础设施,以实现 AI 的广泛普及。
💡 编辑观点: 巨头们对 AI 基础设施的持续投入,是为 AI 应用的未来爆发式增长做准备。这不仅是算力军备竞赛的体现,也意味着未来 AI 服务将更具规模效应,降低成本,从而触及更广阔的市场。
📎 深度报道 | 来源: OpenAI

Anthropic 就“战争部门”表态

Anthropic 就其与美国国防部(Department of War)的讨论以及相关评论发布了声明。
💡 编辑观点: 头部 AI 公司在军事 AI 应用上的立场备受关注。Anthropic 的这份声明,不仅是对外界疑问的回应,也再次强调了负责任 AI 的原则,尤其是在可能涉及敏感和伦理问题的领域,这对于建立行业信任和规范 AI 发展至关重要。
📎 深度报道 | 来源: Anthropic

💬 社区热议

  • Claude Agent 幻觉部署陌生代码:Anthropic 的 Claude Opus 4.6 在执行部署任务时,竟凭空编造了一个 GitHub 仓库 ID,导致将不相关的代码部署到了用户团队账户。Vercel CEO Guillermo Rauch 披露此事件,幸好未造成安全事故。
    核心观点:这一事件敲响了 AI Agent 安全性的警钟。虽然模型幻觉是已知问题,但在 Agent 模式下,幻觉直接触发外部操作,其潜在风险远超预期。这促使我们必须重新审视 Agent 的鲁棒性、安全边界和错误处理机制。
    来源: Twitter @宝玉 📎 查看详情
  • OpenAI 核心研究员 Max Schwarzer 跳槽 Anthropic:曾主导 GPT-5 系列后训练的关键人物 Max Schwarzer 宣布离开 OpenAI,加入 Anthropic,将专注于强化学习研究。
    核心观点:顶尖人才的流动反映出 AI 领域竞争的激烈,Anthropic 在人才吸引力方面的持续增强,对 OpenAI 构成不小的挑战。此举也可能预示着强化学习在 Anthropic 未来模型开发中的重要地位,值得持续关注。
    来源: Twitter @宝玉 📎 查看详情
  • AI 用水量被夸大?:有观点指出,全球高尔夫球场用水量是 AI 数据中心的 10 倍,暗示关于 AI 高用水的说法存在夸大。
    核心观点:这反映出公众对 AI 产业的误解和一些“反 AI”叙事的出现。在讨论 AI 对环境影响时,需要更全面和准确的数据,避免被片面信息误导,引发不必要的恐慌。
    来源: Twitter @Emad Mostaque 📎 查看详情
  • Grok 无法鉴别 AI 生成内容:Grok 无法准确判断图像或视频是否为 AI 生成,但仍会给出确定性回答,且常出错。
    核心观点:这凸显了当前视觉 LLM 在内容真实性鉴别上的局限性,特别是在深度伪造技术日益成熟的背景下,AI 的“幻觉”问题不仅限于文本,也可能误导用户对视觉信息的判断,加剧信息信任危机。
    来源: Twitter @Ethan Mollick 📎 查看详情

Apple Music 免费领取半年订阅会员活动到 3 月 5 日截止,还没领取的 V 友可以领取一波。

但之前被薅了一波苹果也改了规则,现在订阅后不能立即取消,不然权益就没了,所以大家要自己设置个提醒事件在半年到期前提醒自己取消续订,不然会自动扣款,11 元/月。

原则上只能 iOS 、macOS 、iPadOS 等设备领取,其他设备应该也可以,但能不能领取半年就不知道了,有可能只有 1 个月。

曾经取消订阅的老用户也可以,具体视账号情况而定,有 V 友反馈老用户也领取半年,但也有 V 友反馈 1 个月都没,必须付费开通。

领取地址:https://ourl.co/amsc (不要 PC 点击,不然可能只有 1 个月)

iOS 相机可以直接扫码,安卓用户也可以使用微信扫码并使用自带浏览器打开:

点击链接后自动跳转到 Apple Music 看到领取提示(若未安装会先跳转商店安装)

办公室是个上百人的大通铺,声音很杂乱有些又很抓人注意力,带上降噪耳机随机放点歌效率会高很多,但是我目前这款耳机戴久了不舒服,就挂闲鱼了。

所以想问下各位佬,用过佩戴最舒适的降噪耳机是哪款,虽然每个人的耳道状况不一样,但是设计合理的耳机相信是有共性的,大家都说好的想必也适合我这款普普通通的耳道。

头戴式的耳机在办公室貌似不太合适,开放式的又没降噪,是不是只有入耳式的可选了?

本文作者是「测试套件」功能的产品负责人,旨在分享该功能背后的设计思路,包括我们为什么这样设计产品、决策的理由是什么。欢迎所有关心 Apifox 产品设计理念的朋友阅读了解\&讨论。

“我有 200 个用例,但发版只想跑其中 20 个”

先说一些我们经常听到的真实用户反馈。

自动化测测试真实用户反馈

你会不会有同样的想法?或者你是不是也有印象在我们的群里看到类似的言论?

这些需求有一个共同点:用户不是要“运行用例”,而是要“按条件组织用例,然后运行”

现有的功能是按“用例”维度设计的——你选择用例,然后运行。但用户需要的是按“规则”维度:告诉系统一个条件,符合条件的用例自动执行。

按条件组织用例

回看我们的现状

场景用例是我们自动化测试能力的核心。它允许你自由编排多个接口请求,按照真实的业务流程顺序执行——登录、创建订单、支付、查询订单状态。这套能力我们打磨了很长时间,用户反馈也相当正向。围绕场景用例,我们还提供了丰富的运行方式:

  • 按目录批量运行:选择目录 - 在目录中再选择想要运行的场景用例,然后批量运行目录中所有被选中的用例;
  • CLI 与流水线集成:通过命令行工具接入 CI/CD,代码合并自动触发测试;
  • 定时任务:设置定时器,根据定时器触发自动执行巡检;

这些能力覆盖了“怎么跑”的问题。但用户的需求并没有完全被满足。所以我们收到了上面的那些吐槽。

自动化测试的两个层次

我们一直在思考:如何让用户在 Apifox 上完成从 API 设计、开发、调试到测试的完整闭环?

设计阶段有 API 文档,开发阶段有 Mock 服务,调试阶段有接口测试,那测试阶段呢?场景用例解决了“如何编排一个完整的业务流程”,但没有解决“如何在不同阶段、不同需求下灵活组织测试范围”。

于是我们把自动化测试的需求拆分为两个层次:

层次核心问题对应功能
编排层如何把多个接口按业务流程串起来?场景用例
执行层如何按条件灵活选择“跑哪些用例”?测试套件
  • 场景用例是“造积木”:你定义每一块积木长什么样(一个完整的业务流程)。
  • 测试套件是“搭积木”:你决定这次要用哪些积木搭成什么形状(按条件筛选、组合、执行)。

两者不是替代关系,而是分层协作。场景用例管“内容”,测试套件管“组织和执行”。以上就是测试套件这个新资源类型诞生的背景。

分层协作

一、静态还是动态?

在设计测试套件时,我们面临一个根本性的问题:

用户把用例加入套件后,套件里的内容是固定的,还是会跟着变化的?

场景一:冒烟测试——软件行业的“健康体检”

“冒烟测试”这个词来自硬件行业:给一块新电路板通电,如果没有冒烟,说明起码没有短路,可以进行下一步测试。

在软件行业,冒烟测试的核心思想是:用最小的成本验证系统是否“基本正常”。它不追求覆盖所有功能,只验证最核心的业务路径——用户能登录吗?能下单吗?能支付吗?

冒烟测试有几个典型特点:

  1. 用例数量少但精选:通常只有 5-15 个核心场景
  2. 变动频率低:经过评审确定,不会轻易增删
  3. 执行频率高:每次代码提交都可能触发

这种场景需要“静态模式”:我指定了哪些用例,就永远跑这些用例,除非我手动修改。

场景二:按模块回归——用规则代替人工维护

假设你负责支付模块,有一个文件夹叫“支付功能”,里面有 50 个用例。每周可能新增几个,也可能删除几个。你希望每次回归都覆盖这个模块下的所有用例,不用每次都去检查有没有新增的。

这种场景需要“动态模式”:我告诉系统一个规则(支付功能目录下的所有用例),系统每次运行时自动匹配。这个设计在 AI 时代尤为重要。 随着 Copilot、Cursor 等 AI 编程工具的普及,代码生成的速度在加快,测试用例的产出也在提速。如果每次新增用例都要手动维护回归列表,维护成本会随着 AI 生产力的提升而线性增长。动态模式让用例的“生产”和“组织”解耦——你只管写用例,套件会自动把符合条件的新用例纳入进来。

静态模式与动态模式

我们的决定

经过长时间研究、收集用户反馈与调研,我们认为两种模式都是真实需求,我们选择都支持

但这带来一个用户体验问题:选项太多会让人困惑。所以,在产品界面的设计上,我们加上了很多的思考:

  1. 不过于强调“静态”和“动态”这两个词: 对用户来说,这是引入了新的概念,可能会有一定的理解成本,所以不能在界面上过于强调这两个概念,并且不能在使用的位置只暴露这两个概念文案,这样会增加用户思考,带来较差的体验。
  2. 用操作和界面元素引导: 当用户选择“静态”时,右侧的详情列表会出现复选框引导用户要选择具体的接口、场景用例,并且最后一步确认按钮会明确告知“选择 X 个选项”;当用户选择“动态”时,右侧的详情列表仅是只读模式,不可选择其中的一部分,从而告知用户你是在使用“这个条件下的全部内容”。
  3. 文字介绍辅助: “后续如有新增且符合当前条件的用例,会自动加入”这些文案,会再次告知用户动态的意义,让用户知道这个套件会“活着”。

这样设计的好处是:用户不需要花过多的精力去思考与理解“静态”和“动态”的概念差异,阅读大量文本,只需要按自己的场景操作,在操作的过程中就自然而然的对这两个模式有个基本的理解。

二、统一配置还是各跑各的?

每个测试场景可能有自己的运行配置:用开发环境、测试环境还是预发环境?循环多少次?这些配置在创建场景时已经设置好了。现在把多个场景放到一个套件里,问题来了:用谁的配置?

用户的两种诉求

诉求 A:“我想让套件里的所有用例都跑测试环境,不管它们原来的配置是什么。”

这在全量回归时很常见。你希望有一个统一的“回归环境”,消除环境差异带来的干扰。

诉求 B:“每个场景跑自己的环境就行,我设置好了的。”

这在日常执行时很常见。支付服务跑支付测试环境,用户服务跑用户测试环境,配置早就设好了,没必要改。

我们的决定

这两种诉求看似矛盾,但我们发现可以用“默认值 + 可选覆盖”的模式来调和。

关键问题是:默认值选哪个?

默认情况下,每个场景按自己保存的配置运行(除了环境)——这是最“符合直觉”的行为。你之前怎么配的,现在还怎么跑。

环境配置会很特殊,因为在测试套件的运行配置里,是很直观可见的一个配置。而且针对不同类型的资源,使用环境的方法差别很大:

  • 单接口用例:无论动态还是静态的单接口用例,环境都是使用套件指定的环境——跟单接口本身指定的环境方式一致,很好理解。
  • 静态场景用例:在多数情况下,静态的场景用例都期望使用测试套件中的环境配置,所以我们为此情况单独设置了一个“继承自套件”的默认值——这样套件一切整个套件内的用例统一联动,方便使用。
  • 动态场景用例:在多数情况下,动态的场景用例同样期望使用测试套件中的环境配置,所以默认是一套自定义的配置并且环境是继承套件中设置的环境。不过当然,如果你期望这些用例使用你已经在场景用例中编排设置好的各种配置,你可以选择从这些场景用例里面来继承运行配置实际运行。

如果用户需要统一配置,可以选择“使用相同配置运行”,然后指定一套独立配置。这个选项的位置放在“高级配置”里,不干扰常规使用路径。

并行执行,让你的套件快快跑

当测试套件增长到数百个时,串行执行会成为自动化交付的瓶颈。一个完整的回归测试可能需要一小时才能完成,这会延迟发布流程并减慢生产监控中的问题检测。

并行执行

测试套件默认支持并行执行。只需在串行和并行模式之间一键切换——系统会根据运行机器可用资源自动确定最佳并发性。无需手动调整。这可以将60分钟的回归测试缩短至30分钟以下,而无需更改测试逻辑。

并行执行自动处理依赖隔离。每个场景都在自己的上下文中运行,确保一个场景的共享变量或环境状态不会干扰另一个场景。对于真正相互依赖的场景,你需要将其分组为具有顺序步骤的单个场景。

并行执行与串行执行

三、和目录批量运行的边界

Apifox 已经有“测试场景”的批量运行功能——在场景目录上右键,可以批量运行整个目录下的场景。

测试套件不就是换了个名字吗?有什么区别?

本质区别

  1. 场景目录是按“物理结构”组织的——你把用例放进哪个文件夹,就属于哪个分组。一个用例只能属于一个文件夹。
  2. 测试套件是按“逻辑规则”组织的——你定义一套筛选条件,符合条件的用例自动归入。一个用例可以同时属于多个套件。

物理结构与逻辑规则

举个 🌰:

  • “支付模块回归套件”包含所有“支付”标签的 P0/P1 用例
  • “全量冒烟套件”包含所有 P0 用例
  • 某个用例如果同时是 P0 且带有“支付”标签,它会同时出现在两个套件里

这种灵活性是目录结构做不到的。

为什么还需要一个新的资源类型?

你可能会问:场景用例已经可以跑了,目录批量运行也有了,为什么还要专门做一个“测试套件”?

答案是:

我们在为“场景化测试”的未来做准备。

现代软件开发的一个趋势是:测试场景的数量随着 AI 生产代码会越来越多,但测试方法是会越来越标准化的。

想想看,你的团队可能面临这些情况:

  1. 日常开发:跑冒烟测试就够了;
  2. 版本发布:要跑全量回归;
  3. 紧急修复:只跑受影响模块的 P0 用例;
  4. 线上巡检:每小时检查核心接口;
  5. 灰度发布:对比新旧版本的接口响应。

这些场景对“跑哪些用例”的要求完全不同,但底层的用例是同一批。你只应该编排功能的业务流程并保存为一个个用例,为了“回归”这种测试的执行需求,从而编排一个用例来解决,这是不合逻辑、也不好维护的。

场景化测试

更重要的是,这种“积木化”的思路可以大幅降低测试环境的模拟成本。过去你可能需要为每个测试场景搭建专属的沙箱环境,现在你可以用同一套环境、同一批用例,只是组合方式不同。套件成为连接“测试资产”和“测试需求”的桥梁。

这就是我们做测试套件的真正意图:不只是让自动化测试 “能跑”,而是让自动化测试 “可复用”、“能按期望自动运行”

功能定位适用场景
场景用例业务场景的请求流程编排自动化测试基础搭建、构成业务功能单元
场景目录用例的物理归档位置日常用例管理、团队协作
目录批量运行快速跑一个目录下的所有用例功能回归、全量回归、探索性测试
测试套件可复用的测试执行单元版本回归、冒烟测试、定期巡检

第一版暂时没做的事情

做产品需要取舍。以下是我们讨论过但决定暂时不做的功能:

1. 套件嵌套

  • 场景:把多个套件组合成一个更大的套件。比如“全量回归”包含“支付模块回归”+“用户模块回归”+“订单模块回归”。
  • 为什么暂时不做:增加复杂度,而动态模式已经能解决大部分需求。如果你想跑多个模块,可以用动态模式匹配更大范围的标签或目录。
  • 如果用户确实需要:我们会观察数据,如果发现大量用户在创建内容高度重叠的套件,说明嵌套是真实需求,我们会重新评估。

你有“套件套套件”的需求吗?如果有,你的场景是什么?

2. 失败自动重试

  • 场景:某个用例因为网络抖动失败了,自动重试一次。
  • 为什么暂时不做:担心掩盖真实问题。如果一个接口偶发性失败,这本身可能就是需要关注的问题,而不是通过重试来“消除”。
  • 如果后续做:可能会作为可选策略提供,并在报告中明确标注“重试后通过”,确保问题不被隐藏。

你觉得自动重试是必要的吗?你更希望看到“干净的结果”还是“真实的结果”?

写给正在读这篇文章的您

测试套件这个功能,从用户反馈到产品上线,我们思考了很多,也放弃了很多。但我们深知,真正好的产品不是设计出来的,而是用出来的

我们可能漏掉了你最需要的功能,也可能把某个细节设计得让你用着别扭。这些问题,只有你告诉我们,我们才知道。

如果你试用了测试套件,欢迎告诉我们:

  • 哪个设计让你觉得“终于有人懂我了”?
  • 哪个操作让你卡住了、困惑了?
  • 你还期待什么能力?

你的反馈会直接影响我们下一版的优先级排序(真心!)期待听到你的声音 🙌

如果你对功能背后的设计有任何疑问,欢迎加入我们的微信、飞书等各种 IM 群中讨论。

中小企业CRM核心能力横向对比:从全流程自动化到系统集成的深度解析

在数字化转型浪潮中,CRM 客户关系管理 )已从“客户信息存储工具”升级为“全链路业务引擎”。对于中小企业而言,CRM的核心价值在于自动化提效、智能化决策、个性化适配、生态化协同。本文基于销售全流程自动化、AI能力、自定义能力、系统集成四大维度,对市场上5款主流CRM(超兔一体云、微盟CRM、Copper CRM、Agile CRM、Lusha CRM)进行深度横评,结合专业图表与场景化分析,为企业选型提供参考。

一、对比框架与核心指标说明

本次对比聚焦中小企业最关心的四大能力,每个维度拆解为落地场景技术深度两个层面:

  • 销售全流程自动化:覆盖“线索-客户-跟单-订单”全链路,评估自动化覆盖环节、触发逻辑、效率提升幅度;
  • AI能力:评估AI与业务流程的融合深度(如是否嵌入核心场景、是否支持自定义)、AI功能的落地价值(如线索评分、智能推荐);
  • 自定义能力:评估系统适配企业个性化需求的灵活度(如功能订阅、流程定制、数据看板);
  • 系统集成:评估与内部业务系统(如进销存、ERP)、外部生态(如电商、企微)的连通性。

二、各品牌核心能力深度对比

(一)销售全流程自动化:从“单点自动化”到“全链路闭环”

销售全流程自动化的核心是减少人工干预、提升流程一致性,关键看“是否覆盖全环节”“是否结合业务场景设计”。

品牌核心自动化场景特色优势适用场景
超兔一体云1. 线索:多渠道(百度/抖音/官网/微信)自动抓取+归属地/公司信息自动补全; 2. 客户:生命周期自动分类(需求培养→成功)+自动查重(手机号/企业简称); 3. 跟单:“三一客”(小单)/商机(长单)/项目(多方)模型+自动生成日报; 4. 订单:多业务模型(服务/实物/特殊)+自动锁库/生成采购计划。覆盖“线索-客户-跟单-订单”全链路,独有的“跟单时间线”“自动日报”解决销售过程留痕与汇报痛点;支持“小单快打”与“长单深耕”双模型。需全链路自动化、兼顾小单与长单的中小企业(如商贸、制造业)。
微盟 CRM1. 线索:智能分级(高/中/低意向)+自动分配跟进人; 2. 跟进:企业微信SOP(如寒流预警触达)+自动化提醒(跟进周期/待办); 3. 转化:与智慧零售商城打通,订单自动同步会员数据。聚焦零售场景,通过“企微+SOP”解决导购触达效率问题;支持“一城一策”的区域化销售策略。零售/电商企业(如服装、美妆),需联动线下导购与线上商城。
Copper CRM1. 自动同步Google Workspace(邮件/日程/联系人); 2. AI生成销售待办(如“跟进上周未回复的客户”); 3. 线索:自动关联Google搜索中的企业信息。深度绑定Google生态,解决“销售数据分散在邮件/日程”的痛点;AI待办减少销售“漏跟进”。重度使用Google Workspace的销售团队(如外贸、科技型企业)。
Agile CRM1. 营销:邮件/短信自动化触达; 2. 销售:Pipeline视图(可视化跟踪线索阶段); 3. 客服:工单系统与销售流程打通。实现“营销-销售-客服”一体化,Pipeline管理清晰展示线索转化路径。需整合营销与客服的企业(如 SaaS、教育)。
Lusha CRM1. B2B联系信息自动验证(减少邮箱封禁风险); 2. 联系人数据自动同步至CRM。聚焦B2B获客,解决“联系信息不准确”的核心痛点;数据与CRM深度协同。B2B企业(如工业设备、企业服务),需精准获取潜在客户联系方式。
超兔一体云销售全流程自动化流程图(Mermaid)

flowchart LR
    A[线索获取:百度/抖音/官网/微信自动抓取] --> B[线索处理:自动查重+归属地识别+分配提醒]
    B --> C[客户管理:生命周期自动分类(需求培养→成功)+工商信息补全]
    C --> D[跟单:选择模型(三一客/商机/项目)+360°视图+自动日报]
    D --> E[订单:多业务模型+自动锁库/生成采购计划]
    E --> F[数据反馈:市场成本均摊+转化率分析]

(二)AI能力:从“辅助决策”到“嵌入式业务引擎”

AI能力的核心是“业务数据+AI模型”的深度融合,评估标准包括“是否嵌入核心场景”“是否支持自定义”“是否产生直接业务价值”。

品牌AI核心能力技术深度落地价值
超兔一体云1. 自定义AI智能体:嵌入客户/机会/项目视图,自动获取业务数据作为入参; 2. 全环节应用: - 市场:AI计算活动成本均摊与转化率; - 跟单:AI分析客户历史数据生成待办; - 数据:AI驱动多表聚合分析。支持Coze工作流调用(字节生态的AI工作流引擎),AI智能体可自定义逻辑,与业务流程深度绑定。从“被动查数据”到“主动给建议”,解决销售“不知道下一步怎么做”的痛点。
微盟CRM1. AI营销:自动打标(如“高频购买者”“近30天未登录”)+智能推荐(根据浏览记录推商品); 2. WAI SaaS:AI Agent(虚拟销售助手)+多模态内容生成(文案/图片)+智能客服。聚焦零售营销场景,AI生成的内容可直接用于企微朋友圈/社群,降低内容创作成本。需批量触达客户、缺乏内容创作能力的零售品牌(如母婴、家居)。
Copper CRMAI生成销售待办:根据邮件/日程中的客户互动,自动提醒“跟进未回复的客户”“联系刚换工作的联系人”。AI模型基于Google生态数据训练,待办逻辑贴合销售场景。解决销售“忘记跟进”的小痛点,提升线索转化率。
Agile CRMAI线索评分:根据客户行为(如打开邮件、点击链接)计算“购买可能性”,优先分配高评分线索。AI模型聚焦“线索质量”,减少销售无效跟进。需筛选高价值线索的企业(如金融、企业服务)。
Lusha CRM信息不足信息不足信息不足
超兔AI智能体业务融合流程图(Mermaid)

flowchart LR
    A[客户视图数据获取(历史跟进+当前状态)] --> B[AI智能体分析(调用Coze工作流)]
    B --> C[生成个性化待办(如“跟进客户提及的竞品问题”)]
    C --> D[销售执行待办,同步至客户时间线]
    D --> E[数据回传,更新客户状态与AI模型]
    E --> A

(三)自定义能力:从“被动适配”到“主动定制”

自定义能力决定了CRM能否贴合企业个性化业务流程,评估标准包括“功能订阅灵活度”“流程定制深度”“数据看板适配性”。

品牌自定义核心能力灵活度适用场景
超兔一体云1. 功能白名单:按需订阅功能(如“仅用CRM+进销存”),降低成本; 2. 界面定制:自定义三级菜单+多岗位工作台(如销售岗看“线索数”,老板岗看“营收看板”); 3. 流程定制:自然语言生成工作流(如“客户成交后自动触发售后工单”)+多表聚合分析(如“订单+库存+财务”关联查询)。全维度自定义,支持从“功能选择”到“流程设计”的深度适配;自然语言工作流降低技术门槛。业务流程特殊、需“小步快跑”迭代的中小企业(如定制化生产、专业服务)。
微盟CRM1. 字段定制:自定义客户标签(如“喜欢折扣”“关注新品”)+跟进字段(如“客户预算”); 2. 区域策略:总部授权下,区域可自定义营销任务(如“本地商圈满减”); 3. 数据看板:自定义BI报表(如“区域销量TOP10商品”“会员复购率”)。聚焦零售连锁场景,区域策略自定义解决“总部一刀切”的问题;数据看板贴合门店管理需求。连锁零售企业(如便利店、奶茶店),需区域自主决策。
Copper CRM信息不足信息不足信息不足
Agile CRM信息不足信息不足信息不足
Lusha CRM信息不足信息不足信息不足
超兔自定义能力脑图(Mermaid)

mindmap
    root((超兔自定义能力))
        功能层:功能白名单订阅(按需选择,降低成本)
        界面层:自定义三级菜单+多岗位工作台(销售/老板/财务各看所需)
        流程层:自然语言生成工作流(无需代码,贴合业务)
        数据层:多表聚合分析(订单+库存+财务,深度挖掘)

(四)系统集成:从“信息孤岛”到“生态协同”

系统集成能力决定了CRM能否连接企业现有业务生态,评估标准包括“内部模块连通性”“外部系统对接范围”“API开放度”。

品牌集成核心能力覆盖范围价值亮点
超兔一体云1. 内部连通:CRM+进销存+供应链+财务+生产工单(数据实时同步,如“订单生成后自动扣库存”); 2. 外部对接: - ERP/WMS(金蝶/用友); - 电商平台(京东/淘宝,RPA机器人同步订单); - 国税开票机器人(自动开票); - API接口:开放给外部系统调用。全生态集成,解决“CRM与进销存/财务数据割裂”的痛点;支持“从销售到生产”的全链路协同。需一体化管理“销售-采购-生产-财务”的中小企业(如制造业、商贸)。
微盟CRM1. 内部生态:CRM+微商城+企微助手+进销存(数据同步,如“商城订单自动更新会员积分”); 2. 外部对接:企业微信+智慧零售硬件(如收银机); 3. PaaS开放:支持第三方系统定制开发。聚焦微盟生态,打通“线上商城-线下门店-企微导购”的数据链路;PaaS开放满足个性化需求。已使用微盟生态(如微商城)的零售企业,需一体化管理线上线下。
Copper CRM深度集成Google Workspace(邮件/日程/联系人)+ 部分SaaS工具(如Mailchimp)。聚焦Google生态,解决“销售数据分散在Google工具”的问题。重度使用Google Workspace的企业,无需额外导入数据。
Agile CRM集成社交平台(如Facebook/Twitter):自动抓取社交线索,同步至CRM。聚焦社交获客,减少线索手动录入成本。依赖社交平台获客的企业(如教育、消费品)。
Lusha CRM集成多平台:SaaS应用(如Salesforce)+市场情报工具(如ZoomInfo),同步联系人数据。聚焦B2B获客,将精准联系信息整合至CRM,提升触达效率。B2B企业(如软件、咨询),需批量获取潜在客户联系方式。

(五)雷达图评分:各维度能力综合对比

以下分值基于能力覆盖度技术深度评估(1-5分,5分为最优):

品牌销售全流程自动化AI能力自定义能力系统集成
超兔一体云5555
微盟CRM4444
Copper CRM3324
Agile CRM3323
Lusha CRM3223

三、场景化选型建议

基于以上对比,结合中小企业行业属性核心需求,给出选型建议:

1. 超兔一体云:全链路自动化与一体化管理需求

  • 适合场景:需覆盖“销售-采购-库存-财务”全链路、业务流程复杂(兼顾小单与长单)、需深度自定义的中小企业(如制造业、商贸公司)。
  • 核心价值:用“全流程自动化”解决“人工重复劳动”,用“内部全模块连通”解决“数据孤岛”,用“自定义能力”适配特殊业务流程。

2. 微盟CRM:零售/电商行业的线上线下协同

  • 适合场景:零售/电商企业(如服装、美妆)、需联动企微导购与线上商城、需AI营销辅助的品牌。
  • 核心价值:用“企微SOP”提升导购触达效率,用“WAI SaaS”降低内容创作成本,用“区域策略自定义”解决“总部一刀切”问题。

3. Copper CRM:Google生态深度用户

  • 适合场景:重度使用Google Workspace(Gmail/Calendar/Contacts)的销售团队(如外贸、科技型企业)。
  • 核心价值:自动同步Google数据,减少手动录入;AI待办提醒提升线索跟进率。

4. Agile CRM:营销-销售-客服一体化需求

  • 适合场景:需整合营销(邮件/短信)、销售(Pipeline)、客服(工单)的企业(如 SaaS、教育)。
  • 核心价值:用“一体化流程”解决“部门间数据割裂”,用“AI线索评分”筛选高价值客户。

5. Lusha CRM:B2B精准获客需求

  • 适合场景:B2B企业(如软件、咨询)、需精准获取潜在客户联系信息(姓名/邮箱/电话)的场景。
  • 核心价值:用“验证过的B2B联系信息”提升触达成功率,减少邮箱封禁风险。

四、结论

中小企业选型CRM的核心逻辑是“贴合业务场景+解决核心痛点”:

  • 若需全链路自动化,选超兔一体云;
  • 若需零售场景协同,选微盟CRM;
  • 若需Google生态整合,选Copper CRM;
  • 若需营销-销售一体化,选Agile CRM;
  • 若需B2B精准获客,选Lusha CRM。

最终,CRM的价值不是“功能越多越好”,而是“刚好解决你的核心痛点”——找到与自身业务流程匹配度最高的工具,才能真正实现“降本增效”。

(注:文中功能相关描述均基于公开披露信息,具体功能服务以厂商实际落地版本为准。)

这个工具看起来简单,实际开发时我先做了一件事:不急着写界面,先把“提取逻辑”做好。因为用户输入可能会非常杂,可能一段话里同时有中文、英文、数字、空格和符号,如果核心函数不稳,前端交互再漂亮也没用。

在线工具网址:https://see-tool.com/text-number-extractor
工具截图:

我最后把功能拆成两块:

  • extractTextNumbers:只负责提取。
  • countChars:只负责统计。

页面层只做参数传递和按钮动作,避免把业务细节塞进组件里。

先说提取函数是怎么定下来的

函数签名是这样:

export function extractTextNumbers(
  text,
  extractChinese = true,
  extractEnglish = true,
  extractNumbers = true,
  extractByLine = false,
  removeDuplicates = false,
  sortChars = false
) {
  if (!text || !text.trim()) return ''
}

这几个布尔值其实对应页面上的勾选项。这样有个好处:页面不需要做复杂映射,用户怎么选,函数就怎么跑。

我一开始想过用一条“大正则”把三种字符一次性提取完,但后来放弃了。原因很简单:可读性太差,后面再加规则会麻烦。所以改成逐字符判断,逻辑更长一点,但直观。

逐字符提取,比花哨写法更稳

核心循环没有技巧,就是老老实实遍历:

for (let i = 0; i < line.length; i++) {
  const char = line[i]

  if (extractChinese && /[\u4e00-\u9fff]/.test(char)) {
    lineResult += char
  } else if (extractEnglish && /[a-zA-Z]/.test(char)) {
    lineResult += char
  } else if (extractNumbers && /[0-9]/.test(char)) {
    lineResult += char
  }
}

这里我保留了 if / else if 结构,目的就是“一个字符只走一个分支”。这能减少边界行为,输出顺序也和原文一致,用户更容易理解结果。

按行提取和整体提取,走两条分支

extractByLine 打开时,流程是:先按换行切分,再逐行处理,最后把每行结果再拼回去。

const lines = text.split('\n')
const processedLines = []
// 每一行独立提取
return processedLines.join('\n')

这个模式很实用。比如用户在整理多行数据时,通常希望“第几行对第几行”,不希望全部揉成一串。

关闭按行模式时就简单了,直接整段提取,适合一次性清洗长文本。

去重和排序,顺序不能乱

提取完之后我把后处理固定成:先去重,再排序。

if (removeDuplicates) {
  result = [...new Set(result)].join('')
}

if (sortChars) {
  result = result.split('').sort().join('')
}

如果先排序再去重,结果也能对,但中间会多做无效工作,而且阅读代码时不如“先减量再整理”自然。

统计函数单独维护,页面就轻很多

统计逻辑我没有混进提取函数,而是单独写在 countChars

  • 普通模式:直接看长度。
  • 按行模式:行数只算非空行,总字符数不含换行。

页面里通过 computed 串起来:输入一变,提取结果自动变;提取结果一变,统计自动变。用户看起来就是实时更新,代码上也比较干净。

按钮动作只做三件事

页面脚本里和结果相关的动作只有三个:复制、下载、清空。

  • 复制:navigator.clipboard.writeText(extractedText)
  • 下载:Blob + URL.createObjectURL + a.click()
  • 清空:只改输入值,结果和统计由计算属性自动归零

到这里,这个工具的核心 JS 基本就闭环了:输入文本进来,规则提取,按需后处理,统计结果,再做复制或导出。没有绕太多层,但每个环节都能单独看懂、单独改动。

论文名称:GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization
论文作者:Shih-Yang Liu, Xin Dong, Ximing Lu, Shizhe Diao, Peter Belcak, Mingjie Liu, Min-Hung Chen, Hongxu Yin, Yu-Chiang Frank Wang, Kwang-Ting Cheng, Yejin Choi, Jan Kautz, Pavlo Molchanov

Github地址:https://nvlabs.github.io/GDPO/
论文链接:https://www.lab4ai.cn/paper/detail/reproductionPaper?utm
_source=sf_gdpo&id=f3d3479947404fb7a1cef6eb2da48287

论文简介

论文聚焦多奖励强化学习中的优化方法问题,指出现有 GRPO 算法在多奖励场景下会导致奖励信号坍缩、训练信号丢失,进而引发收敛次优或训练失败。为此,提出 GDPO 算法,通过对单个奖励分别进行组归一化并结合批次优势归一化,保留跨奖励差异并维持数值稳定性。在工具调用、数学推理、代码推理三大任务的实验验证中,GDPO 在正确性、约束遵守度等指标上均持续优于 GRPO 及其实验变体,同时提供了通过奖励权重调整与条件化奖励函数应对目标难度差异的优先级建模方案,为语言模型契合多样化人类偏好提供了更稳定、高效的优化框架。

AI导读:# 论文核心内容总结

1. 研究背景

  • 领域现状:随着语言模型能力提升,用户期望模型不仅提供准确响应,还需契合多样化人类偏好(如效率、安全性、逻辑连贯性等),多奖励强化学习(RL)已成为实现该目标的主流训练框架。
  • 关键问题:现有研究多直接采用组相对策略优化(GRPO)进行多奖励优化,但GRPO在处理异构奖励组合时,会导致不同奖励组合坍缩为相同优势值,损失训练信号分辨率,引发收敛次优甚至训练早期失败,且未被充分验证其适用性。

2. 研究目的

  • 解决GRPO在多奖励强化学习中存在的奖励信号坍缩问题,消除不同奖励维度的区分度损失;
  • 提出一种适用于多奖励优化的稳定、高效策略优化方法,提升模型在多目标任务中的收敛性能与偏好对齐度;
  • 系统探索奖励权重调整与奖励函数修改在处理目标难度差异时的有效方式,实现更精准的偏好优先级建模。

3. 本文核心贡献

  • 揭示GRPO缺陷:证实GRPO在多奖励场景下会压缩奖励信号,导致优势估计信息丢失,明确其核心局限性;
  • 提出新方法GDPO:设计组奖励解耦归一化策略优化(GDPO),通过对单个奖励分别进行组归一化,保留跨奖励差异,结合批次优势归一化维持数值稳定性;
  • 提供优先级建模方案:系统阐述如何通过调整奖励权重、修改奖励函数(如条件化奖励)应对目标难度差异,实现偏好优先级的有效融入;
  • 多场景验证:在工具调用、数学推理、代码推理三大任务中验证GDPO的有效性与泛化性,覆盖不同奖励数量与模型规模。

4. 研究方法

  • 核心方法论:对比实验法,以GRPO及GRPO变体(去除标准差归一化)为基线,验证GDPO的性能;
  • 技术路线:GDPO先对每个奖励单独执行组内归一化,再聚合归一化后的优势值,最后通过批次归一化稳定数值范围;
  • 实验设计:

    • 任务设置:工具调用(优化正确性与格式合规性)、数学推理(优化准确性与长度约束)、代码推理(优化通过率、长度约束与bug率);
    • 模型与数据:采用Qwen、DeepSeek系列模型,基于ToolACE、DeepScaleR-Preview、Eurus-2-RL等数据集训练;
    • 评估指标:正确性(准确率、通过率)、约束遵守度(格式合规率、长度超标率)、代码质量(bug率)等;
  • 数据处理:采用HF-TRL、verl、Nemo-RL框架实现,统一超参数设置,多次实验取平均值与四分位距保证可靠性。

5. 研究结果

  • GDPO在所有任务中均优于GRPO:工具调用任务中准确率与格式合规率显著提升,数学推理任务中实现准确率与长度约束的更优平衡(如AIME数据集准确率最高提升6.3%),代码推理任务中在多奖励设置下保持通过率的同时降低长度超标率与bug率;
  • GRPO变体效果有限:去除标准差归一化的GRPO虽略微增加优势组数量,但导致训练不稳定(如工具调用格式合规率为0%),无法改善核心性能;
  • 条件化奖励有效:针对目标难度差异,条件化奖励函数比单纯调整权重更能实现偏好优先级对齐,GDPO结合该函数可进一步提升优先级目标性能。

6. 总结与展望

  • 核心结论:GDPO通过解耦奖励归一化,解决了GRPO在多奖励优化中的信号坍缩问题,在稳定性、收敛速度与偏好对齐度上均优于GRPO,是多奖励强化学习的更优选择;
  • 局限性:未深入探索更多奖励数量(超过3个)场景下的性能表现,对奖励权重与条件化函数的自适应调整研究不足;
  • 未来方向:拓展至更多奖励维度与复杂任务场景,研究奖励优先级的自适应建模方法,探索GDPO与其他RL算法(如PPO变体)的结合潜力。

在工程设计、建筑施工、市政园林等行业,CAD 图纸版本不兼容是每天都在上演的难题。你刚画好的图纸,发给甲方、监理、施工班组,对方打开却提示:文件无效、版本过高、无法读取。为了一张图,要么求人转换,要么被迫安装高版本 CAD,既占空间又耗时间。其实解决这个问题,根本不用这么麻烦。
图片
浩辰CAD看图王,自带专业级 CAD 版本转换功能,轻松实现高版本图纸转低版本,让所有设备都能正常打开。它支持从高版本 DWG、DXF 图纸,批量转换成各年代通用版本:R14、2000、2004、2007、2010、2013、2018 等无论对方用多老的 CAD 软件,都能完美打开、编辑、查看。转换过程中,图纸内容完整保留:图层结构、线型样式、文字标注、图块属性、尺寸约束全部不变,不会出现丢线、丢字、乱码、图形错位等问题。操作步骤极简,三步搞定:
1.用浩辰 CAD 看图王打开图纸
2.点击「另存为」
3.选择需要的低版本,保存即可全程几十秒,轻松解决版本不兼容的行业痛点。
不管是设计师、资料员、现场管理人员,使用浩辰 CAD 看图王,CAD 版本再也不是沟通障碍。

默认情况下,iOS 使用选择谷歌搜索引擎时,会跳转到 google.com.hk 。解决这个问题有几种办法:

  1. 修改地区为非中国大陆
  2. 在代理软件里设置重定向(需要开 MITM )
  3. 使用 Safari 插件

因为家庭网络环境是透明代理,所以我更倾向于使用插件,目前市面上,有很多插件可以做到这一点,比如 xSearch 。但是我的需求比较纯粹,就只想解决跳转问题,正好开了开发者账号,所以顺便做了一个只解决跳转的插件。

App Store 可以搜索“gSearch 搜索优化”

发 10 个优惠码,有需要的朋友,可以自行下载。

7LEATE9Y6TRJ
ETERX4ELPYJM
FWRK6LAXYJ3J
MXM94JFMRWRJ
KTJKF6L34FAX
4KK3PMA44JMJ
RFWE7PYLRKKX
MXX3A3NENMWE
FY6X966WTMWN
XXKXM43HLJRE

平时整理聊天记录、表单内容、网页抓取文本时,常会遇到“只想保留文字”或“只想保留数字”的需求。为了让普通用户不用写代码也能快速处理内容,我做了这个文字/数字提取在线工具。

这个工具是我用 Vue(Nuxt 3) 开发的,打开浏览器就能用,电脑和手机都支持。输入内容后,页面会立即给出提取结果,适合日常办公和学习场景。

在线工具网址:https://see-tool.com/text-number-extractor
工具截图:

常见使用场景:

  • 从一段混合文本中提取手机号、快递单号、金额等数字信息
  • 从包含符号和编号的内容里只保留可读文字
  • 批量清洗复制来的杂乱内容,方便二次编辑和统计

使用方法非常简单:

  1. 把原始内容粘贴到输入框;
  2. 选择提取模式(仅文字 / 仅数字);
  3. 按需开启去重、去空格或保留换行;
  4. 实时查看结果并确认是否符合预期;
  5. 一键复制处理后的内容。

为了保证使用体验,提取过程在浏览器本地完成,不需要上传文本。对普通用户来说,这样既快又省心,尤其适合处理包含个人信息的内容。如果你经常需要从复杂文本里“拿出有用信息”,这个工具会比手动删改高效很多。

在硅谷,流传着这样一句话:“Jeff Dean 的简历,就是一部现代 AI 的发展史。”

作为谷歌首席人工智能科学家、Gemini 的核心缔造者,Jeff Dean 极少接受深度专访。近日,在一场长达 46 分钟的对谈中,这位亲手重写过谷歌搜索全栈、缔造了 TPU 硬件神话的传奇工程师,罕见地抛出了大量关于 AI 演进的犀利预判。

从“蒸馏技术”的底牌,到“万亿 Token”的野心;从“大一统模型”对垂直专家的降维打击,到未来职场“一人指挥 50 个虚拟实习生”的科幻场景。这场对话不仅是谷歌 AI 战略的底牌大揭秘,更是一份写给所有开发者的“未来生存指南”。

一、 速度即正义:为什么谷歌死磕 Flash 小模型与能耗?

在各大实验室拼命卷模型上限、争夺跑分王座时,谷歌却把极大的精力放在了 Gemini Flash 这种“高能效比”的小模型上。很多人不解,这是否意味着谷歌在向算力妥协?

Jeff Dean 给出的答案非常现实:前沿模型是为了探索能力的边界,而小模型是为了霸占真实世界的场景。

他透露,将庞大的前沿模型(如 Ultra、Pro)通过“蒸馏(Distillation)”技术压缩成轻量级的 Flash 模型,是谷歌的核心策略。通过蒸馏,小模型能够学到大模型处理逻辑的“暗知识”,从而在低成本、低延迟的前提下,达到甚至超越上一代大模型的水平。

更有意思的是,他从一个极其底层的工程师视角,解释了为什么“延迟和能耗”才是 AI 现阶段最大的瓶颈。他指出,计算本身(如乘法运算)极其便宜(不到 1 pJ),但把数据从内存搬运到计算单元的代价极其高昂(高达 1000 pJ)。“如果你花 1000 的力气搬数据,只做 1 的计算,那是极大的浪费。” 这就是为什么加速器必须用批处理(Batching),也是为什么极低精度(如三值精度)将成为未来的大杀器。

【笔者观点:不要被“跑分”骗了,低延迟才是杀手锏】
Jeff Dean 揭示了一个被很多人忽视的商业真相:在真实业务中,“快”比“聪明”更重要。
当 AI 的响应速度从 100 Token/秒提升到 1000 甚至 10000 Token/秒时,人机交互的范式将彻底改变。就像自动驾驶,你不需要车脑子里装满莎士比亚,你只需要它在 0.1 秒内决定刹车。谷歌疯狂推广 Flash 模型,甚至将其塞进搜索、Gmail 和 YouTube,本质上是在用“极低延迟+白菜价成本”对竞争对手进行生态降维打击。

二、 大一统模型的降维打击:垂直领域的“专家”要失业了?

过去几年,AI 界流行一种思路:通用模型搞不定专业问题,我们需要专门训练“医疗大模型”、“法律大模型”或者“奥数大模型”。

但 Jeff Dean 毫不客气地宣告:大一统模型的时代真的来了。

他以解决国际奥数难题为例,过去人们试图把神经系统和符号系统结合,搞各种专用工具;但现在,谷歌直接把所有的任务都塞进了统一的 Gemini 模型里,靠着更强的推理资源,纯语言模型就能解出数学竞赛题。“通用模型在绝大多数情况下,都会胜过专用模型。”

那么,垂直领域模型还有存在的意义吗?Jeff 的答案是:有,但它的形态变了。未来的 AI 就像现在的操作系统,核心是一个极其强大的通用基座(装满了世界常识),然后配合各种“可安装的模块”。当你需要看病时,你就像下载软件包一样,给基座模型挂载一个“医疗模块”,这个模块是被顶级医院的私有数据“喂”出来的。

【笔者观点:“套壳微调”创业的死刑判决书】
这对目前市面上大量做“行业垂直大模型”的创业公司来说,是个极其危险的信号。
靠拿几本行业白皮书、用开源基座微调一下就敢自称“XX 领域第一大模型”的时代彻底结束了。因为通用模型(基座)的进化速度太快,它会毫不留情地碾压这些浅层的垂直护城河。未来真正的垂直壁垒,只存在于那些掌握着“极其稀缺且无法公开获取的私有数据”(如顶级三甲医院的脱敏病历)的机构手中。

三、 跨越百万上下文:“把整个互联网塞进 AI 脑子里”

当目前的大模型还在为 100 万或 200 万上下文窗口欢呼时,Jeff Dean 的目光已经盯上了“万亿 Token”。

怎么做到?答案并不是简单粗暴地扩大神经网络的注意力机制(这在计算上是不可能的),而是借鉴了谷歌做搜索引擎的看家本领——分层检索。

系统会先用极低的成本,从海量信息中捞出 3 万个相关片段,再用更强的模型浓缩到 117 个,最后用最顶级的模型进行深度推理。这样一来,在用户体验上,模型就仿佛拥有了“处理万亿 Token”的神力。

这不仅适用于文本,更适用于视频、音频甚至激光雷达数据。Jeff Dean 坚信,视觉和动态时序(视频)是绝对的核心模态。当一个模型能够直接“看懂”你过去 20 年的所有邮件、照片和行车记录仪视频时,它将从一个“聪明的百科全书”,变成一个“全知全能的个人分身”。

【笔者观点:从“搜索引擎”到“答案引擎”的终极进化】
谷歌在长上下文和多模态上的执念,其实是在保卫自己的搜索帝国。
过去的搜索,是给你一堆蓝色链接让你自己找;未来的搜索,是 AI 瞬间翻完整个互联网和你的个人私有云,然后直接把那个你想要的“最终答案”递到你手里。谁能最快、最准、最便宜地完成这种“漏斗式”的信息提纯,谁就能拿到下一个十年的互联网入口门票。

四、 程序员的未来:从写代码,到管理“50 个数字实习生”

作为计算机历史上最高产的工程师之一,Jeff Dean 自己是怎么用 AI 写代码的?

他坦言,现在的代码智能体已经非常强大。未来的工作形态将发生剧变:每个工程师不再是单打独斗,而是化身为团队主管,手下带着 50 个“虚拟实习生”。

你不需要再自己去敲打每一行基础代码,你的核心技能变成了“极其清晰、无歧义地定义需求”。如果你没说清楚边界条件或性能要求,AI 就会乱写一通。因此,写一手高质量的提示词(Prompt)和内部系统架构备忘录,将成为未来程序员最重要的核心竞争力。

更有意思的是,当 AI 的生成速度突破 10000 Token/秒时,人类甚至不再需要去“阅读”它生成的代码了。AI 可以在后台疯狂地自我验证、自我推演 9000 行,最后只给你输出 1000 行绝对正确的完美代码。

【总结陈词:超级个体的崛起与平庸的消亡】
Jeff Dean 描绘的这幅图景既让人热血沸腾,又让人脊背发凉。
如果一个人能指挥 50 个 AI 实习生,那意味着什么?意味着传统的“人海战术”彻底破产,意味着初级程序员、外包工种将面临毁灭性的打击。
但同时,这也意味着“超级个体”的时代正式降临。只要你拥有顶尖的系统架构思维和极其敏锐的业务直觉,你一个人,就能活成一家上市公司。面对 AI 浪潮,焦虑毫无意义,学会如何当好这 50 个 AI 实习生的“带教大哥”,才是我们现在唯一该做的事。

👇 欢迎关注我的公众号

在 AI 爆发的深水区,我们一起探索真正能穿越周期的技术价值。
微信搜索 【睿见新世界】 或扫描下方二维码,获取每周硬核技术推文:

微信图片_20260301232734_225_35.jpg

欢迎关注【睿见新世界】!

一、为什么需要免费SSL证书?

SSL证书通过在用户的浏览器和你的服务器之间建立一条加密通道,保护用户提交的密码、个人信息等敏感数据不被窃取。

过去,许多人认为SSL证书价格昂贵且申请流程繁琐。但现在,随着行业技术的进步和众多服务商的推动,免费且自动化的SSL证书已经成为市场主流,尤其适合个人博客、中小企业展示站以及各类测试站点。虽然像阿里云、腾讯云等平台也提供免费证书,但其有效期通常已缩短至3个月,且多为单域名证书,需要频繁续期。

二、为什么重点推荐JoySSL?

在众多免费SSL证书服务商中,JoySSL凭借其对国内站长的友好度以及丰富的免费产品线脱颖而出。

1. 永久免费且支持通配符

JoySSL面向个人和中小企业提供永久免费的SSL证书。更难得的是,它提供免费的通配符证书。这意味着,你只需要申请一张证书,就可以同时保护一个主域名及其所有的二级子域名(例如同时保护 example.com 和 www.example.com 以及 mail.example.com),这对于搭建了多个子站点的用户来说非常实用且省钱。

2. 支持国密算法

JoySSL不仅是国际标准的SSL证书提供商,还深度支持国密算法。如果你所在的政务、金融或国企领域对国产密码算法有合规要求,JoySSL提供的“双算法”证书可以兼容国密浏览器和国际浏览器,实现“一处部署,全面兼容”。

3. 申请流程简单快捷

相比于国外的一些证书机构,JoySSL的官网界面和操作逻辑更符合国内用户的习惯。注册账号后,无需复杂的命令行操作,通过简单的域名验证即可快速签发。

三、手把手教你申请JoySSL免费证书

免费SSL证书申请入口

想要快速上手?只需以下四步:

第一步:访问官网并注册
打开浏览器,访问JoySSL官方网站。在注册账号时,建议填写官方推荐注册码 230970 以获取免费的通配符证书申请权限。

第二步:选择证书类型
登录后台,在证书产品列表中找到“永久免费SSL证书”或“免费通配符证书”选项。点击申请,填写你的一级域名(如 example.com)。

第三步:完成域名验证
为了证明域名是你的,JoySSL会提供两种验证方式。通常选择DNS验证:你只需要复制系统给出的TXT记录值,登录你的域名注册商后台,为该域名添加一条解析记录即可。添加完成后,回到JoySSL点击“验证”,通常几分钟内即可通过。

第四步:下载并部署证书
验证通过后,证书就会签发。你可以下载适配你服务器环境的证书压缩包(如适用于Nginx、Apache、IIS等)。解压后,根据里面的安装文档将其配置到你的服务器上。

四、结语

部署SSL证书不再是技术高墙,也不再是经济负担。通过JoySSL这样的平台,你可以在几分钟内零成本实现网站的HTTPS加密。

不要等到浏览器打出“不安全”的红字警告才行动。现在就去申请一张免费的SSL证书,为你的访客提供一个安全、可信的访问环境吧!

观望 1 年,苹果拉了一坨大的。果真是期望越大 失望就越大。

当前是用的 M4Pro 24G 14 寸 MBP ,配了两个低端的 27 寸显示器。

我纠结点的

  1. 更新的 数据传输、音频(麦克风和扬声器)、摄像头视角对我来说用处不大。
  2. 如果上 XDR 预算翻了 1 倍确实肉疼。
  3. 还是老模具,大黑边。

各位老哥/姐妹们,最近遇到一个非常棘手的家庭带娃难题,心里很憋屈也很纠结,想听听大家的客观建议。

[基本情况]

职业与收入: 我月薪 1W ;老婆月薪 1.5W 。家庭总收入 2.5W 。

住房: 目前租房,房租 3K ,家里刚好有一个空房间。

宝宝情况: 刚刚 6 个月大。

特殊背景: 目前只能靠丈母娘带小孩。

[目前的困境]
现在是丈母娘在我们家帮忙带娃。家里的硬性规矩是:只要丈母娘在这带小孩,每个月雷打不动要给她 4000 元。

问题出在情绪和精力上。丈母娘抱怨跟我们住一起“不习惯”,情绪不太好。为了减轻她的负担,我和老婆下班回来后,把洗衣、做饭、打扫卫生等家务都会做,她白天只需要管孩子就行。但即便如此,她依然觉得很压抑。

另外,做我们 IT 这行的,我和老婆偶尔都需要加班。每次遇到突发任务要晚归,心里都心惊胆战,生怕家里老人有怨言,搞得工作也分心。

[我的想法与纠结]
我算了一笔账:既然每个月固定要支出这 4000 块钱,而且大家都不开心,我是不是干脆让她体体面面回老家休息?我自己再添个三四千(总预算 7000-8000 左右),直接请个住家育婴师/保姆住在那个空房间里。

这样一来,做饭家务阿姨能包揽,我们俩偶尔加班也有人全天候兜底带娃,丈母娘也不用再受累了。

想请教大家:

以我们 2.5W 的收入,花七八千请住家保姆,这个财务杠杆加得合理吗?主要我对象对别人带小孩又不太放心。

丈母娘连家务都不用做依然觉得不习惯,我是不是该尽早让她回去?

如果决定请保姆,怎么跟老婆和丈母娘开这个口,才能不伤和气地平稳过渡?

提前感谢大家的解答,听劝!


一同探索 Voice Agent、Physical AI 等对话驱动的下一代人机交互界面。

2026 开年,开源项目 OpenClaw 的热度证明了个人化 AI 的潜力。而我们更关心个人化 AI 如何真正进入并感知物理世界,与人一起和现实产生实时互动。

开发者 xiaoan(本期活动嘉宾之一) 推出的 VisionClaw(在 X 上有近百万次浏览和 1.4K Star) 展示了个人 AI 走进物理世界的一种可行路径——在给 Meta Ray-Ban 眼镜接入视觉与对话能力后,AI 可以识别现实中的饮料品牌型号,交流指令后直接操作电脑在亚马逊上完成下单。

这只是一个开始。从纯文本对话演进而来,Voice Agent 正在 Go Visual、Go Physical,并在往横跨桌面端、移动端与智能硬件的 Go Everywhere 发展。跨平台、多模态的落地实战已经展开。

本周六(3 月 7 日)下午,Physical AI Camp 北京站&RTE Meetup 落地北京。我们邀请了来自声网、矽递科技、Intent Company 和盒智科技 的技术与产品专家。大家将围绕模型、通讯、硬件解决方案和终端落地场景 的跨平台协同,交流真实的经验。

关于 Physical AI Camp·超音速计划 2026

本次 RTE Meetup 也是 RTE 开发者社区即将推出的 「Physical AI Camp·超音速计划 2026」 的预热前哨站。

我们即将开启一个为期 3 个月的创业营,招募正在 Voice Agent、Physical AI 和实时多模态 AI 领域探索的创业团队。营期内,我们将为入营项目提供技术资源支持、投融资对接,以及行业头部展会的展位资源。

如果你正在这个领域创业,欢迎带着你的项目或想法来到本次 Meetup 现场与我们交流对接。

RTE Meetup 议程

13:30~14:00 丨 签到与自由交流

Part 1:Voice Agent 演进:Go Visual, Go Physical & Go Everywhere

14:00~14:50

分享嘉宾:

  • xiaoan,Intent Company 创始人 ,近期开发的 VisionClaw 开源项目在 X 上获得近百万次浏览
  • 姚光华 (Colin),声网 AI 产品线负责人

Part 2:软硬结合与跨平台落地:AI Everywhere 的具体实践

  • 14:50~15:40 丨 圆桌讨论 & 现场所有人问所有人
  • 对谈嘉宾:

    姚光华 (Colin),声网 AI 产品线负责人

    王静茜,矽递科技 AI 应用平台产品线负责人

    张昊,盒智科技联合创始人&CTO,产品经理/全栈工程师/indie hacker

  • 嘉宾主持:

    • Neil,AI 眼镜产品经理

本次为闭门小规模讨论会,欢迎在圆桌环节分享你的问题和想法,所有人问所有人。

Part 3:15:40~16:00丨 Lightning Demo,带上你的软/硬件现场展示介绍

Part 4:16:00~16:30丨Physical AI Camp 招募咨询与自由社交

活动时间:

2026 年 3 月 7 日(周六) 13:30 - 16:30

活动地点:

北京市,望京 (报名审核通过后分享地址)

参与方式:

扫描海报二维码,或点击下方链接报名

https://www.rtecommunity.dev/t/t_a3AjCnV6RpwTFh

💡 我们也新开了一个「Physical AI+多模态」微信群,欢迎关注 AI 硬件、跨平台开发、语音交互、视觉理解等方向的伙伴申请加入!

加微信 Creators2022,备注身份和来意(公司/项目+职位/技术栈+加 Physical AI 群),备注完整者优先。

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

各位彦祖、亦菲,求点出行建议 🙏
情况:
出发地:北京
人数:2 人
时间:五一假期(不太想额外休假😭)
预算:机票往返 2000 元/人左右(住宿和其他费用不考虑)

目前在看东南亚方向,比如马来西亚、新加坡这些,但不太确定哪个目的地这个价位还能买到票。

有没有最近买过类似价格机票的朋友,或者比较容易蹲到 `2k 往返` 的目的地推荐?
海岛、城市都可以,主要是性价比高、好玩一点的地方。

前端开发,坐标郑州,gap 了半年,过完年开始投简历找工作,全是单双休的公司,待遇低要求还特别多,越来越难了,面了 3 家没一个过的,每次结尾 HR 都来一句最近来面试的人很多