2026年IM SDK深度评测:主流厂商全解析
在移动互联网的大环境下,实时通信能力已然成为众多App竞争力的关键所在。不管是社交娱乐类App,还是在线教育平台、企业协同办公软件,亦或是智慧医疗相关的应用,即时通讯(IM)功能到处都有它的身影。不过,自行研发IM系统不仅耗费大量的时间和精力,还可能面临诸多技术难题。所以,对于大多数开发者而言,挑选一款成熟、稳定并且功能完备的IM SDK就成了首要选择。这篇文章会对中国比较主流的IM SDK厂商进行全方位、深层次的评测,从而为开发者们提供一份全面的选型参考资料。
一、主流IM SDK厂商功能对比
(一)云屋科技

优势方面

技术沉淀深厚:长期以来在IM、音视频等核心通信技术领域不断投入研发力量,积累了丰富的技术经验。

集成度高:提供了种类繁多的API和SDK,并且相关文档十分完善,这使得开发者很容易上手使用。

部署方式灵活:既支持公有云部署,也能满足私有云部署需求,还可以进行混合云部署。

劣势方面

定价策略:其云服务定价相对不高,在业务上主要侧重于私有化方面的发展。

(二)融云

优势方面

专业的通信云服务商:专注于通信底层能力的构建与优化工作,在消息送达率、延迟以及并发处理能力等方面表现卓越。

AI布局具有前瞻性:内部集成了AI陪伴、上下文理解、记忆机制以及智能翻译等功能,能够有效提升用户的智能化交互体验。

完善的解决方案与全球化能力:提供涵盖全栈通信的解决方案,能够适配全球超过3000款主流机型,还拥有遍布全球的数据中心和加速网络。

技术底蕴与团队文化:团队的核心成员有着将近20年的研发经验,每日处理的消息量极其庞大,足以应对高并发的场景需求。

高可用性与高并发处理能力:日消息峰值达到3572亿,日均消息量为672亿,服务的可用性超过99.95%,SDK崩溃率低于十万分之一。

市场份额:根据艾瑞咨询的报告,融云在IM市场份额上连续多年占据第一名的位置。

劣势方面

没有强大的靠山(大厂),但是在专业领域更具引领性,并且口碑较好。

(三)腾讯云IM

优势方面

背靠腾讯生态:与微信、QQ等拥有亿级用户的产品的底层技术相同,在稳定性和海量用户支持方面能力很强。

音视频技术自主研发:其实时通信(RTC)能力较强,比较适合那些对音视频质量和稳定性要求极高的场景。

客户规模庞大:为众多头部互联网公司以及政企客户提供服务,产品的成熟度和市场份额都比较高。

劣势方面

聚焦音视频:虽然IM功能也很强大,但核心优势更多地体现在音视频通信方面,在单纯的IM场景下可能会显得有些“大材小用”。

同质化竞争:基本的IM功能与其他厂商相比差异不大,在定制化的灵活性方面可能比不上一些专门从事IM研发的厂商。

AI创新:虽然AI能力强大,但是在IM SDK中的深度整合以及场景化应用还有待进一步提高。

(四)环信

优势方面

老牌IM厂商:具备丰富的行业经验,并且积累了大量的客户资源。

SDK易用性:文档清晰明了,API设计简洁,对开发者非常友好。

企业级服务:在企业级的IM和客服IM领域有着较强的解决方案。

劣势方面

技术迭代速度:在前沿技术的迭代速度和创新程度上可能相对保守一些。

全球化部署:其全球数据中心和加速网络的覆盖程度不如融云等厂商。

二、IM SDK的重要性与主要应用场景
(一)IM SDK的重要性
IM SDK为开发者提供了一套预先构建好的通信功能模块和接口,这有助于App快速集成实时消息、群组聊天、音视频通话等功能。这样做能够节省研发的成本和时间,保证系统的稳定性和可靠性,提升用户的体验感,让开发者能够将精力聚焦在核心业务上,同时还具备安全和合规方面的保障。
(二)主要应用场景
IM SDK适用于各种各样需要用户之间进行实时互动的场景,例如社交娱乐、在线教育、企业协作、电商购物、游戏、智慧医疗、金融服务、物联网/智能硬件等领域。
三、开发者集成IM SDK的常见问题
(一)数据安全和用户隐私
头部的IM SDK厂商都会提供多方面的安全保障措施,像传输加密、存储加密以及端到端加密等。开发者需要详细了解其加密机制和数据存储策略,并且结合自身的业务情况进行内容审核。
(二)全球用户的消息同步和低延迟
优秀的IM SDK会通过全球分布式的数据中心和智能路由/CDN加速来解决这个问题,采用长连接结合离线消息推送机制,从而确保消息的高送达率和低延迟。

(三)UI/UX定制化
主流的IM SDK都提供了高度的UI分离和二次开发能力,开发者可以根据自己的需求完全自定义聊天界面和UI元素。
(四)高并发场景应对
头部的IM SDK厂商会通过可扩展的服务器架构、优化的消息分发机制、客户端优化以及专门的聊天室组件来应对高并发的场景。
(五)平台支持
主流的IM SDK支持全平台覆盖,包括移动端、Web端、桌面端、小程序/H5和服务器端,并且提供详细的开发文档。
融云在基础设施覆盖程度、产品能力以及多种场景的适配性等方面表现优秀,是一个极具竞争力的选择。希望开发者们能够巧妙地利用第三方服务,让自己的业务不断发展壮大。

实战背景:K 线够用,但不总是最优解

在很多交易系统的早期阶段,我们通常会从 K 线数据开始构建策略逻辑。
这种做法成本低、实现简单,也更容易验证想法。
但随着系统逐步演进,尤其是交易频率提高之后,我们会逐渐发现一个问题:系统对市场变化的感知,开始变慢了。
不是策略本身的问题,而是数据粒度已经成为瓶颈。

需求变化:哪些场景开始“吃不下”K 线

在实际项目中,我们遇到过一些典型场景:

  • 高频或准高频策略,对入场时机非常敏感
  • 实时行情监控,希望第一时间发现异常波动
  • 可视化系统,需要连续、细粒度的数据流
    在这些情况下,K 线更像是“结果数据”,而不是“过程数据”。
    Tick 数据提供的,正是这个过程层面的信息。

    数据层面的真实痛点

    真正接入 tick 数据之后,挑战并不在“怎么拿数据”,而在于工程层面的问题:

  • 行情是否连续推送
  • 延迟在高波动时是否明显放大
  • 多品种订阅时,结构是否统一
    如果数据源本身不稳定,
    那么策略层再复杂,也只能被动接受不确定性。
    对于个人高频交易者来说,
    数据质量直接决定系统上限。

    实现思路:为什么我们选择 WebSocket

    相比 REST API 的轮询方式,WebSocket 更适合处理 tick 级实时数据:

  • 不需要频繁发起请求
  • 数据推送更连续
  • 更接近真实市场更新节奏
    在实践中,我们更倾向于使用聚合型行情接口,通过统一结构接入多个市场,降低维护成本。
    例如使用 AllTick 的实时行情接口,可以用一套 WebSocket 逻辑订阅不同交易对,再在本地做处理和分发。
    下面是一个 Python 示例,用于订阅 BTC/USD 的 tick 数据(代码保持不变):
import websocket
import json

# AllTick API WebSocket 地址
url = "wss://api.alltick.co/realtime"

def on_message(ws, message):
    data = json.loads(message)
    # 打印每一条 tick 数据
    print(f"时间: {data['timestamp']} | 市场: {data['market']} | 价格: {data['price']} | 成交量: {data['volume']}")

def on_open(ws):
    print("连接已建立,开始订阅 tick 数据...")
    # 订阅 BTC/USD 的 tick 数据示例
    subscribe_data = {
        "action": "subscribe",
        "symbols": ["BTC/USD"]
    }
    ws.send(json.dumps(subscribe_data))

def on_close(ws):
    print("连接关闭")

ws = websocket.WebSocketApp(url,
                            on_open=on_open,
                            on_message=on_message,
                            on_close=on_close)

ws.run_forever()

这种结构的好处在于:

  • 数据可以直接进入内部队列或缓存
  • JSON 格式方便落库或实时分析
  • 逻辑清晰,便于后续扩展到多市场

    一点工程层面的体会

    在系统跑起来之后,有几个明显的变化:

  • 行情监控的“反应速度”提升
  • 异常波动更容易被提前捕捉
  • 对市场状态的判断更贴近实时情况
    Tick 数据并不会直接“提高收益”,
    但它能让系统更早、更真实地感知市场变化。

    总结:什么时候值得引入 Tick 数据

    如果你的系统已经出现以下特征:

  • 对延迟开始敏感
  • 对行情连续性有要求
  • 希望优化实时监控或执行逻辑
    那么,从 K 线升级到 tick 数据,通常是一个合理的演进方向。
    数据层是交易系统的基础设施,
    在这个层面做对选择,往往比后期补救更有效。
    如果你也正在做类似的系统优化,希望这份实践经验能对你有所帮助。

在数字化转型背景下,企业对客户精准运营、销售全流程管控、业务链路协同的需求日益迫切。本文基于客户分层、销售机会管理、销售-采购-库存一体化三大核心维度,对市场主流CRM品牌(超兔一体云、Zoho CRM、HubSpot CRM、SAP、Microsoft Dynamics 365、Oracle CX等)的能力进行专业横向对比,结合可视化工具(表格、流程图、脑图、雷达图)呈现差异,为企业选型提供参考。

一、对比维度与指标定义

本次对比围绕CRM的核心价值链路设计,覆盖“客户认知-机会转化-业务协同”全流程,具体维度与指标如下:

一级维度二级指标指标说明
客户分层数据整合能力支持整合的客户数据来源(如市场线索、工商信息、社交行为、交易历史)
分层规则灵活性是否支持自定义分层逻辑(如行业标签、RFM模型、生命周期阶段)
动态调整能力是否根据客户行为/交易变化实时更新分层归属
销售机会管理机会识别效率线索转化为机会的路径(自动/手动)、多场景机会模型(小单/大单/项目型)
跟踪推进能力机会阶段可视化、跟进工具(如时间线、待办任务、360°视图)
评估决策能力是否支持AI预测(成交概率、收益)、数据报表辅助决策
销售-采购-库存一体化数据连通性销售、采购、库存数据是否原生集成(非第三方对接)
流程协同能力订单→采购→库存的自动化触发(如库存不足自动生成采购计划)
智能优化能力是否支持库存预测、采购量自动计算、供应商智能匹配等

二、各品牌核心能力横向对比

基于公开资料与产品文档,以下品牌的能力表现如下(未提及的品牌/指标表示“现有公开信息未覆盖”):

1. 客户分层能力对比

客户分层的核心是“精准识别客户价值”,关键看“数据整合的广度”与“规则的灵活性”。

品牌数据整合来源分层规则灵活性动态调整能力
超兔一体云市场获客(百度/抖音/微信)、工商信息(天眼查/经纬度)、交易历史、跟进记录支持自定义规则(三一客:定性/定级/定量;RFM模型);支持客池分类(需求培养/有需求)实时跟踪客户行为(跟进/购买),自动调整分层归属
Zoho CRM多渠道沟通(邮件/电话/社交)、购买历史、服务请求;360°客户视图支持多维度分组(价值/行业/地域);内置RFM模型基于交易数据动态更新分层(如高价值客户标记)
HubSpot CRM营销线索(表单/浏览行为)、客户生命周期阶段;AI线索评分(行为数据)支持自定义生命周期阶段(潜在客户/试用中/已成交);规则自动化触发根据客户行为(如下载白皮书)自动更新阶段
SAPERP交易数据(订单/库存)、2000+行业标签(如零售“购买频率”、制造“供应链依赖度”)基于行业属性+交易数据动态分层;高价值客户优先分配资源实时同步ERP数据,分层结果随交易行为变化
Microsoft Dynamics 365Power BI动态标签、客户历史行为(如邮件打开/会议参与);微软生态数据(Office 365)支持自定义标签组合(如“高意向+高客单价”);行为轨迹分层基于历史行为自动调整分层(如“30天未互动”降级为沉睡客户)
Oracle CX销售/服务/社交数据(LinkedIn/Twitter)、全渠道互动记录;客户偏好标签支持多维度分层(购买偏好/流失风险/地域);标签可交叉组合整合实时互动数据,分层结果动态更新

2. 销售机会管理能力对比

销售机会管理的核心是“提升转化效率”,关键看“机会全流程可视化”与“AI赋能的精准决策”。

品牌机会识别效率跟踪推进能力评估决策能力
超兔一体云支持多场景机会模型:小单快单(三一客)、中长单(商机阶段)、多方项目(复杂主体);线索一键转化为机会360°跟单视图、超兔独有“跟单时间线” (整合沟通/拜访/行动记录);待办任务自动触发基于三一客三定模型(定性/定级/定量)评估机会价值;AI分析沟通内容辅助决策
Zoho CRM线索自动采集(网站/社交);一键转化为客户/机会;支持“蓝图”流程标准化销售机会阶段可视化(初步接触→需求分析→报价→签约);Zia AI提醒跟进时机Zia AI提供成交概率预测(准确率>85%) 、客户行为分析;销售报表一键生成
HubSpot CRM线索自动分配(基于规则);“交易管道”模块可视化机会阶段;邮件/会议工具集成拖拽式管理销售阶段(新线索→意向→报价→成交);自动化任务(如“3天未跟进”触发提醒)销售报表监控业绩趋势;AI线索评分识别高潜力机会
SAP线索与ERP库存联动(避免超卖);阶段化机会管理(商机→报价→成交)实时同步库存数据;机会进度与ERP交易数据联动基于ERP数据评估机会收益;风险预警(如“库存不足”标记低优先级)
Microsoft Dynamics 365线索与Power BI分析联动;团队协作分配机会;移动应用随时随地更新进度AI助手提供跟进建议(如“客户浏览竞品内容,建议发送案例”);360°机会视图Power BI生成机会转化率报表;团队共享决策依据
Oracle CX支持项目型销售机会(多方参与);CPQ配置报价工具(复杂产品快速报价)全渠道订单路由(就近仓库发货);机会进度与SCM数据联动AI推荐优先跟进对象;成交概率预测辅助资源分配

3. 销售-采购-库存一体化能力对比

一体化的核心是“打破业务数据孤岛”,关键看“原生集成深度”与“流程自动化程度”。

品牌数据连通性流程协同能力智能优化能力
超兔一体云原生一体化(CRM+进销存+供应链+收支账);数据底层连通订单生成→自动锁库→库存不足触发采购计划→采购单自动拆分(按供应商);供应商直发流程智能采购自动计算采购量、匹配历史供应商;询价比价工具集成;库存预警
Zoho CRM需集成Zoho Inventory(库存)+Zoho Books(财务);非原生一体化集成后支持库存跟踪、采购订单自动化;销售订单触发库存更新库存预警(如“库存低于安全库存”提醒);采购报表分析
HubSpot CRM需对接第三方ERP/库存系统;Commerce Hub仅覆盖电商订单支付环节第三方集成后实现订单-库存同步;无原生采购流程协同电商场景支持订单履约跟踪;无智能采购优化
SAP核心优势:原生集成SAP ERP;销售-采购-库存-财务全链路数据连通销售订单自动触发采购计划;生产工单与库存联动;交付进度实时同步基于销售趋势预测库存需求;供应商绩效分析;全链路自动化(下单→生产→交付)
Microsoft Dynamics 365集成Dynamics ERP;销售数据与库存/财务联动销售可实时查看库存状态;订单自动同步财务模块;采购订单与库存联动Power BI分析库存周转率;采购需求预测
Oracle CX集成Oracle ERP/SCM;全渠道订单数据联动全渠道订单路由(如线上订单分配至线下门店发货);采购与库存实时同步供应商智能匹配;库存成本分析;部分功能需依赖Oracle其他云服务

三、可视化工具增强对比效果

1. 核心能力对比总表(精简版)

品牌客户分层优势销售机会管理优势一体化优势适用场景
超兔一体云多渠道数据整合+自定义规则多场景跟单模型+时间线视图原生一体化(CRM+进销存+供应链)中小微企业/快消/零售(需全链路覆盖)
Zoho CRMRFM模型+Zia AI分析阶段可视化+成交概率预测集成Zoho生态实现协同中型企业/多渠道销售(需AI赋能)
HubSpot CRM营销-销售协同+AI线索评分交易管道+自动化任务电商场景订单管理营销驱动型企业/SaaS/电商
SAPERP深度数据+行业标签库存联动+全链路自动化ERP原生集成(核心优势)大型企业/制造/零售(需复杂ERP协同)
Microsoft Dynamics 365Power BI分析+微软生态AI跟进建议+团队协作集成Dynamics ERP微软生态企业/需要数据分析的中型企业
Oracle CX全渠道数据+SCM集成项目型销售+CPQ报价全渠道订单路由大型企业/全渠道零售/制造

2. 超兔一体云一体化流程(Mermaid流程图)

超兔的“一体云”架构实现了销售-采购-库存的原生自动化,流程如下:

暂时无法在飞书文档外展示此内容

3. 客户分层能力框架(Mermaid脑图)

暂时无法在飞书文档外展示此内容

4. 综合能力雷达图(分值1-10)

雷达图从客户分层、销售机会管理、一体化能力、AI赋能、流程自动化5个维度评分,结果如下:

品牌客户分层销售机会一体化AI赋能流程自动化总分
超兔一体云99108945
SAP1091081047
Zoho CRM8879840
Microsoft Dynamics 3659899944
HubSpot CRM7758734

四、结论与选型建议

基于对比结果,各品牌的差异化优势适用场景如下:

  1. 超兔一体云

    1. 优势:原生“CRM+进销存+供应链”一体化,适合需要“全链路覆盖”的中小微企业(如快消、零售、制造),避免多系统对接的麻烦。
    2. 推荐:需“客户精准分层+销售机会管控+库存采购协同”的成长型企业。
  2. SAP

    1. 优势:ERP深度集成,适合大型企业(如制造、零售),需要“销售-采购-生产-交付”全链路自动化,依托ERP数据实现精准决策。
    2. 推荐:有复杂ERP系统、需跨部门协同的大型企业。
  3. Zoho CRM

    1. 优势:多渠道销售+AI赋能,适合中型企业(如SaaS、电商),需要“线索自动采集+AI跟进提醒+销售流程标准化”。
    2. 推荐:侧重多渠道获客、需要AI提升转化效率的企业。
  4. HubSpot CRM

    1. 优势:营销-销售协同,适合营销驱动型企业(如SaaS、在线教育),需要“线索从营销到销售的无缝传递+自动化跟进”。
    2. 推荐:侧重营销获客、需要“营销-销售”数据打通的企业。
  5. Microsoft Dynamics 365

    1. 优势:微软生态集成,适合已使用微软产品(Office 365、Power BI)的企业,需要“数据分析+团队协作+ERP联动”。
    2. 推荐:微软生态深度用户、需要Power BI分析的中型企业。

总结

企业选型CRM时,需先明确核心需求

  • 若需“全链路业务协同”,优先选超兔一体云、SAP(原生一体化);
  • 若需“AI赋能销售”,选Zoho CRM(Zia AI);
  • 若需“营销-销售协同”,选HubSpot CRM
  • 若需“ERP深度联动”,选SAP、Microsoft Dynamics 365、Oracle CX

最终,CRM的价值在于“用数据驱动决策,用流程提升效率”,企业需结合自身业务场景选择最适配的工具。

(注:文中功能相关描述均基于公开披露信息,具体功能服务以厂商实际落地版本为准。)

Matrix 首页推荐 

Matrix 是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。 

文章代表作者个人观点,少数派仅对标题和排版略作修改。


前言

《逃离鸭科夫》是由碳酸小队开发,bilibili发行的PVE俯视角射击游戏。玩家以一只鸭子的身份在废土世界搜刮资源、修建庇护所、升级装备,并在这个危机四伏的世界生存下去。2025年10月上架Steam后就反响不错,一个月便成功销售100万份。不过这里不是跟大家探讨和分享游戏、也不是盘点游戏中的那些梗,而是与大家分享一个与游戏主线完全无关的,把这游戏玩成模拟经营,成为百万富翁的故事。

鸭鸭市场mod

游戏中玩家主要靠进入不同地图,搜刮宝箱和敌人获取道具与武器。但除了一些关键道具可用作升级外,大多只是囤积或卖给NPC。直到大佬Cyerol在创意工坊上架了一款叫「鸭鸭市场」的mod,第一次让玩家们在游戏中实现了P2P交易(Player to Player Trade)。

鸭鸭市场mod

这个市场的功能逻辑很简单,玩家支付手续费后把道具上架市场,就可以被其他所有玩家购买。鸭鸭市场最大的作用是以金钱的方式体现道具应有的价值(道具稀缺度的货币化体现)。因此玩家可以把道具以高于NPC的回收价卖出,也能满足玩家快速获取急需升级道具和高级武器的诉求。游戏中的金钱在技能升级和购买弹药上开销还不小,并且初期赚钱也不那么容易,所以这个mod很受大家欢迎,有不错的使用量。

有点金融知识的朋友应该知道,一个公平的市场如果买卖双方都是理性且没有信息差,那么所有的商品应该会自然的形成一个均衡价格,实际价格只会围绕它上下小幅波动。我最初以为,这游戏中所有道具都能被玩家获得,且有一个固定的系统回收价,那么价格的波动应该不会很大。

但是我错了,我在这里看到了超过系统价格几千倍的畸形售价、充满投机泡沫的比特币骗局。不过我是受益者,因为我在这个市场中通过交易,花了几个小时便达成「百万富翁」成就,最终在游戏里实现「财务自由」。

这个游戏中的100万是个什么水平呢?
游戏中主要的金钱来源是搜刮地图中的战利品,回基地卖给NPC。但游戏中有可携带物品数量和总重量的限制,因此在前期每局能实际获得的金钱比较有限。我的个人体感是在5000-8000左右,这还不包括为后续升级做预留而未卖出的道具,以及单纯做任务不搜刮的情况。

百万富翁之路

在这也能炒比特币

逃离鸭科夫的制作人是很懂玩梗的,这游戏里存在一个特殊道具:0.2 BTC(比特币)。玩家在「矿机」中安装上显卡,就能根据算力生产出比特币。矿机只存在一台,插满12个显卡后每10个小时(现实时间)就能生产出1枚0.2BTC。

比特币矿机

0.2 BTC在游戏中几乎没有啥使用价值,但NPC的收购价能到8000块。属于单价很高的物品了,起初我都是直接扔给厨师(他的回收价最高)。然而在鸭鸭市场里我却看到惊人的一幕。

畸高价格的比特币
鸭鸭市场中比特币的售价

是的你没看错,一个几乎没有使用价值的道具,在这里的最低售价超过26000,是NPC收购价的3倍还多。最高售价高达50万,要上架一个就需要提前支付68万的手续费,这非常不合理。一些高价的比特币都是一个个单独卖,后来我才知道当商品只有一个时点击购买不需要二次确认。

观察一段时间后我发现比特币的价格会在一段时间后迅速跳水,然后再被快速炒高,反复循环。种种迹象表明在鸭鸭市场中比特币有着极不合理的价格波动和巨大套利空间。

在我看来这里有人故意拉高价格等人接盘,一群人明知但依旧浑水摸鱼,就像一个庞氏骗局。

现实生活中我会立马远离,但这是游戏(这里巨大的非理性也和虚拟环境有关吧)。我放弃主线剧情,开始刷市场看行情做起逢低买入、遇高卖出的生意,把射击游戏玩成了模拟经营。

行情好与差时的价格对比

比特币的价格波动很大,行情好就加价一两万挂单卖出,行情差就低价买进,没什么机会就玩一两局游戏做调剂。就这样过了两三个小时,我的资金就翻了好几倍来到50多万。

成就百万富翁

我的资金有了一个巨大的飞跃,但新的问题也暴露出来。相对现在的本金,利润已经有点不够看了,而且我很担心比特币泡沫破裂最后砸手里,所以我决定尽早做调整。

经过一番分析和观察,一个叫做「空间晶体」的道具进入我的视线。相比比特币他有着明显的优点

  1. 有刚性需求:这是一个后期升级技能的必备道具;
  2. 有一定稀缺性价值高:获取这个道具需要在特殊时间击杀特殊的强力怪物,初期很容易翻车,所以在鸭鸭市场低谷期售价也在3万以上;
  3. 价格波动大:波动范围在3万~50万不等,有更大的套利空间。

为了降低风险我采取两条腿走路,一边以八成的资金看准时机收购低价,一边继续倒卖BTC。我还发现一旦挂的单被顶到第二页之后售出的速度就会非常慢。如果主动下架再上架,就要付出双倍的手续费,因此每次上架道具时的定价和数量都要仔细考虑。

随着我对这套玩法的熟练度越来越高,我的倒卖生意蒸蒸日上。也就30多分钟的时间我的资产又一次翻倍达到了100万,同时解锁了「百万富翁」成就。

一场豪赌

机遇还是陷阱

机会有时候会在不经意间来到你身边。在看空间晶体行情时突然发现有玩家以8万一个的价格挂了50个「大块空间晶体」上来。这一下震惊到了我。

两种空间晶体

由于关键词也可以被匹配上,我对这个道具有一定的认识。据我所知,这是目前市场中单价最高的道具,通常在30万以上,且价格波动极大,50万、80万一个都不算罕见。

突然出现的这个「天漏」反倒让我很犹豫。这不是我当前的主业,正所谓恪守本心、不违其性,看似是机会也可能是陷阱。这时候我持有不少的空间晶体,现金已经不多了。但又不忍错过这个获利极丰的机会,考虑再三后还是凑了16万买了2枚。市场的反应就迅速多了,库存显示从50、30、15,很快来到个位数,总价400万的大块空间晶体很快就从市场上消失,一切又恢复平静。

我还是第一次拿到这个道具,还没来得及仔细端详,市场上又出异端。50个标价8万的大空间晶体再次被挂了上来!这一下我彻底懵了。心想:坏了,可能要砸手里了,真是怕啥来啥。市场那边也是没想到还会有人继续低价抛售,直接把这个品类的盘子砸了。这次售出的速度肉眼可见的慢了许多。过了好几分钟库存还有30多枚。

再起波澜

这是一个机会吗?现在8万的价格只是偶然,价格还会再次攀升。会是陷阱吗?这个品类就此走向下坡路,8万甚至更低的售价才合理。

不知道当初是在怎样的状态下做的决定:我要尽可能的买进这批货!我相信价格肯定会涨上去,最坏的结果也就是从损失一些本金。这买卖可以干!

我的现金已所剩无几,为了凑钱我下架了所有的比特币和空间晶体。比特币直接丢给NPC,空间晶体以低于市场价的价格挂单售出。到仓库把所有的备用武器卖出;那些非后期升级必备的道具也一件不留,几乎是掏空家底去博这个机会。

兵贵神速,每攒够十来万就去市场下单,然后再去NPC那边卖道具。在厨师、鸭鸭市场、快递箱之间来回穿梭(市场买到的货和收到的钱会先放到快递箱)。在库存清空前收购了二十多枚大块空间晶体。

转运箱

有钱是一件无聊的事情

很幸运我赌对了。这批8万的货被清空后就再也没出现如此低价的单了。等待一段时间后我从20万一个的价格开始出货,然后慢慢涨至30万,最后甚至卖到五十万。我的资产也从几万变成几十万,很快突破100万、200万,最后超过500万。

财务自由之路

 

这一刻我觉得自己实现了「财务自由」。

这一连串的数字让我忘乎所以,很快开始买买买模式。之前升级技能、升级建筑的道具直接在鸭鸭市场去买,反正有的是钱。积累下的那些需要上交特殊道具的任务也一并完成。一时间觉得自己挥金如土好不自在。我丢下来那套修补多次的盔甲,换成了防御最高、最顶级的装备;换了最强的武器并配好所有附件;带上各式针剂、血包。重新迈进废土世界。

前五分钟我还沉浸在高级武器带来的爽感里,可越到后面越发现不对劲。准确地说是我的心态发生了极大的变化。

这款「搜打撤」游戏中,搜集各种物资完成任务、提升自己、升级装备是获得满足感非常重要的一环。但如今我发现自己不再有意愿去打开每个宝箱,因为我知道里面都是些我瞧不上的玩意;击杀敌人后我也懒得去搜刮,因为我的装备已经是游戏中最好的。对硕大的地图也没有了探索欲,因为最终的战利品对我已没有任何意义。

回到鸭鸭市场,我的仓库里还剩下市值一百多万的货,花点时间突破1千万也不是啥难题。只是这串数字对我已没有任何意义。最后我退出了游戏,很久都没再打开。

后记

一点小小的触动

鸭鸭市场的基础规则非常简单,但却涌现出现多种玩法与博弈,这几乎就是现实的写照。在这里,我体验到了财富的增长、市场的波动、心态的转变。它让我看到虚拟经济与现实经济的惊人相似:贪婪、恐惧、博弈、风险。 

一个多月后我重新打开游戏,又看到那冰冷的500万,他似乎在提醒我:或许游戏里的财务自由只是虚拟的,真正的快乐也不是拥有无限的资源,而是在规则里找到属于自己的乐趣。毕竟,玩游戏也好,生活也罢,最重要的是享受这个过程。

感谢你能读到这里,希望也能对你有所帮助。

注:

  • 前期没有刻意记录,因此文中出现的具体交易量、价格等数据可能与实际有偏差;
  • 所有内容发生在2025年11月14日和15日,文中的套利方法可能已不再适用。

> 关注 少数派小红书,感受精彩数字生活 🍃

> 实用、好用的 正版软件,少数派为你呈现 🚀

    还在最终测试中,testflight 内测用户招募中,上架后送码,感兴趣的留下 邮箱 即可 我发送 TF 链接


    全新实时记录功能

    📱 + ⌚️ 双设备联动

    在 iPhone 上轻点「实时」按钮,Apple Watch 即刻开始记录。横屏放置手机,实时查看:

    • ⏱️ 精准计时 — 120pt 超大字体,黑暗中一眼可见
    • ❤️ 实时心率 — 跳动的心形图标,感受每一次心跳
    • 🔥 消耗卡路里 — 见证你的努力

    结束后,选择 Solo 或伴侣模式,完善记录细节。


    核心亮点

    🎯 Apple Watch 独立运行

    无需掏出手机,抬腕即可开始。HealthKit
    深度整合,自动采集心率数据,记录完成后无缝同步到 iPhone 。

    🌙 沉浸式横屏体验

    全黑背景 + 主题色点缀,专为私密场景设计。Liquid Glass
    控制按钮,一键暂停/锁定/结束。

    👤 Solo 模式

    独处时光同样值得记录。专属「助兴方式」标签:小说、视频、ASMR 、幻想...

    🎨 个性化主题

    Rose / Ocean / Sage / Lavender / Amber —
    五种主题色,动态切换应用图标,玻璃质感设计。

    ☁️ iCloud 同步

    数据安全存储在你的私人 iCloud ,多设备无缝同步。


    隐私至上

    • 所有数据仅存储在本地或你的私人 iCloud
    • 无需注册账号
    • 无广告、无追踪
    • 应用图标可自定义,不显眼





    我家最近在装修。
    然后,一个产品经理的职业病,彻底犯了。

    作为一个 PM ,我骨子里始终有一种“不安分”的创作欲。
    每当一个真实需求摆在面前,我的第一反应往往不是——
    “市面上有没有现成的解决方案?”
    而是——
    “这事儿,我能不能自己做一个?”

    于是「奇伴 AI · 一键 AI 装修出图」就诞生在这场轰轰烈烈的装修中。

    Description

    装修这件事,本身就是一场折磨
    如果你也装修过房子,你一定懂我接下来要说的这些痛点。

    1️⃣ 沟通,是一条看不见的鸿沟
    你跟嘉人沟通或对着设计师说:

    “我想要一点侘寂风,但不要太冷,还得有点温馨的生活感。”

    而设计师脑子里出现的画面,
    往往和你想象中的那个“家”,完全不是一回事。

    你们说的明明是同一种中文,
    却像在用两套世界观交流。

    2️⃣ 效果,是一场豪赌
    在真正落地之前,
    所有效果图都只配得上四个字:仅供参考。

    那张看起来很高级的沙发,
    那块你纠结了很久的地板,
    到底搭不搭?好不好看?会不会翻车?

    没人能给你一个确定答案。

    3️⃣ 预算,是个无底洞
    装修最可怕的不是贵,
    而是——试错。

    每一次“感觉不对”、
    每一次“拆了重来”,
    背后都是实打实的真金白银。

    作为一个产品经理,
    我几乎本能地无法忍受这种:

    信息不对称 + 体验不确定 + 成本不可控

    我突然冒出一个念头
    AI 都能画画了,
    AI 都能修复几十年前的老照片了,

    那它,能不能当我的专属室内设计师?

    于是,在装修的灰尘、争吵和灵感火花里,
    我的第三个产品慢慢成型了。

    「奇伴 AI · 一键 AI 装修出图」
    我对它的要求只有一句话:

    足够简单,但效果一定要惊艳。

    你不需要懂设计,
    不需要学软件,
    甚至不需要会“说专业名词”。

    只要三步。

    三步,把你的家交给 AI
    第一步:上传户型或照片
    拍一张毛坯房,
    或者上传一张户型结构图。

    哪怕很粗糙,
    AI 也能识别出真实的空间结构。

    Description

    第二步:告诉 AI ,这是哪儿
    是客厅?
    卧室?
    餐厅?
    书房?
    还是儿童房?

    你只需要选,
    不用解释。

    Description

    第三步:选一个你“喜欢的感觉”
    现代?
    新中式?
    日式原木?
    奶油风?
    工业风?

    不用担心专业不专业,
    你只管凭直觉选。

    点击「生成」。

    几秒钟后,
    一张真正基于你户型和偏好的高清效果图,就出现了。他很真实,不会过于奢华,会很接近生活和装修后的效果图,你可以自己把想法输进去

    Description

    说实话,
    连我自己第一次看到生成结果时,都有点被惊到。

    它不仅贴近我脑海里的“理想家”,
    还给了我不少——
    我自己根本没想到的惊喜方案。

    它是为谁而生的?
    我从一开始,就没打算把它做成“替代设计师”的工具。
    它更像一个——装修路上的创意辅助神器。

    特别适合这两类人:

    🧱 毛坯房装修者
    面对空无一物的房子,不再靠想象硬撑。

    你可以无限次“试装”,
    把所有可能性都提前走一遍,
    等真正施工时,心里已经有答案了。

    🛠 老房改造者
    想动,又怕翻车。

    拍下现状,
    告诉 AI 你的想法,
    先看看未来会变成什么样,再决定要不要动手。

    每一分钱,花得更有底气。

    写在最后:为自己而创造
    如果说前两款产品,
    是我作为 PM ,去解决“他人”的共性需求。

    那这一次,
    我是真正回到了创造最原始的动机:

    先把自己的问题解决掉。

    这段经历也让我越来越确信一件事——
    AI 时代的产品经理,正在进化。

    我们不再只是需求的传递者,
    而是可以亲自下场,
    成为解决方案的创造者和验证者。

    从陪伴长辈,
    到修复记忆,
    再到设计自己的家。

    我的三款 AI 产品,
    串起了一条从共性需求,到个性痛点的实践路径。

    Description

    这个时代最迷人的地方就在于:

    当你被一个问题困扰时,
    你随时可以卷起袖子,
    借助 AI ,亲手为自己打造一个解决方案。

    那么——
    你最近,又在被什么问题折磨着呢?

    不妨想一想,
    AI ,能不能也帮你做点什么。

    一、 内核:四大模块如何编织“流量-价值”的自循环系统?

    1. 社区广场:流量的起点与内容的熔炉
      作为开放的公共空间,它承担着内容沉淀与陌生人破冰的核心职能。用户在此分享、提问、互动,优质UGC(用户生成内容)不断累积。它解决了“从哪里来”的问题,是系统活跃度的基础水位。
    2. 兴趣圈子:归属感的容器与深度留存的保障
      如果说社区是广场,圈子便是客厅与书房。基于强主题或高门槛(如付费、身份)建立,它提供了更私密、更聚焦的互动环境。无论是“年度会员专属圈”还是“每日打卡自律圈”,其核心价值是赋予用户身份认同与归属感
    3. 集成商城:价值变现的平滑接口
      这是价值实现的直接窗口。关键设计在于“场景化嵌入”:用户在社区被种草,在圈子中获得信任,在商城完成消费(实体商品、虚拟会员、活动门票)便成为社交行为的自然延伸
    4. 知识平台:高价值用户的培养皿与利润放大器
      这是将个体经验与专业知识产品化、标准化的关键模块。无论是录播课、训练营还是咨询,它解决了服务难以规模化的难题。对于运营者而言,这是筛选和培养高价值用户、提升客单价的终极阵地;对于用户而言。

    这四个模块并非孤立存在,而是构成一个自增强的循环:社区带来流量,圈子深化关系,商城实现初步变现,知识服务完成价值升华。而升华后的用户,又会反哺社区内容与圈子氛围。

    二、 外延:这套系统正在哪些领域重构运营想象力?

    • 场景A:地方自媒体的“升维战争”
      本地美食公众号,挣脱了“接广告”的单一模式。它利用社区聚合全城探店笔记,用圈子建立“资深吃货俱乐部”提供独家优惠,在商城上线餐厅折扣套餐和本地特产,并通过知识课程传授烹饪秘诀。它从一个“内容媒体”蜕变为一个“本地生活服务生态”。
    • 场景B:专业人士的“影响力杠杆”
      资深健身教练,打破了时间与地域的封印。她在社区分享专业见解建立权威,创建付费圈子提供个性化指导与打卡监督,将核心方法论打造成体系化在线课程,并在商城搭配销售精选的健康食品与器械。是一个拥有自主品牌和持续收益的健康解决方案提供商。
    • 场景C:兴趣组织的“商业进化”
      全国性的垂钓协会,超越了“收会费、办比赛”的传统。他们搭建起全国钓友社区,按地域和钓法细分圈子,在商城发售协会认证的定制钓具,并邀请钓王开设高阶技巧网课。组织从单纯的爱好者联盟,进化为集信息、社交、装备、教育于一体的产业小生态。

    三、 基石:为什么“技术集成”是战略优势,而非功能堆砌?

    • 核心优势:

      • 数据融合: 用户在社区点赞、在圈子发言、在商城消费、在课程学习的所有行为,均归属于同一ID。这为构建精准用户画像、实现个性化推荐和自动化营销提供了可能,让“读懂你的用户”从空话变为现实。
      • 体验无缝: 用户无需在不同APP、小程序间跳转。从看到一篇好帖,到加入相关圈子,再到购买文中推荐的商品或课程,流程一气呵成。每减少一次跳转,就降低一份流失风险。
    • 典型技术选型与逻辑:

      • 前端(用户界面): 采用uni-app等跨端框架。为什么? 一次开发,可同时发布为微信小程序、H5网页及Android/iOS App,以最低成本覆盖几乎所有用户入口,聚焦核心业务而非重复适配。
      • 后端(系统大脑): 使用如ThinkPHP这类高效、扩展性强的框架。为什么? 能稳健支撑用户管理、内容发布、交易支付、即时通讯等复杂业务逻辑的并发处理,保障系统稳定。
      • 关键功能模块: 统一的用户权限中心、基于LBS的地理位置服务、集成的即时通讯(IM)能力、以及安全的内容与支付体系,这些不再是孤立的功能,而是支撑上述四大业务模块流畅协作的基础设施。

    GET_IMAGE_ANIMATIONS API 接口文档

    接口信息

    POST /openapi/capcut-mate/v1/get_image_animations

    功能描述

    获取图片出入场动画列表,返回所有支持的且满足条件的图片出入场动画。支持根据动画类型(入场、出场、循环)和会员模式(所有、VIP、免费)进行筛选。

    更多文档

    📖 更多详细文档和教程请访问:https://docs.jcaigc.cn

    请求参数

    {
      "mode": 0,
      "type": "in"
    }

    参数说明

    参数名类型必填默认值说明
    modeinteger0动画模式:0=所有,1=VIP,2=免费
    typestring-动画类型:in=入场,out=出场,loop=循环

    参数详解

    动画模式参数
    • mode: 动画筛选模式

      • 0 = 所有动画(包括VIP和免费)
      • 1 = 仅VIP动画
      • 2 = 仅免费动画
      • 默认值:0
    动画类型参数
    • type: 动画类型(必填)

      • "in" = 入场动画(图片出现时的效果)
      • "out" = 出场动画(图片消失时的效果)
      • "loop" = 循环动画(图片持续播放的效果)
    动画模式说明
    模式值模式名称描述
    0所有返回所有动画(包括VIP和免费)
    1VIP仅返回VIP动画
    2免费仅返回免费动画
    动画类型说明
    类型值类型名称描述
    in入场动画图片出现时的动画效果
    out出场动画图片消失时的动画效果
    loop循环动画图片持续播放的循环动画效果

    响应格式

    成功响应 (200)

    {
      "effects": [
        {
          "resource_id": "7314291622525538844",
          "type": "in",
          "category_id": "pic_ruchang",
          "category_name": "图片入场",
          "duration": 600000,
          "id": "35395179",
          "name": "渐显出现",
          "request_id": "",
          "start": 0,
          "icon_url": "https://lf5-hl-hw-effectcdn-tos.byteeffecttos.com/obj/ies.fe.effect/fade_in_pic_icon",
          "material_type": "sticker",
          "panel": "",
          "path": "",
          "platform": "all"
        }
      ]
    }

    响应字段说明

    字段名类型说明
    effectsarray图片动画对象数组
    单个动画对象字段说明
    字段名类型说明
    resource_idstring动画资源ID
    typestring动画类型(in/out/loop)
    category_idstring动画分类ID
    category_namestring动画分类名称
    durationinteger动画时长(微秒)
    idstring动画唯一标识ID
    namestring动画名称
    request_idstring请求ID(通常为空)
    startinteger动画开始时间
    icon_urlstring动画图标URL
    material_typestring素材类型(通常为"sticker")
    panelstring面板信息
    pathstring路径信息
    platformstring支持平台(通常为"all")

    错误响应 (4xx/5xx)

    {
      "detail": "错误信息描述"
    }

    使用示例

    cURL 示例

    1. 获取所有入场动画
    curl -X POST https://capcut-mate.jcaigc.cn/openapi/capcut-mate/v1/get_image_animations \
      -H "Content-Type: application/json" \
      -d '{
        "mode": 0,
        "type": "in"
      }'
    2. 获取VIP出场动画
    curl -X POST https://capcut-mate.jcaigc.cn/openapi/capcut-mate/v1/get_image_animations \
      -H "Content-Type: application/json" \
      -d '{
        "mode": 1,
        "type": "out"
      }'
    3. 获取免费循环动画
    curl -X POST https://capcut-mate.jcaigc.cn/openapi/capcut-mate/v1/get_image_animations \
      -H "Content-Type: application/json" \
      -d '{
        "mode": 2,
        "type": "loop"
      }'

    错误码说明

    错误码错误信息说明解决方案
    400type 参数必须为 in、out 或 loop动画类型参数无效使用正确的type值:"in"、"out"或"loop"
    400mode 参数必须为 0、1 或 2动画模式参数无效使用正确的mode值:0、1或2
    500获取图片动画失败内部处理错误联系技术支持

    注意事项

    1. type参数:必填参数,只能选择 "in"、"out"、"loop" 中的一个
    2. mode参数:可选参数,默认为0(所有动画)
    3. 响应数据:与文字动画不同,图片动画有专门的分类和效果
    4. 动画时长:单位为微秒(1秒 = 1,000,000微秒)
    5. VIP标识:部分动画可能需要VIP权限才能使用

    工作流程

    1. 验证必填参数(type)
    2. 验证可选参数(mode)的有效性
    3. 根据type和mode筛选图片动画数据
    4. 返回符合条件的动画对象数组
    5. 服务端自动处理数据格式化

    相关接口


    <div align="right">

    📚 项目资源
    GitHub项目名称: capcut-mate

    引言

    随着企业数字化转型深入,客户关系管理(CRM)已从“辅助工具”升级为“业务增长核心引擎”。对于中小企业而言,CRM的核心价值在于精准识别线索、分层运营客户、全流程追踪转化、数据驱动决策,以及与现有系统无缝协同

    本文选取5款代表性CRM产品——超兔一体云(综合性企业管理)、智赢云CRM(B2B场景侧重)、Agile CRM(初创友好)、Lusha CRM(B2B线索聚焦)、Apptivo(通用型) ,围绕线索查重、客户分级、全生命周期管理、客户数据分析、系统集成五大维度展开深度横评,为企业选型提供专业参考。

    一、对比框架说明

    1. 维度定义

    • 线索查重:解决多渠道线索重复问题,核心看“数据采集广度、规则自定义能力、实时处理效率”;
    • 客户分级:实现客户价值分层,核心看“分级模型科学性、自定义灵活性、动态调整能力”;
    • 全生命周期管理(CLM) :覆盖从线索到复购的全流程,核心看“阶段划分颗粒度、流程自动化程度、跨部门协同能力”;
    • 客户数据分析:将数据转化为决策依据,核心看“分析维度深度、可视化能力、决策支持价值”;
    • 系统集成:打破数据孤岛,核心看“集成范围、技术适配性、安全管理能力”。

    2. 品牌选择逻辑

    覆盖综合性、行业垂直(B2B)、初创友好、线索聚焦、通用型五大类型,满足不同企业需求。

    二、核心维度深度对比

    (一)线索查重:从“被动去重”到“主动防重”,解决多渠道冗余痛点

    线索是销售的“源头活水”,但多渠道(百度、抖音、官网等)带来的重复线索会导致销售重复跟进、客户体验下降。各品牌的差异本质是“数据覆盖广度”与“规则灵活度”的比拼。

    1. 超兔一体云:全渠道+自定义规则+实时处理,防重于未然

    超兔的线索查重逻辑通过流程图直观展示:

    暂时无法在飞书文档外展示此内容

    • 优势:10+渠道覆盖、精确/模糊规则自定义、实时处理避免后续问题。

    2. 智赢云CRM:多维度规则,适配B2B复杂需求

    支持“客户名+手机号+公司税号”多字段组合查重,规则可按“全局/部门/员工”分级配置(如总部统一手机号匹配,销售部加企业简称模糊匹配),适配B2B“多联系人、多分支机构”场景。

    3. 其他品牌表现

    • Agile CRM:基础字段匹配(手机号/邮箱),免费版适合初创,但多渠道覆盖有限;
    • Lusha CRM:B2B数据库匹配(同一企业的不同联系人),聚焦“决策者触达”;
    • Apptivo:未明确提及,需手动筛选,效率低。

    线索查重能力对比表

    品牌数据采集广度规则自定义实时处理适配场景
    超兔一体云10+渠道高(精确+模糊)实时全渠道线索企业
    智赢云CRM多渠道高(分级规则)实时B2B企业
    Agile CRM基础(网站+邮件)中(字段匹配)准实时初创团队
    Lusha CRMB2B数据库中(企业匹配)准实时B2B线索获取
    Apptivo有限低(手动)非实时通用型小企业

    (二)客户分级:从“经验判断”到“数据驱动”,精准分层运营

    客户分级的核心是“把对的资源给对的客户”,需结合“价值、行为、潜力”多维度建模。

    1. 智赢云CRM:RFM+CLV模型,B2B价值的科学分层

    基于RFM(最近购买、购买频率、购买金额)CLV(客户终身价值)模型,通过“客户360°全景视图”整合交易、跟进、服务数据,输出“高价值/VIP/潜力/流失风险”四层分级,且等级随数据实时更新(如6个月未交易的VIP自动降为“挽回型”)。

    2. 超兔一体云:自定义指标+标签联动,全行业适配

    支持企业自定义分级维度(如零售选“购买频率+客单价”,服务选“客单价+复购率”),并通过“标签联动”实现“行为+价值”双维度分层(如“点击新品广告”的客户自动归为“潜力客户”)。

    3. 其他品牌表现

    • Agile CRM:自定义标签分级(如“高活跃潜在客户”),灵活但缺乏模型支持;
    • Lusha CRM:B2B决策者岗位分级(如“中型科技企业销售总监”),聚焦触达效率;
    • Apptivo:手动标记(如“年消费10万+为VIP”),无动态调整。

    客户分级能力对比表

    品牌分级模型自定义灵活性动态调整适配场景
    智赢云CRMRFM+CLV实时B2B企业
    超兔一体云自定义指标库实时全行业
    Agile CRM自定义标签准实时初创团队
    Lusha CRMB2B决策者岗位准实时B2B线索触达
    Apptivo手动标记非实时通用型小企业

    (三)全生命周期管理:从“断点追踪”到“闭环运营”,提升转化效率

    CLM的核心是“不让任何客户在流程中流失”,需覆盖“需求培养→线索转化→成交→复购→推荐”全阶段,实现“流程自动化”与“跨部门协同”。

    1. 超兔一体云:客池阶段+工作流自动化,全流程无死角

    通过脑图展示核心逻辑:

    暂时无法在飞书文档外展示此内容

    • 优势:6个阶段颗粒度细,每个阶段有明确动作指引;工作流引擎实现“状态变化→自动任务分配→提醒触发”;跨部门数据共享确保认知一致。

    2. 智赢云CRM:一体化流程,B2B转化提效

    覆盖“商机→跟踪→报价→合同→回款→售后”全流程,支持“跟踪阶段自定义”(如“潜在→意向→谈判→成交”),并设置“自动弹窗提醒”(如3天未跟进自动提醒销售),某B2B客户案例显示转化率从75%提升至92%

    3. 其他品牌表现

    • Agile CRM:自动化营销+帮助台联动(如客户打开邮件→自动分配销售),适合初创;
    • Lusha CRM:聚焦“线索→决策者”跟踪,未覆盖成交后复购;
    • Apptivo:自定义流程模板,需手动操作,无自动化。

    全生命周期管理能力对比表

    品牌阶段颗粒度流程自动化跨部门协同适配场景
    超兔一体云细(6阶段)高(工作流)全行业
    智赢云CRM中(4-5阶段)高(自动提醒)B2B企业
    Agile CRM粗(3阶段)中(自动化营销)初创团队
    Lusha CRM细(线索-决策者)B2B线索触达
    Apptivo中(4阶段)低(手动模板)通用型小企业

    (四)客户数据分析:从“统计”到“决策”,让数据产生价值

    数据分析的核心是“从数据中找增长机会”,需实现“多维度分析、可视化展示、智能决策”。

    1. 超兔一体云:五大引擎,全维度决策支持

    通过数字卡片、图表自定义、同比环比、多表聚合、单日KPI五大引擎,实现“宏观(客户结构)→微观(单客户行为)”全维度分析:

    • 数字卡片:实时展示“今日线索、本周成交、本月复购率”;
    • 多表聚合:关联销售、服务、营销数据,分析“营销活动对复购的影响”;
    • 自定义图表:企业可按需生成“客户价值分布”“线索来源占比”等图表。

    2. 智赢云CRM:多维度报表+智能预警,B2B增长的“数据雷达”

    提供“客户价值分布、流失风险、转化漏斗”等报表,系统自动识别“高流失风险客户”(如近3个月未交易+服务工单多),并发送“挽回建议”(如专属折扣券)。

    3. 其他品牌表现

    • Agile CRM:客户行为分析(官网访问、邮件互动),AI生成“行为报表”;
    • Lusha CRM:B2B线索质量分析(线索→联系人转化率);
    • Apptivo:基础统计(线索来源、销售业绩),无深度分析。

    客户数据分析能力对比表

    品牌分析维度可视化能力智能决策适配场景
    超兔一体云全维度(宏观-微观)高(自定义图表)全行业
    智赢云CRMB2B增长维度中(多维度报表)B2B企业
    Agile CRM客户行为维度中(AI报表)初创团队
    Lusha CRMB2B线索质量维度中(转化率报表)B2B线索获取
    Apptivo基础统计维度低(固定报表)通用型小企业

    (五)系统集成:从“孤岛”到“中枢”,打破部门墙

    集成的核心是“让CRM成为企业数字化中枢”,需支持与“企业微信、钉钉、OA、ERP”等系统无缝对接。

    1. 超兔一体云:API+RPA,全场景覆盖

    通过API接口对接“ERP、OA、财务、企业微信、钉钉”等主流系统,通过RPA机器人对接“京东、淘宝”等无法API对接的系统,同时支持“数据映射转换”(解决不同系统数据格式差异)和“安全管理”(数据权限控制+交换审计)。

    2. 智赢云CRM:API+办公工具,B2B协同

    通过API对接“ERP、财务、OA”,通过第三方方案对接“企业微信、钉钉”,并支持对接“客如云”等餐饮零售系统(需开放平台)。

    3. 其他品牌表现

    • Agile CRM:支持Google Workspace、Zapier等海外工具,未适配国内系统;
    • Lusha CRM:对接Salesforce、HubSpot等海外CRM,无国内系统支持;
    • Apptivo:对接Gmail、QuickBooks,无国内系统支持。

    系统集成能力对比表

    品牌集成范围技术适配性安全管理适配场景
    超兔一体云API+RPA全场景高(权限+审计)全行业
    智赢云CRMAPI+办公工具中(第三方)B2B企业
    Agile CRM海外工具中(Zapier)初创(海外)
    Lusha CRM海外CRM中(Salesforce)B2B(海外)
    Apptivo基础工具低(Gmail)通用型小企业

    三、综合能力雷达图

    对五大维度进行10分制评分(越高越优),各品牌综合表现如下:

    品牌线索查重客户分级全生命周期数据分析系统集成综合得分
    超兔一体云9999109.2
    智赢云CRM898898.4
    Agile CRM778787.4
    Lusha CRM766656.0
    Apptivo556675.8

    四、选型建议

    • 全渠道+全流程+深度集成:选超兔一体云(适合多渠道线索、跨部门协同、需对接现有系统的企业);
    • B2B+转化提效+数据驱动:选智赢云CRM(适合B2B企业,需提升线索→成交转化率、挖掘增长潜力);
    • 初创+低成本+基础功能:选Agile CRM(适合预算有限、需要基础线索/客户管理的初创团队);
    • B2B线索+决策者触达:选Lusha CRM(适合需精准获取B2B决策者线索的企业);
    • 通用型+简单流程:选Apptivo(适合需求简单的小企业)。

    结论:CRM的未来,是“行业化+智能化+生态化”

    优秀的CRM需具备“全渠道数据覆盖、数据驱动分层、全流程自动化、深度系统集成”四大特征。未来,CRM将向行业化深化(如B2B、零售、餐饮的定制功能)、智能化升级(AI线索评分、流失预警)、生态化协同(与更多系统联动,成为企业数字化中枢)发展。

    企业选型的核心是聚焦自身需求——避免“大而全”,而是“解决核心痛点”。选对CRM,才能让其真正成为“增长引擎”。

    (注:文中功能相关描述均基于公开披露信息,具体功能服务以厂商实际落地版本为准。)

    1月15日,阿里巴巴召开发布会宣布,千问App全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务。我们看到:AI 正在第一次以“统一入口”的形态,介入真实世界的事务流转之中。点外卖、订机酒、安排行程,这些原本需要用户在多个 App、多个界面之间反复切换、逐步完成的行为,被压缩进一次自然语言指令里。系统不再要求用户理解流程,而是开始为“事情是否办成”负责。
    图片
    以千问为代表的变化,本质上并不是一次单纯的交互升级,而是软件范式的一次前移。长期以来,无论是 C 端还是 B 端,软件都被设计为“功能集合体”:用户需要知道自己要用哪个产品、进入哪个模块、沿着哪条路径完成操作。AI 的角色,更多是辅助理解、提高效率。但当 AI 开始站到前台,成为唯一入口时,系统内部的复杂度第一次被整体后移,任务拆解、路径选择和资源调度,被交由模型在后台完成。这意味着,软件的价值开始发生根本变化。它不再只是一个被“使用”的工具,而逐渐演化为一层行动基础设施:用户关心的,不再是“我在用什么系统”,而是“我能不能把这件事一次性办好”。当这一判断成立,软件行业的重心,事实上已经发生了偏移。

    一、To B 软件,正在经历“千问”之前的阶段性矛盾

    这一变化最先在消费领域显现,但真正承受结构性冲击的,很可能是 To B 软件行业。

    与 C 端不同,企业软件天然承载着更高的复杂度:业务场景多样、流程高度定制、系统之间长期割裂。为了覆盖不确定需求,系统不得不暴露大量功能、配置项和专业概念,复杂度逐年累积,最终形成“厚系统”的常态。在过去很长一段时间里,这种复杂性被视为一种合理存在,甚至被当作专业壁垒。企业用户习惯于接受培训、学习系统、适应流程,因为没有更好的选择。但 AI 的出现,正在动摇这一前提。

    当模型开始具备理解业务目标、拆解任务逻辑并跨系统执行的能力时,一个长期被忽视的问题被重新放大:企业真正需要的,从来不是“用好系统”,而是“把事办完”。从这个角度看,当前 To B 软件所处的阶段,与“千问出现之前”的多 App 生态高度相似。能力并不弱,功能甚至十分强大,但入口分散、系统割裂、任务需要人在不同系统之间手工串联。每一个系统都在解决局部问题,却缺乏一个能够站在全局、为结果负责的统一入口。这也解释了为什么过去一年里,Copilot、Agent、智能助手会在 To B 领域集中出现。它们并不是偶然的创新,而是旧范式走到边界后的自然反应。

    但需要警惕的是,如果 AI 只是停留在“帮你更快操作系统”的层面,那么复杂度并不会真正消失,只是被稍微缓解。真正的变化,必须发生在入口层。可以预见的是,To B 软件的下一轮竞争,将不再只是功能与架构之争,而是一次关于“谁能更早把复杂系统藏起来”的竞争。当用户不再需要理解系统内部结构,就能把复杂业务目标清晰地交付给软件时,系统的价值才会被重新定义。

    二、从单点智能到超级入口:To B AI 正在形成一条高度共性的演进路径

    站在今天回看,To B 领域的 AI 应用并非零散试验,而是已经逐步显现出一条高度共性的演进路径。

    最早出现的,是单点场景下的智能化尝试:在某一个系统、某一个环节中,用 AI 替代人完成部分原本依赖专业经验或技术门槛的操作。这一阶段的核心价值在于效率提升,AI 更多扮演的是“助手Copilot”角色,站在系统一侧,为既有流程提速,却并不改变流程本身的组织方式。

    但很快,这种“局部加速”便触及边界。当系统数量不断增加、业务链条不断拉长,用户真正的痛点不再是“某一步慢”,而是“整件事需要在多个系统之间反复切换、人工串联”。在这一背景下,AI 的角色开始发生变化——它不再只是辅助完成操作,而是逐步承接“任务本身”。用户不再需要描述具体的执行步骤,而是直接表达业务目标,由系统自动完成任务拆解、路径规划与能力组合。这一变化看似只是交互体验的升级,实则意味着执行权的实质性转移:

    人从“操作者”转为“确认者”,而系统开始承担组织复杂任务的责任。

    到这一阶段,AI 已经不再是附着在系统之上的能力插件,而开始深度影响系统的运行逻辑。当这种能力继续向前演进,最终形态几乎是确定的——一个超级入口。

    所有能力不再以割裂的系统形态呈现,而是在一个前台入口之下被统一调度、按需调用。对用户而言,系统的存在感被极大削弱,复杂度整体后移;对厂商而言,竞争焦点也随之发生转移,从“功能是否足够全面”,转向后台能力是否足够稳定、协同是否足够顺畅、体系是否具备长期演进空间。这条路径,并非某一家厂商的偶然选择,而是 To B AI 在复杂业务环境中反复试探后的必然收敛。

    三、袋鼠云“一体两翼”战略的深层解构

    在这一通用路径之下,袋鼠云已经开始从体系结构层面进行前置准备,而不是仅在应用层叠加智能能力。袋鼠云提出的“一体两翼”战略,本质上正是围绕这种“超级入口”形态展开的长期设计。底层以多模态数据智能中台作为统一的数据处理与供给基座,上层则在数据智能与空间智能两个方向,分别演化出灵瞳智能体、EasyAI数字孪生智能体、数字人智能体等不同形态的 AI 能力,由底层中台承载复杂性,由上层智能体面向人,逐步过渡到“可执行”的 AI 入口。具体来看:

    数据开发灵瞳智能体:让复杂的数据工程逐步“隐身”

    灵瞳智能体所对应的,是最靠近数据底座的一层能力。它面向的是数据开发与运维过程中最重、最专业的环节,通过自然语言与上下文理解,协助完成 SQL 编写与优化、日志诊断、任务排错等工作。在体系中,它的价值并不仅是“提高开发效率”,而是在为后续“一句话执行任务”奠定基础——当数据处理本身可以被 AI 稳定理解与执行,数据中台才有可能真正成为可调度的执行底座。
    图片

    数据智能:以 AIMetrics智能指标为代表智能问数与分析智能体

    在数据被稳定处理和供给之后,下一层面向的是业务理解与决策支持。以 AIMetrics 智能指标智能体为代表,这一层能力通过自然语言交互,让业务人员无需理解底层模型与口径,也能快速获取指标、完成分析并生成洞察。在整体体系中,它承担的是“把数据转化为业务语言”的角色,是未来超级入口中最直接面向业务用户的一环。

    空间智能:EasyAI 数字孪生与数字人智能体

    如果说前两层解决的是“数据怎么来、怎么分析”,那么空间智能解决的则是“如何被感知和理解”。以易知微的 EasyAI、数字孪生智能体与数字人 Agent 为代表,这一层能力将数据嵌入具体空间与场景之中,通过可视化、沉浸式交互和数字人表达,让复杂信息以更直观、更可交互的方式呈现出来。在未来统一入口的形态下,它更像是 AI 执行结果的“最终表达层”。

    从整体来看,这三类智能体今天仍然分布在不同产品与场景中,但它们共同指向的,是同一个方向:当多模态数据中台能够稳定供给数据,当数据智能能够理解业务意图,当空间智能能够承载结果表达,前台才有条件真正收敛为一个 All in One 的超级入口。也正是在这一意义上,袋鼠云的实践并非孤立产品展示,而是 To B 软件行业迈向“AI 行动入口时代”的一个缩影。

    四、ToB 软件服务商的时代命题

    这样的实践并非袋鼠云的独有判断,而是整个 To B 软件行业正在共同逼近的结构性问题。当 AI 成为真正的行动入口,所有复杂系统都将被迫重新审视自身的存在方式:哪些复杂性必须保留,哪些应该被整体隐藏;哪些能力需要被显式暴露,哪些可以交由系统自动协同。未来的软件,不再以“你在用什么系统”来定义价值,而是以“你能把什么事情交给系统”来衡量能力。从这个意义上说,千问这次的发布会,并不只是一次产品层面的变化,而是一种提前显现的行业预演。它所揭示的,是当 AI 开始为结果负责时,软件形态将如何被迫重写。对 To B 软件行业而言,这场变化已经开始,而真正的分化,才刚刚拉开序幕。软件的下一个十年,注定属于那些敢于主动拆解复杂度、并率先完成范式迁移的参与者。

    📊 Redis Cloud 成本报表 API 正式 GA
    Redis Cloud 现已推出成本报告 API(Cost Report API),让你能够直接、自动地获取账单数据,而无需再依赖手动从管理界面下载。
    该 API 基于 FinOps 开放成本与使用规范(FinOps Open Cost and Usage Specification, FOCUS) 构建,能够与 FinOps 平台、内部仪表盘和分析工作流无缝集成。你可以按需生成报告,根据日期、订阅、数据库、区域或标签进行筛选,并通过单个端点以 JSON 或 CSV 格式导出结果。这为财务、采购和工程团队提供了一致、结构化且真正可付诸行动的成本数据,让追踪支出、自动化报告和扩展用量变得更加容易,而无需担心账单问题成为阻碍。了解更多,请查阅官方文档。

    🔒 AWS PrivateLink for Redis Cloud Pro 开放公测
    Redis Cloud Pro 现已支持 AWS PrivateLink,并进入公开预览阶段。该功能使你的应用程序能够直接从 AWS 虚拟私有云(VPC)内,以私密方式连接到 Redis Cloud。
    借助 PrivateLink,所有流量将完全在 AWS 网络内部流转,无需使用公共端点、VPN、NAT 网关或中转网关。这简化了网络架构,同时满足了更严格的安全性和合规性要求,有助于团队推进那些曾因网络或安全审查而被阻滞的部署项目。

    🔑 Redis Software 8.0.6 新增 SAML SSO 支持
    Redis 软件 8.0.6 版本为其集群管理器 UI 新增了基于 SAML 的单点登录功能。目前,Redis 软件同时支持基于 SAML 2.0 的身份提供商(IdP)发起和服务提供商(SP)发起的 SSO 流程。团队现在可以通过其现有的身份提供商进行认证,而无需再管理独立的用户名和密码。查看相关文档。

    🤖 Redis University:全新 GenAI 实战实验上线
    Redis University 在 12 月新增了 两门自学型 GenAI 实战实验(Self-paced Labs),面向真实生产场景设计,而非“玩具 Demo”。

    使用 RedisVL 进行向量搜索
    这个 面向初学者的实验 将引导您利用 RedisVL 库,把 Redis 用作向量数据库。您将使用一个真实的 JSON 电影数据集,定义模式,存储并索引向量化数据,并运行多种搜索技术,包括 KNN 最近邻搜索、带过滤的向量搜索和范围查询。

    构建一个生产级的 RAG 聊天机器人
    在此实验中,您将构建一个由 Redis 支持的可运行 RAG 聊天机器人。您将准备、嵌入、索引并检索真实世界的数据,连接大语言模型来生成基于事实的回答,然后利用语义缓存和记忆功能将应用产品化。最终您将获得一个成本高效、可用于生产的聊天机器人,而不仅是一个用完即弃的演示程序。

    全新学习路径:运维 Redis Software
    Redis University 还推出了一个面向 在自管理或本地环境中运行 Redis 的团队的全新学习路径。
    该路径涵盖了核心运维概念,包括集群、节点、数据库和日常运维。其设计目标是帮助团队有信心地运维 Redis Software,提升部署在跨环境扩展时的可靠性和可预测性。

    DigitalOcean(纽约证券交易所代码:DOCN)——全球领先的综合性智能体云(agentic cloud)平台,宣布与全球领先的数字工程与企业现代化服务商 Persistent Systems(孟买证券交易所代码:533179;印度国家证券交易所代码:PERSISTENT)达成一项多年期、年均金额达八位数的战略合作,为全球数字原生企业及开发者提供更经济、可扩展且安全的人工智能(AI)解决方案。此次合作旨在通过提供高性价比、易于获取的基础设施,加速 AI 技术的落地应用,为创新和业务增长提供坚实支撑。

    作为合作的重要组成部分,Persistent 已选定 DigitalOcean 为其独家云与 AI 基础设施提供商,用于支持其自研的 AI 驱动平台 SASVA™。SASVA™ 能够无缝整合代码、文档、架构图及高管摘要,并灵活适配各类工作流和角色需求。该平台依托 DigitalOcean Gradient™ AI 智能体云运行 AI 工作负载和客户部署,不仅利用 Gradient AI 平台覆盖从开发到部署的完整智能体生命周期,还采用 DigitalOcean Gradient AI 基础设施中提供的高性能GPU资源,确保高效、可靠且成本可控的运行体验。

    随着企业加速拥抱 AI,他们正面临多重挑战:GPU 与基础设施成本不断攀升、智能体开发生态碎片化、以及日益严峻的安全与合规压力。Persistent 与 DigitalOcean 的此次合作,正是为了系统性地破解这些障碍——将 Persistent 在 AI 工程领域的深厚积累与平台创新能力,与 DigitalOcean 强大的智能体云基础设施及 AI 平台相结合。双方已就 SASVA™ 及其推理工作负载在 Gradient AI 智能体云上的长期部署作出承诺,共同打造安全、经济、企业级就绪的 AI 解决方案,助力各类规模的组织实现切实可行的 AI 价值与规模化应用。

    借助 DigitalOcean 智能体云的能力延伸,Persistent 将帮助客户通过高性价比的 AI 部署实现可量化的业务成果与加速发展。​这一合作有望将 AI 基础设施与运营成本降低 50% 以上,显著加快各行业 AI 应用的采纳速度,并实现更可预测的规模化扩展。​同时,Persistent 还将结合其 SASVA™ 平台与深厚的工程能力,助力 DigitalOcean 加速推进其 AI 产品路线图,进一步提升下一代 AI 云平台在性能、效率与功能方面的综合竞争力。

    这一合作也彰显了像 Persistent 这样的领先技术服务企业正选择 DigitalOcean 作为其下一代 AI 工作负载的核心引擎。Persistent 之所以选择 Gradient AI 智能体云,正是看中其在性能、透明度与成本可预测性方面的卓越表现,能够为数字原生企业和 AI 原生客户提供业界一流的基础设施。此外,该平台还支持 AI 技术演进过程中的无缝扩展,通过托管式、开箱即用的环境大幅降低基础设施与运维成本,并持续为 SASVA™ 用户提供丰富多样的模型、框架及 AI 加速器资源。

    DigitalOcean 首席执行官 Paddy Srinivasan 表示:“我们的智能体云致力于提供让 AI 触手可及、易于扩展且成本可控的基础设施、平台与服务。与 Persistent 的合作,将把这些能力拓展至更多企业级应用场景,把我们的 AI 基础架构与 SASVA™ 所代表的确定性工程方法深度融合。我们正携手推动 AI 解决方案的大规模落地。”

    Persistent Systems 首席执行官兼执行董事 Sandeep Kalra 表示:“当企业从 AI 实验阶段迈向全面嵌入核心业务的新阶段,成功的关键在于能否以速度、信任和可衡量的影响实现规模化。我们与 DigitalOcean 的合作正是这一转型的典范——将 Persistent 在 AI 工程领域的专长与 SASVA 平台,与 DigitalOcean 的智能体云相结合,帮助客户自信地将 AI 投入生产运营。我们正在简化组织构建、部署和扩展 AI 的方式,为下一波由智能平台驱动的创新浪潮夯实基础。”

    1月17日,“AI赋能・智造焕新”2026南京CIO数智化论坛暨CIO老友聚晚宴在南京举行。大会汇聚了省内制造业的近百名CIO、信息总监、IT负责人及数字化服务商代表,共同解锁AI +制造的新可能,Zoho作为全球知名SaaS厂商,携制造业数智化转型方案亮相现场,与业界共话产业升级新机遇。

    苏南作为中国制造业的核心承载地之一,拥有多个国家级先进制造业集群、5G工厂、灯塔工厂,数字化工具普及率位居前列。江苏省企业信息化协会副会长兼秘书长徐泰伟在致辞中提到,2026作为AI应用热点元年,政策红利持续释放!从网络化1.0、信息化2.0、数字化3.0到如今的智能化4.0阶段,数智转型已迈入全新赛道。

    作为全球企业服务领域的深耕者,Zoho携Zia智能助手生态及制造业 AI 解决方案亮相,依托自主研发的全栈技术栈,提供从流程自动化到智能决策的全周期服务。其AI智能体矩阵可实现生产协作优化、销售效率提升等核心场景落地,助力制造业打破信息孤岛,降低转型成本。

    此次亮相,Zoho不仅展现了全球SaaS厂商的技术积淀,更传递了“以AI赋能智造升级”的理念,为江苏制造业数智化转型注入新动能,持续推动产业向高效、智能的方向迈进。

    做量化交易系统的后端开发,最头疼的不是策略算法(那是 Quants 的事),而是数据管道(Data Pipeline)的健壮性。

    特别是处理历史 Tick 数据时,我们面临的是一个典型的“高并发写入+高精度时序”场景。在早期的架构设计中,我经常因为低估了 Tick 数据的体量和复杂性,导致系统在回放时出现“幽灵交易”——即数据到达顺序与交易所撮合顺序不一致。

    工程上的三个拦路虎

    时间戳的绝对真理: 在分钟线级别,这一秒和下一秒区别不大。但在 Tick 级别,毫秒级的乱序就是灾难。工程上必须严格依赖 Exchange Timestamp 而不是本地接收时间。

    分页与流量控制: 也就是 Pagination。一次请求拉取全天 Tick 是不现实的,HTTP 响应体过大会导致超时或内存溢出。

    异构数据源: 历史归档数据通常是冷存储结构,而实时流是 WebSocket 热数据,如何用一套代码兼容这两种接口?

    高效的解决方案

    为了解决这些 IO 密集型任务,我的思路是:将数据获取层(Ingestion Layer)完全解耦。

    不要尝试自己在应用层去清洗原始报文。目前比较成熟的做法是直接对接第三方聚合 API。以我目前使用的 AllTick API 为例,它在服务端已经做好了清洗和标准化。这就相当于把复杂的 ETL 过程外包了出去,我们只需要通过简单的 HTTP 请求拿到 JSON 格式的结构化数据。

    这样,我们的工程重心就可以从“怎么抓数据”转移到“怎么用数据”上。

    代码实现:构建数据拉取器

    下面是一个基于 Python requests 库构建的简单拉取器原型。注意看参数中的 limit 和时间窗口设置,这是处理大流量数据的关键:

    import requests
    
    API_KEY = "YOUR_API_KEY"
    BASE_URL = "https://api.alltick.co/v1/market/tick/history"
    
    params = {
        "symbol": "AAPL.US",
        "market": "US",
        "start_time": "2024-01-02 09:30:00",
        "end_time": "2024-01-02 09:31:00",
        "limit": 1000
    }
    
    headers = {
        "Authorization": f"Bearer {API_KEY}"
    }
    
    resp = requests.get(BASE_URL, params=params, headers=headers)
    data = resp.json()
    
    for tick in data.get("data", []):
        ts = tick["timestamp"]
        price = tick["price"]
        volume = tick["volume"]
        print(ts, price, volume)

    架构师视角的补充

    在实际生产环境中,这段代码拉下来的数据,我不建议直接进 Pandas 分析,而是应该先进入消息队列(如 Kafka)或者写入 ClickHouse 这样的列式数据库。

    为什么?因为历史 Tick 的价值在于高保真回放。标准化的接口解决了“源头”问题,而合理的存储架构解决了“流转”问题。这才是构建低延迟交易系统的正确姿势。

    在数据处理工作中,提取 PDF 文档中的文本和图像坐标是一个常见需求。本文将介绍如何使用 Spire.PDF for Python 库实现这一功能,通过简单的代码示例帮助你快速上手。

    Spire.PDF 简介

    Spire.PDF for Python 是一个功能强大的 PDF 处理库,允许开发者以编程方式操作 PDF 文件。它支持提取文本、图像、元数据等。当我们需要获取特定文本或图像的坐标时,这个库显得尤为便捷。

    安装命令:pip install spire-pdf

    坐标系设定

    在 Spire.PDF 中,坐标系设定非常重要:

    1. 原点 (0, 0) 位于页面的左上角。
    2. X 轴向右延伸,Y 轴向下延伸。

    理解这一点有助于我们更好地定位 PDF 中的元素。

    获取文本坐标

    以下是使用 Spire.PDF 提取 PDF 中指定文本坐标的步骤:

    1. 创建 PdfDocument 对象。
    2. 加载 PDF 文档。
    3. 获取特定页面。
    4. 创建 PdfTextFinder 对象并设置查找选项。
    5. 查找文本并获取其坐标。

    下面是获取文本坐标的示例代码:

    from spire.pdf.common import *
    from spire.pdf import *
    
    # 创建 PdfDocument 对象
    doc = PdfDocument()
    
    # 加载 PDF 文档
    doc.LoadFromFile("Input.pdf")
    
    # 获取特定页面
    page = doc.Pages.get_Item(0)
    
    # 创建 PdfTextFinder 对象
    textFinder = PdfTextFinder(page)
    
    # 指定查找选项
    findOptions = PdfTextFindOptions()
    findOptions.Parameter = TextFindParameter.WholeWord
    textFinder.Options = findOptions
    
    # 在页面中查找字符串 "隐私政策"
    findResults = textFinder.Find("隐私政策")
    
    # 获取查找结果中第一个实例
    result = findResults[0]
    
    # 获取找到文本的 X/Y 坐标
    x = int(result.Positions[0].X)
    y = int(result.Positions[0].Y)
    print("The coordinates of the first instance of the found text are:", (x, y))
    
    # 释放资源
    doc.Dispose()

    代码解析

    • PdfDocument 对象用于打开现有 PDF 文件。
    • 通过 PdfTextFinder 可以轻松找到指定文本,设置的查找选项允许忽略大小写并确保匹配完整单词。
    • 最后,通过 result.Positions 获取文本坐标,其中 (0, 0) 表示页面的左上角。

    获取图片坐标

    获取图像坐标的过程与文本提取类似,但使用 PdfImageHelper 处理图像信息。以下是示例代码:

    from spire.pdf.common import *
    from spire.pdf import *
    
    # 创建 PdfDocument 对象
    doc = PdfDocument()
    
    # 加载 PDF 文档
    doc.LoadFromFile("Input.pdf")
    
    # 获取特定页面
    page = doc.Pages.get_Item(0)
    
    # 创建 PdfImageHelper 对象
    imageHelper = PdfImageHelper()
    
    # 获取页面中的图像信息
    imageInformation = imageHelper.GetImagesInfo(page)
    
    # 获取指定图像的 X/Y 坐标
    x = int(imageInformation[0].Bounds.X)
    y = int(imageInformation[0].Bounds.Y)
    print("The coordinates of the specified image are:", (x, y))
    
    # 释放资源
    doc.Dispose()

    代码解析

    • 使用 PdfImageHelper 类来获取特定页面上的所有图像信息。
    • 通过 imageInformation 对象获取图像的边界坐标(X, Y),便于后续处理。

    总结

    本文介绍了如何使用 Spire.PDF for Python 提取 PDF 中文本及图像的坐标,并提供了相关示例代码。无论是在信息提取、数据分析,还是文档处理方面,掌握这些技术都将极大提升你的工作效率。希望这篇博客能帮助你快速上手 PDF 坐标提取的相关操作!

    当团队开始协作、项目变得复杂时,“用个表格还是拉个群”的管理方式很快就会捉襟见肘。这时,一个专业的项目管理系统就显得尤为重要。它不仅能帮你理清任务、跟踪进度,更能整合资源、沉淀知识,让团队效率大幅提升。

    但问题是,项目管理系统有哪些值得选?市面上产品众多,每款都宣称自己最好,到底哪款适合你的团队?我们深度测评了5款主流且特点分明的项目管理工具,帮你从真实功能和应用场景出发,做出明智选择。

    1. 支道:不止于项目管理的业务“无代码”平台

    https://www.zdsztech.com

    首先要介绍的是支道,它在许多寻求深度业务管理的企业中,正成为一匹黑马。

    它的核心优势在于“无代码”和“一站式”。简单说,它不仅仅是一个项目管理(PMS)模块,更是一个可以通过“拖拉拽”自主搭建应用的管理平台。这意味着,你的项目如果涉及复杂的上下游流程——比如需要联动销售合同、采购物料、管理生产工单、核算项目成本——支道可以让你在一个系统内打通这些环节,而无需在多个软件间切换、导数据。

    从项目管理角度看,它提供了从项目立项、任务分解(WBS)、甘特图进度跟踪、工时填报,到预算管控、风险问题管理、项目复盘的全套功能。特别值得一提的是,它能很好地支持项目型销售工程服务类项目,将前期的商机、报价与后期的交付、成本结算串联起来,实现真正的业财一体化。

    如果你所在的是制造业、工程服务业、贸易公司等业务链条较长的企业,不仅需要管理项目任务,更希望将客户、供应商、物料、财务等资源进行一体化管理,那么支道这种灵活的平台型解决方案会非常有潜力。

    2. PingCode / Worktile

    在国内的协作办公领域,PingCode和Worktile常常被一同提及,它们都发源于同一家公司,如今侧重不同,但都非常成熟。

    PingCode 现在明确聚焦于 “软件研发项目管理”。如果你的团队是做互联网产品或软件开发的,PingCode几乎是为你们量身定做。它深度支持敏捷开发(Scrum、看板)、需求池管理、测试用例管理、缺陷跟踪,还能与Git、Jenkins等开发工具集成,覆盖从构思到发布的完整生命周期。它的专业度很高,能极大提升研发团队的规范性和效率。

    Worktile 则更偏向 “通用团队任务协作与项目管理”。它的界面直观友好,看板、列表、甘特图、日历等视图一应俱全,上手很快。它适合市场、运营、人事、行政等各类职能团队,用于管理活动策划、内容排期、招聘流程等各类项目。其“企业版”也提供了项目集、目标管理(OKR)等更体系化的功能。

    简单区分:你需要管的是写代码的研发过程,重点选PingCode;你需要管的是公司里各种各样的跨部门协作项目,重点看Worktile。

    3. Asana

    在国际市场上,Asana 以其卓越的用户体验和设计感著称。它更像一个强大、智能的“团队任务中枢”。

    它的核心在于 “任务管理”与“规则自动化”。你可以非常方便地创建项目、分解任务、设置依赖关系、分配负责人和截止日期。Asana的时间线(Timeline,即甘特图)视图直观漂亮,能清晰展示项目全貌。其强大的“规则”(Rules)功能,可以自动完成很多琐事,比如“当任务标记为完成时,自动通知相关成员并移动至‘已归档’栏目”,这能节省大量手动操作时间。

    Asana的优势还体现在对远程和全球化团队的友好度上,其界面语言、协作方式和集成生态(与Slack、Google Drive等无缝连接)都非常国际化。它不一定像专业软件那样管理“物料清单”或“成本核算”,但在确保信息透明、流程顺畅、团队对齐方面,表现极为出色。

    适合团队:注重协作体验、团队成员分布在不同地区、项目以知识工作和创意任务为主的公司,尤其是外企或出海团队。

    4. 禅道

    禅道是中国本土较早、较知名的开源项目管理软件之一,承载了许多团队对项目管理的启蒙。它的特点非常鲜明:功能全、流程规范、开源免费。

    它严格遵循项目管理标准流程,覆盖了从产品需求、项目任务、测试用例到缺陷管理的完整闭环。权限设置非常细致,能够适应中大型团队对流程管控的严格要求。对于习惯了“需求-开发-测试-发布”这一套传统或敏捷混合流程的团队来说,禅道提供了非常稳重和可靠的框架。

    “开源”是其最大亮点之一。这意味着你可以免费下载使用,并且如果拥有技术团队,可以对它进行深度的二次开发和定制,理论上可以实现无限的可能。当然,这也意味着你需要一定的运维成本。他们也提供付费的企业版和云服务,能获得更稳定的技术支持。

    适合谁:预算有限但有一定技术能力(或愿意学习)的团队;对研发过程管理规范性要求高、需要一款功能全面且可控的软件的公司。

    5. Microsoft Project + Teams

    对于大型工程、基建、科研或超大型产品研发项目而言,Microsoft Project(尤其是Project Online/Server版)几乎是专业级的代名词。它的核心能力在于极其强大的项目计划、资源管理和成本分析。

    你可以创建多层级的任务结构,精准定义依赖关系,并通过关键路径分析找到项目的核心瓶颈。它的资源池管理功能,能帮你规划和平衡每个人、每台设备的工作负荷,避免资源冲突。在成本预算和控制方面,它的能力也非常深厚。

    当然,传统的Project较为笨重,协作性不足。现代的使用方式,是与 Microsoft Teams 和 Planner 等工具结合。Teams负责日常沟通和轻量任务协同,Planner管理小型项目看板,而复杂的大型项目计划则用Project专业制定和监控,三者数据可以打通。

    适合场景:管理周期长、任务关系复杂、资源约束严格的大型复杂项目(如建筑工程、硬件研发、政府项目)。尤其适合已经全面采用Microsoft 365生态的大型组织。

    如何做出你的选择?

    看完了上面五款工具,你可能还是有些纠结。

    如果你的项目与销售签约、采购执行、生产交付、成本核算深度绑定,比如一个设备安装工程或一个定制产品订单,那么像支道这样能打通前后端业务的平台就更具优势。

    拍板最后决定前,建议锁定一两个最符合心里预期的选项,然后务必去申请产品演示或免费试用。让核心团队成员亲自用一用,看看是否能直观地上手,流程是否符合你们的作业习惯。真正的“好系统”,是那个团队愿意用、喜欢用,并能实实在在提升效率、减少混乱的系统。

    这期分享的安全会议是来自安全顶级会议之一的ACM CCS 2025,题目是You Can’t Steal Nothing: Mitigating Prompt Leakages in LLMs via System Vectors(你无法窃取任何东西:通过系统向量缓解LLM中的prompt泄露),官网链接为https://dl.acm.org/doi/10.1145/3719027.3765124

    一、研究背景

    大型语言模型(LLMs)已广泛应用于各类场景,通过定制化系统提示实现多样化任务。在某种程度上,系统提示已成为LLMs应用中最宝贵的资产。作为交互开始时的引导语,系统提示定义了LLMs回应的行为模式、语气风格和范围,使其性能能够精准匹配特定用户或应用场景的需求。

    然而LLMs存在系统提示词泄露风险,最初的提示词泄露攻击可能只是要求大语言模型简单进行prompt的重复,到后面攻击手段进化成诱导模型忽略指令进行重复prompt。一些防御策略被提出以防范提示词泄露攻击,例如通过监督微调或与精心设计/收集的提示泄露样本进行偏好对齐,这种防御手段确实也有效抵挡了一些简单的提示词泄露攻击。

    但是在面对一些经过精心设计,更加复杂的攻击时,LLM就很难实现有效的防御,根本原因是重复和调用上下文是模型的核心能力之一。所以为了从根源解决提示词泄漏攻击,本文作者提出了一个思路,即以不同形式将系统提示输入LLM,而非将其置于上下文中。这种情况下即使LLM可以重复上下文,也没办法导致提示词泄漏攻击,因为prmopt并非处于上下文环境中。

    二、本文工作概述

    本文提出了一种简单却高效的提示泄露策略,用于检测当前 SOTA 大语言模型(LLM)的提示泄露风险。该策略的核心在于帮助LLM记住其上下文片段,从而恢复上下文重复能力。通过这一策略,本文成功绕过了现有 SOTA 的防御手段,从主流商用模型(如GPT-4o、Claude 3.5 Sonnet和Gemini 1.5)中获取了系统提示甚至存储的用户信息。

    本文提出了一种基于表征的防御机制SysVec,通过将系统提示移出大语言模型(LLM)的文本上下文来防止信息泄露。具体而言,SysVec将系统提示转化为LLM内部空间中的隐藏表征向量,确保这些提示不会在原始文本输出中被暴露或重复。

    三、“记住开头”攻击(Remember-the-Start Attack)

    “记住开头”攻击是本文提出的提示泄露风险,具体来说,攻击者虽然不知道系统的准确起始内容,但会利用公开来源的前缀进行猜测(例如“你是ChatGPT”)。攻击者通过推测系统提示的典型开头语句,帮助大语言模型(LLM)重新聚焦上下文中的系统提示部分,并引导其重复系统提示。

    例如,许多系统提示以“你是[Chatbot Name]...”这类开头。攻击者可以设计引用这类知识片段的查询,但省略直接指示例如“忽略”或“重复”。通过这种方式,LLM可能恢复其正常的上下文重复能力并泄露系统提示。我们在图1中展示了真实案例,成功获取了GPT-4o的系统提示及记录的用户个人信息。

    “记住开头”攻击可以通过迭代优化来提升效果。攻击者在获得初始攻击结果后,会利用过往成功尝试的更多信息来改进前缀,尝试使用
    “从‘# bio’开始”、“从‘# bio \n [2024’”等策略,逐步提高攻击成功率或收集更多隐藏信息。这也是“记住开头”攻击的关键特征:攻击者可以通过“随机尝试”的方式重复改进攻击请求以提高成功率。不过在本文中,为确保攻击效果的确定性,作者直接采用预设的初始化参数来执行攻击。
    图片
    图1 攻击案例四、SysVec设计“记住开头”攻击的成功使得本文进一步探索当前LLM提示词泄露的有效缓解方案。传统的文本prompt大概是通过如下的流程嵌入到模型中:系统提示(System Prompt Text)作为一段可读文本,与用户输入一起进入模型上下文。系统提示经过 tokenizer,被转换为一系列 token embedding。这些 token embedding 与用户输入的 embedding 一样,进入 Transformer 的:Attention 层MLP(前馈网络)一个不得不面对的关键问题是由于系统提示词信息以明文形式与用户的输入混杂在上下文中,攻击者能够通过恢复上下文重复功能,诱导模型泄露信息。
    图片

    所以本文设计了一个新的思路,即将系统提示词移除上下文的语境,同时不牺牲其在引导LLM生成和保持LLM执行广泛任务能力方面的性能。表征工程(RepE)为本文的研究指明了一个好的方向,表征工程旨在识别LLM内部隐藏表征空间中特定层级的表征向量v,该层级控制模型生成以遵循特定行为或偏好。其实这里的表征向量v就类似我们以明文形式设定在上下文中prompt。SysVec框架下的prompt嵌入流程大概如下:系统提示文本不再直接用于推理时的上下文输入。系统提示在训练或离线阶段进行映射、压缩成为一组内部表示,而不是token序列生成系统向量直接注入 Transformer 内部所以本文需要解决的问题就聚焦于如何将文本系统提示转化为对应的系统向量。本文提出一种基于优化的方法来寻找这个能够代替prompt的系统向量,优化的目标如下
    图片

    其中Y1和Yw的表达式分别如下,Y1表达的含义是用户指令x为输入生成的回复(称为 “非偏好回复”),Yw表达的含义是LLM以文本系统提示词s + 用户指令x为输入生成的回复(称为 “偏好回复”);:
    图片

    那么这个优化函数的目的是找到一个系统向量,将其加入到模型的中间特征之后,模型生成偏好性回复的概率加大,而非偏好性回复的概率降低。这个系统向量就会成为我们需要的那个能够代替文本提示词的关键向量。

    五、设计优劣

    文章通过大量的实验证明了SysVec的设计在不同模型与攻击场景下,都能显著减少提示词泄露程度,且SysVec在保留模型功能完整性上表现更好,不影响模型正常输出质量或语义推理能力。

    但是这种设计也存在局限性,首先是由于系统提示词是通过向量的形式嵌入到模型中,因此需要“白盒访问”模型内部,在某些场景(例如使用第三方API)不太现实,其次提示调整的灵活性不如文本提示直观。

    六、艾体宝Mend.io(原Whitesource) 系统提示词泄露测试方案
    Mend.io 作为一个完整统一的应用安全测试平台,将 AI 安全纳入到统一的安全测试与治理框架中,其 AI 红队(AI Red Team)功能能够在不同预设攻击场景下,对大语言模型及其应用进行系统化的提示词泄露攻击尝试。

    该能力通过模拟真实攻击者的交互方式,覆盖包括上下文恢复、语义诱导、角色混淆、多轮对话拼接等多种提示词泄露路径,对模型在实际部署环境中的防御能力进行评估。
    通过这种方式,Mend.io 帮助企业将提示词泄露问题从“模型偶发行为”转化为可测试、可评估、可治理的应用安全风险,从而更安全地推动大语言模型在企业级场景中的落地与规模化使用。

    谷歌近期发布了一份指南,详细介绍了多智能体系统(Multi-Agent Systems, MAS)的八种核心设计模式,涵盖从顺序流水线到人工介入(human-in-the-loop)架构等多种范式。该指南不仅对每种模式都提供了清晰的解释,还附带了使用谷歌 Agent Development Kit(ADK)实现的示例代码。

     

    谷歌指出,构建复杂且可扩展的智能体应用需要采用与其他软件系统相同的工程化方法,因为依赖单一实体会形成性能瓶颈,并使调试变得非常困难。

    可靠性来源于去中心化与专业化。多智能体系统(Multi-Agent Systems,MAS)相当于 AI 领域的微服务架构。通过为各个智能体分配特定角色(比如,解析器、评判器、调度器),开发者可以构建出天然更具模块化、可测试性和可靠性的系统。

     

    基于 ADK 提供的三种基础执行模式,即顺序(sequential)、循环(loop)和并行(parallel),谷歌归纳出八种基本架构(或称为“模式”),帮助开发者以结构化方式设计多智能体系统。

     

    顺序流水线(Sequential Pipeline)是最简单的模式,智能体像装配线一样依次处理任务,每个智能体将其输出传递给下一个智能体。谷歌表示,这种模式“线性、确定性强,并且调试起来非常直观,因为你能够始终清楚数据来自何处”。

     

    协调器/分发器(Coordinator/Dispatcher)模式是顺序流水线的一种变体,其中一个智能体作为决策者,接收请求并将其分派给下游的专用智能体。

     

    并行扇出/聚合(Parallel Fan-out/Gather)模式在多个智能体同时执行各自职责时非常有用。例如,在审查 PR 代码的场景中,主智能体可并行启动多个子智能体分别处理代码风格检查、安全审计和性能分析。随后,一个合成器(synthesizer)智能体汇总所有输出,决定批准或拒绝该 PR。

     

    层次分解(Hierarchical Decomposition)模式适用于更复杂的场景,高层智能体将复杂的目标拆解为子任务,并委派给其他智能体执行。

     

    生成器与评判器(Generator and Critic)模式在输出可靠性至关重要的情况下使用,其中一个智能体负责生成内容,另一个智能体负责验证,并且可选择性地提供反馈,促使生成器迭代优化其输出。

     

    迭代精进(Iterative Refinement)模式是“生成器与评判器”模式的泛化形式,生成器的输出被送入评判器(critique)精进器(refiner)智能体,二者协同工作,多次迭代以持续改进原始输出。

     

    人工介入(Human-in-the-Loop)适用于具有不可逆后果或高风险的决策场景(比如,金融交易、生产环境部署、敏感数据操作)。此时,一个审批工具(approval tool)智能体会在必要时暂停执行,等待人工审核者批准或否决建议的操作。

     

    复合模式(Composite Pattern)允许组合上述任意多种模式。例如,使用协调器路由请求、并行智能体加速处理,再结合生成器/评判器循环确保输出的质量。

     

    正如指南所述,谷歌为每种模式都提供了详细的架构图和ADK代码片段,请参阅该文档以获取更多细节。

     

    此外,如果想要了解其他使用 ADK 构建多智能体系统的思路,请参考Hangsik Shin撰写的指南

     

    原文链接:

    Google’s Eight Essential Multi-Agent Design Patterns

    微软近日分享了TypeScript 7(代号为 Corsa 项目)的最新进展,披露了对 TypeScript 编译器的一次根本性重构。该更新发布于2025年12月,详细介绍了团队将 TypeScript 编译器用 Go 语言重写的宏伟计划,他们承诺构建速度最高可提升 10 倍,并显著降低内存的占用。

     

    这款名为tsgo的全新原生编译器充分利用了 Go 语言的性能优势,带来了大幅度的速度提升。据 TypeScript 团队表示,与旧版本相比,完整构建速度最高可提升 10 倍,并具备高效的多项目并行处理能力。为编辑器功能(如代码补全、跳转定义、重构等)提供支持的原生语言服务目前已基本稳定,可供日常使用。

     

    用户现在就可以试用这一预览版:

    npm install -g @typescript/native-preview
    复制代码

     

    TypeScript 7 最重要的变化之一是默认启用严格模式(strict mode),这是一项与以往版本不兼容的破坏性变更。这一转变体现了团队对类型安全的坚定承诺,也符合行业最佳实践,但可能要求从旧版本升级的项目进行相应调整。

     

    选择 Go 作为实现语言在开发者社区引发了广泛讨论。团队在一份详尽的FAQ中解释说,Go 提供了自动垃圾回收机制,同时又是目前最贴近“原生优先”理念的语言。此外,现有 TypeScript 代码库采用高度函数式的编程风格,几乎不使用类,因此 Go 的函数与数据结构范式比面向对象语言更为契合。

     

    Hacker News上,开发者们对性能提升表现出了极大的热情。一位用户评论说:

    哇,这太震撼了!10 倍的速度提升对我们这类大型 TypeScript 项目将是颠覆性的。我一直在等待这样的改进,我们团队的项目在 CI 上的类型检查耗时极长,并严重拖慢了 IDE 的响应速度。

     

    不过,也有开发者对依赖 TypeScript 编译器 API 的工具迁移路径表示担忧:

    ……对于我们这些工具作者来说,这个原生编译器将如何分发?我猜会通过 WebAssembly(WASM)?编译器 API 是否兼容?比如转换器(transforms)、抽象语法树(AST)、LanguageService、Program、SourceFile、Checker 等等?

     

    我非常担心工具生态的迁移可能会异常困难。

     

    一些开发者已经上手尝试。Reddit 上有用户称其类型检查时间减少了 75%。还有人对默认开启严格模式表示欢迎:

    默认启用严格模式真是太棒了。我们以前经常在项目中工作到一半才发现严格模式没启用,结果要修复一大堆问题,非常令人头疼。

     

    对于重度依赖编译器的开发工具而言,TypeScript 7 的原生实现使其与其它以原生语言编写的高性能 JavaScript 工具站在了同一赛道。例如,用 Go 编写的esbuild,以及用 Rust 编写的 SWC 和 oxc,均已证明原生实现能带来显著的性能优势。TypeScript 团队此次转型不仅验证了这一架构方向的正确性,同时也确保了与 TypeScript 语言规范的完全兼容。

     

    TypeScript 是由微软开发和维护的一种强类型编程语言,它在 JavaScript 基础上增加了静态类型定义。自 2012 年发布以来,TypeScript 可编译为纯 JavaScript,运行于任何支持 JavaScript 的环境,包括浏览器、Node.js 及其他 JavaScript 运行时。通过其类型系统,开发者能在编译阶段而非运行时捕获错误;借助智能代码补全、重构等特性,IDE 支持也得到了显著增强,同时,显式的类型契约使大型代码库更易于维护。

     

    原文链接:

    Microsoft Share Update on TypeScript 7

    据麦肯锡发布的《The state of AI in 2025》全球调研报告揭示,88% 的企业已在至少一个业务职能中常规使用 AI(如 IT、营销、知识管理),但 62% 仍处于实验或试点阶段,仅有少量实现企业级的规模化部署。我们可以理解为,当下企业的 AI 落地正呈现“高采用、低价值”的典型特征,多数企业卡在试点到规模化之间。

    麦肯锡《The state of AI in 2025》报告

    AI 应用进入深水区,竞争的核心已经转向规模化的落地能力,而非技术本身。这也指向一个重要问题:当下的 CIO 群体,想真正实践 AI 大模型在企业的有效落地,实现规模化价值,要化解过程中的诸多坑点与难点。

    本文整理自阿里云智能集团副总裁、 CIO 蒋林泉在 AICon 2025 年 8 月所分享的 “阿里云大模型应用落地实践之路”,并完整呈现他对企业 AI 落地的经典方法论“RIDE”和数字人案例。文中,通过规模化上线的 28 个数字人的成功实践经验,分享从组织共识挑战、业务机会识别,到 AI 指标衡量,再到产品工程落地的体系化思考,以蒋林泉的第一视角,解析企业 AI 真实落地的系统路径。

    第一视角观察

    这是我自担任阿里云 CIO 三年以来,第一次对外发表演讲。此次分享浓缩我过去三年在阿里云带领团队推进数字化与智能化进程中沉淀的案例与经验。

    在担任 CIO 之前,我主要负责阿里云飞天核心系统的产品和研发工作,当时对外的演讲内容更多围绕飞天和阿里云的产品,角色也更偏向于“乙方”的产研身份。而今天,以阿里云 CIO 的身份首次对外演讲,更多是站在“应用开发者”的角度,分享如何在企业内部场景中推进数字化和智能化落地的一些实践与体会。

    阿里云智能集团副总裁、 CIO 蒋林泉

    过去两三年,我带领团队致力于推动 AI 大模型在企业各类场景中的落地应用,在这个过程中有很多感触。想先谈一下,在这个阶段里的一些观察和思考。

    在当今时代,我们常常会思考一个问题:一个人或者一个组织发展得这么好,到底是时代的原因,还是自己努力的原因?其实最主要还是时代的原因。我们能够发展到今天,很大程度上是因为坐在了一个很好的“电梯”。比如搭上了中国这个电梯,中国互联网的电梯,以及我所在的阿里巴巴这个平台的电梯。平台本身发展得很好,在上面自然也发展得很好。

    换句话说,在电梯里做俯卧撑,还是在平地上做俯卧撑?两者达到的高度是不一样的。个人努力固然重要,但更重要的是平台。我认为,在这个时代,AI 就是那个最大的电梯。无论是组织还是个人,有没有搭上 AI 这趟电梯,将直接决定在未来能够达到的高度。

    ARK INVEST 报告

    根据 ARK INVEST 以往的一份调研报告预测,到 2030 年,算力性能相较于现在将增长 1000 倍。这是什么概念?在 AI 时代之前,我们常常讲摩尔定律,技术性能大约每 18 个月翻一番。而在 AI 时代,技术发展的速度被极大地加快了。如果不能及时搭上 AI 这趟高速电梯,大概率会落后于时代。

    基于这样的认识,我们发现,无论是企业还是个人,都开始逐渐意识到 AI 的重要性。意识到这一点后,许多企业,包括 CEO 和业务部门,开始变得焦虑起来。

    这就涉及到,这一轮科技革命与以往的科技革命最大的不同之处

    在整个信息技术产业中,无论是 PC 互联网还是移动互联网时代,技术在企业中的应用过程是一个渐进的过程,非常循序渐进。那个时候,企业的 CEO 看到业界的炒作、厂商的炒作,都比较冷静,可以慢慢来。

    然而,这一次的情况却截然不同。我觉得这是第一次,企业 CEO 和业务部门比 IT 团队、比供应商还“上头”。因此,我们可以说,现在企业内部最大的矛盾,就是业务部门在社交媒体、PR 渠道里看到的 AI,往往呈现出一些“炸裂”、“梦幻”的效果,而 IT 部门或者说 CIO,在实际生产力上的发展却是不均衡、不充分的。这种矛盾体现得非常突出

    在阿里巴巴集团内部,以及我与业界几十位 CIO 交流的过程中,观察到,在企业内部,这种现象大量存在。企业中会涌现出很多 Idea,做出很多 Demo,上线很多技术平台,一个团队里,恨不得要搭好几套 Dify 平台,各种智能体平台都在搭建。但是,在这些过程中,还是技术主导比较突出,更多是拿着平台去做 Demo,业务方的参与往往比较浅层。这类现象在企业里是比较过剩的,可以说整个企业都充斥着类似的情况。

    与此同时,我在企业中普遍观察到,很多方面的投入都严重不足:是否真正深入到业务本身去做价值识别,或去正确地定义产品,以及如何开展知识工程(注意,这里我们不再仅仅是传统的软件工程,而是知识工程),还有我们强调的业务专家知识动员。

    因此,我们认为,如果要在企业里真正用好 AI,并且产生实际的业务结果,就要做非常大的投入。恰好,在这个领域,我们做了很多探索和实践。

    阿里云企业大模型应用实践落地

    接下来,想向大家展示阿里云内部企业 AI 大模型业务落地的全景图。

    在这张图中,我们可以看到很多“数字人”,无论是在阿里云的官方网站、CRM(客户关系管理系统)、业务支撑系统,还是在内容管理系统、人事管理系统中,这些数字人都已经广泛地落地应用,并在原来的业务中发挥真实的效果。

    在过程中,我们已经落地了大约 28 个数字人项目,从中挑几个有代表性的例子来分享,让大家更有体感。

    AI 翻译数字人

    大家都知道,翻译是大模型非常擅长的事情。

    但在阿里云,我们遇到过很大的挑战。作为一家公共云服务提供商,为客户提供服务时,文档的作用至关重要( ToB 的服务非常依赖文档)。阿里云拥有 300 多个产品,十几万篇文档,涉及上亿文字。其中有一个非常大的痛点在于“出海”,我们要出海到日本、美国、欧洲、印尼,还有土耳其,而我们的开发者要高度依赖文档,来操作云计算服务。

    问题在于,我们缺乏既懂本地语言,又懂云计算的人才,技术类的翻译必须同时具备这两方面的能力。但即使有足够的资金,也很难招聘到这样的人才。过去,我们只能选择“忍”,仅翻译了英文文档,以及部分日文文档,而其他语言的翻译工作基本停滞不前,这也导致海外开发者的反馈不佳。

    在这一轮 AI 技术突破之前,我们尝试过用传统 NLP 来做翻译,但效果根本不行。到了 ChatGPT 3.5 版本,我们发现自然语言处理技术,仍然无法满足我们的需求。而到了 ChatGPT 4 版本,我们再次尝试发现,翻译质量终于能和那些“既懂技术又懂本地语言”的专业译者打平。

    而且,当时也做了计算(时间在一年多前),每篇文档的翻译成本,仅为当初专业技术翻译团队的 1/200。从那时起,我们开始大量使用大模型进行翻译工作,到现在,我们已经完成了印尼语的全部翻译工作。这意味着,解决了原本靠资金也无法解决的组织问题。

    如果用专业的评分来看,过去,用懂本地语言、懂技术的专业翻译团队来翻译,评分大约为 4.12 分(满分 5 分)。现在,我们用 AI 来翻译,评分能够达到 4.68 分。在海外市场,我们发现海外网站的用户体验以及 NPS(净推荐值)都得到了显著提升。因此,这不仅仅是一个成本问题,更是通过 AI 解决了过去无法解决的难题。

    技术文档验证数字人

    刚才提到,阿里云有十几万篇文档,覆盖三百多个产品。其中,有一半是操作指南和解决方案,客户需要完全依照这些文档进行操作。

    这里一个很大的问题是:传统 IT 产品可能是半年或一年一个版本,文档和产品可以同步开发。但我们是互联网模式的 IT 系统,我们的情况是,线上功能不停迭代,功能的迭代和我们文档的一致性,就要实时保证。

    原来,也是依赖外包团队进行文档验证和测试,由于“带宽”限制,只能解决中文文档的验证问题。每六个月会把所有文档“跑”一遍,去验证它们和线上功能是否一致,经常会发现有很多版本不一致的问题。但这个过程本身就有很大问题:首先一轮验证就需要六个月时间,当第一个月验证并修复好的内容,到第六个月,验证可能又变得不一致了。原来,我们一直没能把这个问题解决,导致客户经常会遇到功能与文档不符而操作不下去的问题,这就要求我们提供最新内容。

    现在我们是怎么做的呢?用 AI 来模拟这个过程:它会左边打开技术文档,右边操作浏览器里同步打开阿里云网站,然后严格按照文档里的步骤进行操作。过程中,AI 一旦卡住或无法继续,就大概率意味着文档和实际功能不匹配。虽然少数情况是云产品控制台本身的问题,但绝大部分的确是文档与功能不一致。当 AI 发现不一致时,它会立刻把不一致的“单拎”出来,并自动创建一个 Aone 需求单。

    我们后续还有一个“文档修复数字人”,它会“接手”这个 Aone 需求单,分析实际情况与文档描述的差异,并做修复。然后,它会把这个修复好的文档,给到我们 technical writer 做确认,确认后就能上线了。

    这之后,过去需要六个月才能完成一轮的验证工作,现在只要一个星期。同时,我们现在也把这套验证机制应用到日文、英文以及其他语种上,确保国际站的功能和文档也能保持一致。

    过去靠人工验证时,一致率到底是多少?验证质量好不好?覆盖度够不够?这些其实都是一个“unknown”的状态。而现在,一切都变得清晰、可量化了

    网站 AI 助理数字人

    第三个案例是网站 AI 助理。阿里云有几百万客户,那我们的自服务模式是怎样的呢?

    我们来看一组数字:每天大约 97% 的客户访问阿里云,都是通过自助操作,只有 3% 的客户会选择“提工单”。而在这 3%的客户中,百分之七八十的任务也还是由自己解决的,只有极少数最终会变成需要人工介入的工单。所以,我们的客户绝大部分是自服务的

    但即便如此,由于我们的客户基数太大,这“漏”进来的一小部分工单,依然需要我们服务团队投入大量人力去处理。在这些工单里,有一半都属于“咨询工单”。什么是咨询工单呢?就是客户遇到问题直接提问,我们的小二在后台查文档、翻知识库(Knowledge Base),找到答案再回复给他。这类工单纯粹是信息问答,不涉及操作。

    这类工单主要有几个问题:第一是一半的工单服务成本很高,第二是个时效问题。我们统计过,过去一个咨询工单的平均关闭时间,绝大部分要到 5 个小时左右。也就是说,一个客户平均想要解决这种咨询问题,需要花费大量时间才能解决。

    网站 AI 助理上线后,大量的咨询问题已经由 AI 直接回答了,而平均响应时间是 10 秒左右。

    目前,我们正在和服务团队合作,与服务团队共同承担全年工单降量,我们一起努力,希望通过 AI 在网站自服务的深入应用和渗透来实质拓展服务带宽,更重要的是,能够一起提升阿里云的客户服务体验。

    智能电销辅助数字人

    刚才讲的是服务,探讨了如何帮助客户解决咨询工单和自助诊断的问题,把服务体验提升了。现在来看另一个场景:销售

    阿里云要服务上百万的企业,无法对每一家企业都用直销的方式去覆盖。因此,我们有很大一块业务是面向中小企业(SMB),通过电话销售来帮助我们客户实现售前咨询,以及售前购买的问题。

    电话销售小二的日常工作,主要分为话前、话中、话后三个环节。话前: 小二需要做计划,规划当天要打哪些电话、了解客户的商机、准备话术,并排好优先级。需要这样一个准备过程,才能保证一天的工作有序高效;话中: 就是与客户的实际沟通;话后: 需要复盘,记录通话小结,整理哪些需要 follow-up,哪些需要申请折扣。需要处理的问题都要记下来,这样才能闭环到后续的业务处理,形成一个完整闭环。

    现在,我们在这三个环节都提供了 AI 数字人。

    ● 在“话前”,由 AI 来完成通话计划,包括怎么打,话术是什么。过去小二自己排计划要花半个多小时,现在一上班,计划就已经生成好了,可以直接开工。

    ● 在“话中”,我们提供了一个智能辅助提醒。当小二与客户通话时,系统会根据对话内容,在工作台右侧实时提醒他如何回答,比如客户在说他想要这个,建议你这么回答。目前已经在辅助小二去解答客户非常复杂的一些云计算咨询问题。目前话中提示小二的采纳率已经达到了 50%

    ● 在“话后”,像通话复盘、撰写小记、follow up,包括后续的通话质检,这些工作都交给了一个自动化的 AI 数字人来完成。

    通过这种方式,我们的小二可以从繁杂的事务性工作中解放出来,集中精力在真正的销售沟通上,大幅拓宽了我们销售的服务带宽。同时,AI 的智能计划、实时辅助和后续复盘,也极大地提升了我们服务客户的质量。

    智能质检数字人

    AI 应用到电话质检之前,这几乎是一个原理上无解的事情。

    原来我们大规模的外呼电话作业过程,是非常难被知晓的。比如中间过程是否按照公司的作业规范进行?与客户的沟通是否足够礼貌?更有时候,有的外呼人员可能会把客户引导到私下公司去联系、去成交。但原来,我们是很难去做这个电话质检的,因为这是语音作业,很难管理。

    而现在,我们用 AI 把所有的电话语音全部智能化,从而识别里面所有的这些问题,再通过统一的质检标准,就能够得到一个规模化的质检。于是,这个 AI 质检能够大规模地提升我们的服务质量与效率,覆盖全量业务场景,关键还能控制我们的业务风险(避免产生额外的风险)。

    可以说,这件事我们原来几乎是无法搞定的,因为原来是靠抽样,也就是人工抽样去听那些电话录音,如果抽样抽到了问题,再去一个个处罚,但效率是非常非常低的。它的抽样完整性、抽样覆盖度都几乎是没法被使用的(覆盖度仅有 2%),不同质检员的判断差异也很大,对人力的消耗也很厉害。所以,现在通过 AI 质检数字人,能够让覆盖度提升到 100%,质检的准确率也远高从前,带来的最终效果是非常好的,这使得整个服务质量能够规模化地提升上去

    智能外呼数字人

    刚才我们讲到 AI 如何辅助做事,这里则是一个能直接进行智能外呼的数字人。

    众所了解,云计算本身是非常复杂的,如何招聘到足够多的外呼坐席人员,让他们既具备相关技能,又熟悉云计算知识,同时还能够耐心地每天坐在工位打一天的电话,这对我们来说是一个巨大的痛点。因为招聘和能力培养难度很大,人员流动率非常高,这使得无论是销售服务,还是电话服务的质量,都存在明显的短板。

    本质来看,这是一个短线影响业务增长,长线影响服务满意度与企业品牌塑造的问题。

    我们在前期已经有一定的知识积累,包括语音、多模态等方面的经验,因此,我们通过 AI 的方式直接引入智能外呼。它直接上场,与我们的客户沟通,挖掘销售商机,交付给服务团队去做主动的服务

    目前,在潜在客户的线索清洗、免费试用、转生产、以及产品即将到期的续费提醒等主动外呼场景中,这个数字人已经上线运行了。目前,我们还在开发场景包括产品到期的主动关怀、NPS 调研等,上线后,预计可以拓展出“能交付结果的”上百个 HC 的服务带宽。

    数字 AI 客服的外呼,还有些不一样的特征。首先,它可以灵活、快速地按需扩容,而且,它的声音可以做得更甜美,也可以做得更有情商。更重要的是,在技术的不断加持下,这个 AI 小二解决问题的能力,可能已经超过了原来人类员工的平均水平,而且还在不停地提升。目前,我们的智能外呼数字人可以像“金牌销售”一样工作,非常接近真人体验。未来会有更多的想象空间,让它能够更好地服务阿里云客户,提升我们的服务质量。

    直销辅助数字人

    分享了很多电销案例,这里谈谈“直销”场景。

    在阿里云的直销业务中,我们面临着一个核心挑战:销售如何变得更加专业和高效,促进公司业绩增长?在实际工作中,我们的销售团队遇到了两大业务痛点。

    第一个痛点:云计算销售要求高、招聘难、培养成本高。

    云计算销售不仅需要具备良好的客户拓展能力,还需要深入理解云计算技术与行业应用场景。复合型人才稀缺,招聘难度大、周期长,新人从入门到胜任,需要经历数月的培训与实战积累,培养成本居高不下。

    第二个痛点:销售运营专业服务带宽不足。

    销售运营、数据 BI、财务、法务等运营中台的服务带宽,无法充分支撑前线销售需求,难以及时响应每一位销售人员的专业支持诉求。

    为了解决这些问题,我们将整个销售流程分为“拜访前”和“拜访后”两个关键环节,在每个环节都提供 AI 数字人的全方位支持。核心围绕销售作业的有效性展开,让直销过程实现“在线化”,全面提升销售过程的辅助效率。

    拜访前:销售“一键”获取客户“谈参”,了解客户用云信息、技术类型、解决方案、竞对情况等全面画像。过去,销售自己从各渠道去查询要花 1 个多小时,现在,10 分钟就能查询到,而且信息质量更优、内容更全面,有效促进了与客户 key person 的高质量拜访。

    拜访后:我们提供 AI 对拜访过程的全方位复盘,包括商机要点是什么,客户对阿里云品牌表现出的情感倾向是什么,建议后续怎么推进客户成单。

    通过 AI 软硬结合的优势,我们让直销的销售过程实现“在线化”,高质量拜访小记达到 100%全面覆盖,新销售也能通过高质量在线信息资产快速学习,上手周期缩短 50%,大幅降低新人培养成本。

    这种方式,相当于拓展数百位专业销售运营为销售团队“贴身辅助”,销售人员得以从繁琐的流程性工作中解放出来,能够更专业、更高效地服务客户,大幅提升了销售有效性,有力促进了公司业绩增长。

    合同风险审核数字人

    ToB 业务的一大特征,是有大量的政企和大客户,他们通常不会使用我们的标准合同。这些合同金额巨大,需要进行严格的风险审核,涵盖财税法、风控、信控等多个方面的风险。

    过去,要完成这样的风险审核,我们需要专业的法务、财务等领域的精英人士,他们大多来自国际四大会计师事务所。然而,鉴于我们业务规模庞大,不可能招聘到足够多的精英来从事这项工作。因此,我们在合同风险审核方面遇到了巨大瓶颈,审核时间过长,最长甚至可达 5 个月,平均也需要两周到一个月。这极大地拖累了业务效率,包括服务大客户的效率。

    为了解决这一问题,我们培养了一大批“数字人”,包括财务数字人、信控数字人和法务数字人。并且,把这些数字人送到合同撰写端,让他们在销售和客户沟通、合同拟定的瞬间,就能够实时识别潜在风险并提示谈判方案,而不是等到审核端后才发现问题,再回过头去处理。

    合同审核端,我们通过审核标准数字化、专家经验数字化,用统一的标准执行,极大提升了准确率。而 AI 也正是实现知识工作线下流程线上化的体现。

    通过 AI 技术,我们不断拓展中后台的服务带宽,解决商业拓展流程中的效率瓶颈。后续,我们也期望它在风险拦截上的能力,能够持续提升。

    员工服务数字人

    为什么特别提到员工服务数字人?

    因为大型企业里,HR 系统有一个显著特征,就是非常分散。比如请假、体检、福利、在职证明等,各式各样的流程和服务都散落在不同的系统里。与此同时,各类政策也同样分散,包括公司内部的福利政策、外部的人才政策等等。

    员工在需要获取这些信息或使用这些系统时,会遇到两个难点:第一,这些服务是低频使用的;第二,它们分散在不同地方,获取难度非常大。由于是低频服务,无法配备一个庞大的服务团队来支持,所以 HR 团队的负担很重,而员工的服务体验也不足。

    为了解决这一问题,我们将这些低频、分散的服务全部整合到一个智能体中,通过钉钉平台打造了一个“云小宝”(数字人),为员工提供统一的智能服务

    我们发现,通过引入智能体,折算下来相当于节省或新增了几十名员工在为大家服务。更重要的是,员工的体验得到了极大提升,比如,我们服务员工的响应时长已经从平均 7.2 分钟缩减到 5 秒。再比如,员工只需要用自然语言输入,如“下周一请假”、“国庆前后两天请假”或“为父亲预约体检”,系统就能迅速响应并完成操作。

    面试智能辅助数字人

    还有一个场景,我们聊聊招聘。

    首先,我们对外招聘,核心是描述我们需要什么样的人。从这个角度出发,前置是 OKR,我们通过 AI 分析每个部门日常在做什么,目标是什么,根据日常目标和事情,去看清楚招聘的 JD(职位描述)是不是合理

    再者,从 JD 开始,根据岗位要求,再结合当前的候选人简历信息,在面试的时候就会生成面试计划。面试时,结合岗位要求,面试官应该问哪些问题?根据最佳实践,怎么去考察候选人?这些专业问题在面试前,已经帮面试官提供好。面试中,通过对话过程,发现应该追问哪些问题,以及面试后,怎么总结面试过程中候选人是不是 qualified 这个岗位。

    通过 AI,我们可以更结构化、体系化地来做这件事,使得面试过程管理,面试质量,以及对面试人评价的客观性,都得到很大的提升。这也彻底改变了原来仅仅通过电话形式的面试,因为它的过程是一个黑盒逻辑,而“黑盒”最大的问题是无法提升过程的质量,包括保持长期的、闭环的有效性。

    对一家公司来说,招聘是件非常严肃的事情,我们经常讲,如果招错一个人,会导致后面的事情是非常糟糕的。所以本质上来讲,面试智能辅助数字人,提升了我们整个组织在招聘进人方面的有效性。这不只是效率问题,而是能够规模化促使我们在面试过程中的专业性、面试评价的专业性得到质的提升。

    28 个数字人全面上岗,真正产生业务价值

    目前,我们有二十几个场景实现了数字人的智能化服务,这里只是挑选了 10 个来举例。

    这些数字人应用背后的评估衡量,有一个共同逻辑:

    一是折算拓展了多少人力;

    二是业务效率提升了多少;

    三是业务效果提升了多少。 

    我们非常注重这一结构,因为每一个数字人上线落地,都必须衡量其对原来业务是否真正拓展了服务带宽 ,并且,是否比原来人工操作的效率和效果更好,这是非常关键的,与外界所谓的众多智能体最大的区别,就在于此。

    这些智能体最终都是在对应的岗位上实际工作的。在我们的 HR 系统中,这些数字人被分配到对应的业务部门,向对应的业务团队汇报工作,与我们从外部招聘的员工没有任何区别。所以,它们必须在对应的岗位和业务团队中,发挥超过一定人数的实际任务执行作用,才能真正融入团队。

    在我们的钉钉系统以及内部工作系统中,这些数字人与普通员工一样,拥有工号和头像。唯一的区别在于,它们的工号以“AI”开头,如 AI001、AI002,目前我们已经有大概 28 个智能体上线,后续还有更多智能体在排队等待上线。

    当然,在过去两年,带领团队推进业务落地的过程中,我也深刻体会到,真正将技术应用于业务并取得成效,没有那么简单。特别是,真正在业务中产生价值和仅仅做出一个 Demo 之间,是天壤之别。

    接下来,想和大家进一步分享,我们在这一过程中遇到的困难,以及总结出的一些解决方法,希望能对大家有所帮助。

    大模型 E2E 落地坑点与解法 —— RIDE

    大家可能听过红杉提出的一个概念叫 RaaS,即“结果即服务”。这一概念的核心在于,如果仅仅提供工具和产品,让企业自行落地是不够的。所以,我们特别重视真正上线,并产生业务结果的项目。

    我作为 CIO 所带的团队,在企业内部为业务部门提供的,就是这种 “以交付结果为导向的服务”。在推进 RaaS 的过程中,也总结出一套方法论,叫 RIDE

    RIDE 包括四个关键步骤:Reorganize(重组组织与生产关系)、Identify(识别业务痛点与 AI 机会)、Define(定义指标与运营体系)、和 Execute(推进数据建设与工程落地)。

    首先是 Reorganize。在 AI 时代,新的生产力下,原来的生产关系是非常不适应新生产力的发展,这种不适应会在每个毛孔里面表现出来,然后阻碍 AI 的发展和落地,所以要求我们要重新调整生产关系。第二,是 Identify。也就是我们需要精准地识别出企业中哪些问题适合用 AI 来解决,这要求我们首先明确问题的定义,然后结合 AI 的能力和业务需求,确定哪些问题可以通过 AI 得到有效的解决。然后是 Define。在明确了问题和 AI 的能力之后,我们需要精准地定义产品及其运营指标,进行准确的指标跟踪。最后才是 Execute。执行阶段是一个金字塔结构,上面是业务目标,下面是工程数据和评测,中间是工程应用算法。

    当然,这套我们称之为 RIDE 的方法论,并非在做 AI 转型的第一天就有了,而是在二十多个智能体真正有效落地业务的过程中,我们发现,如果不遵循方法论中的这些步骤,项目很可能会失败。遵循这些步骤,虽然不能保证 100% 的成功,但至少可以提高成功的概率。这是一套用两年时间、用血泪经验总结出来的方法。

    Reorganize |重组组织与生产关系

    书同文、车同轨 :AI 时代的通识教育

    我们首先从 Reorganize 开始讲。

    在落地第一年,我发现了一个问题:无论是业务团队还是我们自己的团队,对大模型的能力边界、发展程度、具体原理等基本概念的理解都存在差异,甚至在我自己的团队,产品经理、算法、工程团队内部都无法拉齐概念认知。

    为了解决这一问题,我们发起了一个行动,叫 “书同文、车同轨”。 我们要求全员参加 AI 大模型的认证培训。最主要的原因,是要解决大家在基本功和认知逻辑上的差异。我称之为 “AI 时代的通识教育”,相当于要在团队里重新走一遍“高中的教育”

    这一培训分为两类:大模型 ACA 认证(面向非技术人员)、 大模型 ACP 认证(面向技术人员),因为我们不仅需要技术人员之间能够对齐话语,也希望非技术人员和技术人员对齐话语。

    这种通识教育对于团队的协作至关重要,首先在我们 CIO 线内部已经完成了全员的认证,后面,我们的业务方,也就是我们的财务、人力、销售、中后台等都在做 全员认证

    目前,整个阿里巴巴集团都在用这个方法来做 AI 转型的基础教育,重新建立大家的基础认知。不然就会出现这种情况:大家都在谈论同一个概念,但其实理解的内容和现实完全不同。如果没有做过深入工作,很难体会到那种无力感,一旦通过通识教育统一认知,沟通效率就会显著提升。

    阿里云大模型 ACA 认证:

    https://edu.aliyun.com/certification/aca13?spm=a2cwt.28380597.J_1564692210.17.28813487dUqGKW

    阿里云大模型 ACP 认证:https://edu.aliyun.com/certification/acp26?spm=a2cwt.28380597.J_1564692210.18.28813487dUqGKW

    「企业免费体验」大模型认证:https://edu.aliyun.com/learning/topic/llm-free-trial

    这样的基础上,又设计了两个比赛。一个是产研提效比赛,一个是业务提效比赛。和其他大赛最大的不一样,我们的比赛是真正以 E2E 为衡量标准的。 

    比如产研比赛,我们要看的,是原来 E2E 同样粒度的一个需求,需要多少“人月”完成,而现在能减少到多少人月。而不是看代码采用率,因为代码采用率很容易“灌水”,而且它往往只能补全那些最容易写的代码,最难的代码可不容易补全。

    在业务 E2E 方面,我们的比赛就是要真正进入业务场景,帮助业务去拓展,而且效果和效率都要超过原来。所以,这两件事非常重要,第一,是做“书同文,车同轨”的通识教育,因为 AI 时代的知识在不断发生巨变,每个月都在变,现实的实践知识和原来的基础知识都有大量的不同;第二,是“以赛促练”,整个组织通过正确目标下的比赛,大家会发现短板,发现相互之间可以学习的地方,就能够激发组织不断地去创新、去提效。

    数字员工 :业务方与 IT 方 联合培养

    再说说我们的数字员工

    有一个非常关键的安排:我们的这些数字人最后都是汇报给业务部门的。这不仅关乎形式,更重要的是心理。我们不能让业务部门觉得,AI 技术会威胁到他们的工作,而是要让他们明白,AI 技术是来帮助提效的。如果这个关系没处理好,就会遇到无数的暗礁。

    所以,我们把自己定位为数字人供应商,业务部门是 AI 先进组织,业务部门可以雇佣我们的数字员工,并与我们一起联合培养。 这样,业务部门会更愿意接受 AI 技术,减少阻力。所以这是第一点,我们把自己退到一个外包供应商的位置上。

    第二点,我们还发现,AI 数字员工是不能扛责任的,也不能给它打“3.25”(低绩效)。这意味着,数字员工在系统里执行任务出了问题,谁来承担的问题。我们将 AI 数字员工汇报到业务部门,属于业务部门的人(让他们放心),并一起参与 AI 员工的培养过程,同时数字员工也会受到正式员工的监督,来承担相应业务领域的责任。

    定标准 :AI 要与人比,不与“神”比

    另外,我们经常听到一句话:ToC 还好,但 ToB 的大模型有幻觉,做不到 100% 正确。但实践经验告诉我们,其实人也有幻觉,而且人的幻觉还很大。如果认真看,在很多任务里,人其实也是不靠谱的,也经常会失败,只是企业没发现而已。

    我们强调的一点是:如果 AI 项目和业务部门真正达成了共识,并且通过培养逐步磨合,就必须认真回头来看,AI 的要求标准到底是什么?

    如果要求 100% 正确,其实就是把 AI 拿来和“神”比。但如果是和原来人做事的效果和准确率去对比,那就是和“人”比。所以,追求比人做得更好、更准,才是真正有意义的对标

    那怎么避免和“神”比呢?回到前面所说,解决生产关系的问题,处理好内部业务的逻辑、目标和关系,这样才能真正实现 AI 和人比,而不是和“神”比。

    在整个 Reorganize 的过程中,我们还发现,要把数字人汇报到业务部门,对 HR 部门来说,这就等同一个“正式员工”。注意,我们是真的把它当作正式员工来看待的,用它能否产出真正的业务结果来度量。

    所以我们在内部与 CPO(HR 负责人)沟通时,讨论过:怎么去度量 AI 数字人是否真的发挥了一个正式员工的效果?最后,我们确定了一个方向:AI 数字人必须有一个目标,就是在原有具体的业务流程里,接管一个重复且有价值的任务,并且能够折算出“相当于拓展出多少人力”,这就是唯一的目标。

    但要 真正让数字员工上线、上岗,必须满足两个标准条件: 一是数字人执行原来任务的效率,一定要比原来提升一定百分比,一定要比原来执行任务的人效率高;二是数字人执行任务的效果,同样,也要比原来提升一定百分比。只有当数字人做到效率高、效果好时,才能“正式上岗”,进入业务部门工作。

    Identify |识别业务痛点与 AI 机会

    从三个特征,挖掘 AI 机会

    刚才讲的是 Reorganize,如果不解决 Reorganize 的组织问题就会不断遇到暗礁,甚至没法往前走。但解决了组织的问题后,业务部门会说,好,我们来联合培养数字员工。那从哪里开始呢?

    所以第一件事就是业务机会的识别(Identify)

    这轮 AI 革命的核心其实是 LLM(large language model),所以,我们在内部有一个逻辑:所有以 language 为中心的工作,都将被大模型深刻影响。比如电销、客服、招聘、OKR、文档、翻译、合同审核,还有研发类的 C language、Java language、SQL language 等,这轮以 language 为中心的工作受影响最大。所以第一个特征是 Language 类 工作。

    第二个特征是被重复执行、规模化执行。因为 AI 是自动化的,越大规模、越重复的任务,AI 越有机会去做。第三个特征是,如果本身缺人,甚至有人投诉效率低,那这个地方就是个大的机会。

    这三个特征,是我们与业务部门一起来 Identify,识别哪些业务是可以着手的。这也是我们在内部形成共识后,如何去识别机会、定义机会的关键点。因为只有把问题定义清楚了,后面做事才会顺畅。如果解决错了问题,那投入就白白浪费了。

    数字员工,以“单任务”为核心换算

    另外,我们刚才讲到,数字员工要在对应的任务里拓展目标,也就是拓展对应岗位的人力,实际面对各种场景具体怎么处理,又怎么核算?

    我们的经验是,首先,有些“单任务岗位”,比如技术翻译,我们是按字收费的,那么,AI 翻译一个字多少钱,就可以直接线性替换了。一个人一天的产能可能是翻译 2 万字,那我们就差不多折算成 “2 万字的产能”等同于“一个人”。

    如果是“多任务岗位”,比如产品经理,他一会儿做 PRD,一会儿分析工单,一会儿画 Demo,一会儿又去客户那里访谈。这种多任务岗位,我们发现往往有些任务是重复的、繁琐的,也不是高价值的。为了提效,非常适合将这些低价值任务,拆分成一个个“单任务岗位”,如工单分析岗位、产品原型设计岗位等,让数字员工去做。

    这样,原岗位上的人就从繁琐工作中卸载出来,可以聚焦在更高价值的主线工作上,他们的幸福感也会爆棚。在换算方面,最终也都是”以单任务岗位为核心进行 HC 换算”,逻辑清晰明了。

    这种方式原先主要是由外包承接,但受制于外包员工管理难度大、成本构成多、招聘周期长、稳定性低、用工风险高、能力上限低(薪资因素)等诸多原因,多方面都受到约束,无法大面积展开。当我们有了数字员工之后,自然解锁了这些约束, 这件事就变得更加切实可行。 

    Define |AI 的产品度量与运营度量

    准确率是 AI 产品核心

    过了 Identify 这一步,下面就是 Define

    这个时代和以前做产品有很大不同。我们前面提到的一些产品大多都类似,比如都有交互、体验。在这个流程里,其实和上一轮移动互联网的产品没有区别。但 AI 产品有一个特别关键的点,就是“准确率”。 当然,除了准确率之外,还有响应时效性和安全合规等非功能性指标,比如在电销过程中,和客户实时对话,延迟必须非常低,不然客户会觉得交流效率不高,像机器人说话一样。

    因此,实时性和准确性非常关键。如果准确性不够好,客户根本无法使用,也根本不可能真正上岗。所以,准确率是 AI 项目的第一核心指标,整个项目组都必须盯住它,这也是产品定义中最核心的部分,必须重新去 Redefine

    运营与产品指标「协同度量」,才不掉坑

    此外,运营指标同样至关重要。如果只有产品指标和准确率指标,那大概率会掉到“坑里”。即使是在对内的业务项目里,原来移动互联网那些基本功也不能丢,比如:

    • DAU(每日活跃用户数);

    • 用户提问数;

    • 渗透率,即目标客户的覆盖率;

    • 留存率(最关键)。

    如果同一个客户今天用了,下周还愿意继续用,说明这个 AI 智能体真正帮他解决了问题。如果客户只用了一次就不再回来,那么无论前面的产品指标再漂亮,都没有意义,那可能就是定义错了问题。运营指标就是用来兜底的,如果不紧盯这些指标,很容易让产品、工程和算法团队陷入“自嗨”。什么叫自嗨?就是他们说“我的指标很好”,结果客户根本不用。

    举个例子,在阿里云官网的 AI 助理中,我们就设定了这样的度量方式。

    如下图所示,左图展示了准确度的度量指标,时间线大约覆盖从去年到今年的一年时间。蓝色区域代表表现良好的部分(精准解决了客户的咨询问题和任务),黄色区域为中等水平(虽解决了任务,但伴有大量无关信息),红色区域则是表现差劲的部分(回答与客户问题完全不相关)。中间图展示了 DAU 和客户问题数,右图则是留存率。

    目前,我们的留存率实际上已经达到了一个相当高的水平(PPT 中并未刷新数字)。从图中可以清晰看到,随着准确度的持续提升,DAU 和留存率也在稳步上升。但是反之,如果 DAU 和留存率始终停滞不前甚至下滑,即使你的工程和算法团队声称准确率很高,那无疑是自欺欺人的。

    实际上,很多工程算法团队成员,可能并未意识到上述这一点。之所以能明确指出,是因为在左图的准确度指标上,我也曾经被多次误导,但这也并非团队有意为之。在如今的信息环境中,随便搜索公众号就能发现大量类似“用这一招,你的准确率能提升到 95%”的文章,但这些文章往往存在误导性,它背后都有一个前提条件,即在某个狭窄的小场景下,准确率能够达到 95%,然而在面对海量问题时,这一指标却难以提升(这一点稍后会详细分享)。

    Execute |推进数据建设与工程落地

    掌握「产品研发工程金字塔」

    定义好了产品和运营指标(Define),往下走才是执行(Exectute)阶段。

    Exectute 阶段的关键在于:一定要用产品和业务目标来拉动。因为在牵引拉动的过程中,才能充分动员领域知识专家的参与和评测。 

    如果没有知识专家的深度参与和强大的评测能力,大模型的应用上限是很难提升的,这是第一点。第二,如果项目目标缺乏价值,或者没有真正的痛点,那么会发现得不到资源的“祝福”。也就是说,一方面难以获得其他团队的配合,另一方面自身团队的价值感也难以维持,这将直接影响项目的推进。

    在整个执行逻辑中,金字塔最下面是工程的数据与评测,我把这个放成最大的一块底座,因为这是基石——业务数据、业务 API 以及评测能力是大模型应用的基础,对这一部分的投入必须充足。

    在这一基础上,才是工程应用算法、预训练(Pre-training)、RAG 以及微调等等,这些在媒体报道里面出现的技术热词,并非不重要,但这些只是 “必要条件”。我观察到,大多数产研团队在这部分(工程 - 应用与算法)投入了 80% 至 90% 的时间。

    但想强调的是:这些只是必要条件,仅靠这些无法解决企业 E2E 落地的问题。哪怕你在必要条件上投入再多,再加 10 倍的努力,也无法实现真正的 E2E 落地。因此,必须设法补齐真正实现 E2E 落地所需的充分条件。 如果无法做到这一点,项目成功的希望将十分渺茫。

    常见的 LLM AI 应用范式:翻译、Agent

    在与业务团队沟通以及处理各种复杂问题的过程中,我们总结出了几种常见的模式: 首先是基础设施层面,涉及知识和数据的构建;中间是编排和调度,无论是大家熟悉的工作流编排,还是智能体自主规划编排,或是两者的结合;最上面是对客的产品与运营。

    这里,重点讲述图中深蓝色部分的两种模式:第一个是翻译模式,第二个是 Agent 模式,我认为主要分为这两种典型的应用模式。其中,翻译模式最容易取得成效,因为它相对简单;而智能体模式则较为复杂。

    翻译模式:关键在“蛋糕坯”

    先谈谈翻译模式。 在公司内部,我们将所有翻译类模式统称为 AI 领域的“低垂果实”,这类模式相对容易实现。

    这一轮的大型语言模型背后的算法是 Transformer。Transformer 最早是 Google 为了翻译任务而开发,在不停做翻译的过程中衍生出了 Transformer 算法。随后,预训练模型如 BERT 也大量应用于翻译领域。所以,大模型的原理 Transformer 特别擅长做翻译。

    翻译又可以分为狭义翻译广义翻译

    狭义翻译指的是中译英、英译中等语言之间的转换。而广义翻译则涵盖更广泛的形式,比如:自然语音转成文本,再转成语音;自然语言转成 SQL 语言;自然语言转成 Java 语言;甚至让一篇论文用自然语言“翻译”成中学生能听懂的表述,这些都属于广义翻译范畴。无论是狭义翻译还是广义翻译,Transformer 都特别擅长,因此这是最容易出结果的地方。

    这里有一个坑: 虽然(图中)左边的翻译能力已经具备,但如果右边原有的系统还没准备好(not ready),就会出现问题。

    以 Chat BI 来说,为什么 Chat BI 在企业里没什么成功的案例呢?其实很大一部分原因在于,Chat BI 的逻辑无外乎就是:用自然语言翻译成 SQL,然后在后台的数据库或大数据系统里执行,再把执行结果取出来,再翻译成自然语言返回给人。

    Chat BI 的实质,就是自然语言 → SQL → 执行结果 → 自然语言,这本质上还是一种翻译。

    但我们会发现一个很有意思的问题:很多企业说要上 Chat BI,但如果原本数据库和里面的业务逻辑、数据口径积累不足,甚至连人都写不出对应的 SQL 来,那自然语言也一样翻译不出来。因为后台本身没有可执行的基础。

    所以我认为,企业里绝大部分在 Chat BI 上踩的坑,都来自于一开始就想做一个过于“宽”的东西。但是做了这个翻译之后,如果原来的系统 API 没准备好,数据没准备好,甚至连原来的人都无法执行这些操作,那自然语言翻译也没法落地。这就是最大的误区。

    因此我们在内部的逻辑是:要先 Identify 原系统具备哪些能力。比如,如果你原来的 ODPS、数据库和数据中台本身已经有 BI 和运营,能够在某个领域里不断取数、用 SQL 分析数据,而且业务场景也很丰富,那么,那些高频的 SQL 语句才是真正值得作为翻译目标的部分,而不是盲目地去做一个 Chat BI。

    所以很关键的是要分成两个部分 :一部分是翻译,一部分是原来系统的语言处理能力。我习惯这么来形容:原来的系统就是“蛋糕坯”,大模型翻译就是上面的“樱桃”。如果你现有的蛋糕坯是 ready 的,我放一个樱桃上去,你就可以吃樱桃蛋糕了。但是如果原来的蛋糕坯都没有,你让我做一个樱桃蛋糕,是做不出来的。

    这里非常重要的一点是:要能够识别出原来的蛋糕坯是不是 ready ,然后在上面放上你的樱桃,而不是直接拿一个樱桃就装作是樱桃蛋糕。这个地方往往就是个误区。

    翻译模式是“低垂的果实”,容易做,但里面其实有非常多的坑。

    Agent 模式:关键在意图与知识空间

    再说 Agent 应用模式

    大家可以注意这样一句话:所有的 Agent 应用模式都是始于用户意图,终于意图满足

    如果你不是从用户意图出发,最后又不是以是否满足客户意图来作为度量标准,去看待你的智能体,那一定会失败,没有任何成功的可能性。

    这是我发现团队,甚至整个业界,最容易出现的问题。因此我们引出了一个方法,这是我在内部做智能体时,一定要去践行的方法。

    第一件事情,要找到这个领域的“意图空间”。 当一个客户在智能体里和你交互时,他一定是带着意图的。那么这些意图都有哪些?比如客服场景里,客户会提出各种咨询问题,这些问题本质上就是一个空间、集合。所以,第一步就是要搞清楚这个集合的 边界和完整性。如果你不知道它的完整性,就无法去度量。只有在建立了完整的意图空间之后,才能继续往下做。

    于是,第一件事要建立意图空间。然后,当清楚地知道了意图空间,就要基于这个意图空间来准备 知识工程。也就是说,你的知识、文档是否完备?API 和结构化数据是否具备?能否真正满足客户的这些意图?我认为这是最基础的必要条件。

    再者,有了知识、意图空间,接下来才能带着意图去做评测。 因为既知道用户的意图,也掌握了知识,这样才能真正开展工作。如果意图不清楚、知识不具备,其实就是“空转”。

    我们的经验是:在客服场景里构建意图空间,从原来就在满足意图的领域出发,从 工单 里去分析和构建意图空间。有了意图空间之后,就可以对意图进行分类。分类完成后,再根据不同类别去检查和补全知识,做好知识工程。

    这样,当 意图空间 和 知识空间 都建立好了,才有可能开展评测,也才知道如何去度量你的 Agent。只有具备了度量能力,才有可能进一步做工程和算法迭代,这个是原理决定的。这也是我们在内部做智能体的一个必修课。

    这里,简单总结一下两个模式: 翻译模式是樱桃,一定要先找到原来的蛋糕坯在哪里,再把樱桃放上去。如果蛋糕坯不 ready,只放个樱桃一定会失败。而 Agent 模式的关键则是:始于用户意图,终于意图满足。 这是一系列完整的逻辑方法。

    Agent 落地要点:意图空间、品味 &评测

    接下来,我们就展开讲这个稍微复杂一些的 Agent 模式,看看在业务体系里实现 E2E 落地的一些关键要点。

    第一,意图空间的投入进行 ROI 评估。做一个 Agent,它的 ROI 高不高?这取决于意图空间的大小。如果工程所需的知识量庞大,意图也非常多、非常宽,那么所需要的投资就会非常大。意图空间越大,为满足这些意图所需要的知识、工程和迭代的投入也就越大。

    所以有一个非常清晰的结论:第一件事情,就是要控制意图空间的规模。如果不控制规模,会导致失败,因为后续的投入很难支撑。这里要记住一句话:如何去控制一个智能体的意图空间?如果没有控制好,或者不清晰,那么 ROI 根本算不出来。而一个算不出 ROI 的项目,成功的可能性将大打折扣。

    第二, 我们经常讲,最近大家肯定也听说过,在 AI 领域里经常提到一个词叫“品味”AI 时代里,品味非常重要。 那么品味来源于哪里?我自己猜测,要追溯到 1995 年乔布斯(Jobs)的一次采访。当时记者说:听说你比较粗暴、独裁,你怎么知道你的决定就是对的?乔布斯想了大约 10 秒,回答道:“归根结底,最后是品味决定的。”

    品味和这一轮 AI 的关键问题——评测——高度相关。

    这一轮和上一轮 AI 革命最大的区别在哪里? 

    上一轮深度学习主要是计算机视觉。那时候的数据评测怎么做?一张图给猫、狗、交通灯、汽车、人等等打圈,数据打标就是这么来的。所以评测时,只需要看分类对不对(猫有没有被错分成狗?对了就好)。ImageNet 就是这样做的,李飞飞当年找了很多外包团队来做标注,这种标注工作很适合外包,找普通人就能做。原因很简单,猫狗识别不难,就算是一些专家领域,比如故障识别、次品检测,标注也相对容易。

    但这一轮情况完全不同。

    大模型的输入是小作文,输出也是小作文。在专业领域尤其如此,很难直接度量。这就是为什么要强调品味——因为没有标准答案。我们都是经历过高考的。高考作文有没有标准答案?没有。开放题,比如写一篇中心思想总结,有没有标准答案?也没有。

    大模型的评测正是如此。所以,这一轮大模型最关键的区别在于:度量数据、评测没有标准答案。既然这是没有标准答案的,意味着成本最高,也就成为落地的瓶颈。 如何解决这个瓶颈?只能重投入

    Agent 落地要点:如何做好「评测」 

    当然,这里讲的“品味”,就是如何做评测的问题。 

    我们怎么去评测?评测是一件非常重的事情,这包括业务效果的评测能力,也包括评测本身的工程化。

    具体来说,在人工评测中,我们如何去解决分类的标准问题?什么是“好”,什么是“中”,什么是“差”?如何能够确保,评测对真实业务意图的覆盖度是足够的?如果覆盖度足够好,标准也足够清晰,我们又如何通过工程化的方式,对系统的迭代和变动进行自动化评测?

    由于人工评测和度量,很多时候就像写一篇小作文,它是非标的,是没有标准答案的东西。相反,为什么现在编程发展很快?因为数学和编程都有标准答案,可以被编辑器校验,但是纯文本是没有标准答案的。

    所以,评测这项工作非常耗时,也很容易成为整个项目的瓶颈,是需要极大加强的。如果不去加强,那么整个项目的基石就可能动摇。

    在评测的过程中有一个非常重要的点,叫 E2E 归因。因为在智能体的过程中会有非常多的环节,在这么多工作流和智能体的编排逻辑中,如果一个意图没有被满足,我们必须要有能力确定这个 Bad case 的问题到底出在哪个环节。当每一个 Badcase 都应该归因到工程里的具体环节,才能对具体的原因进行聚类和改进。

    如果从产品宏观功能体系来看,体系的最底层,必须要有两样东西:第一,是业务评测;第二,是全链路的归因分析能力。我把这两项放在最底层,就是因为它们太重要了。

    下图这是个大概率的经验总结,也就是说,如果具备度量能力,会发现 大部分问题都出现在数据层面,出现在非结构化、结构化数据 API。如果基本能力不具备,这就是智能体失败的主要原因。部分问题可能出现在知识预处理、意图识别、上下文检索,以及后续的意图识别总结等环节。数据极为重要,但没有评测也就谈不上数据。

    引出一个经常被讨论的问题:是否需要引入模型训练?

    我们的观点非常明确:必须在白盒方式下使用基模 API,注重评测和数据,并进行 E2E 归因迭代。只有当数据质量和评测能力具备时,才能引入训练。

    原因很简单,如果数据和评测能力不 Ready,投入在训练上的每一分钱都是浪费。如果数据不够好,那就是“garbage in, garbage out”。这些问题,都不是训练本身能够帮助解决的。

    而且,训练的周期长、成本高、迭代速度慢,如果没有能力评估训练结果的好坏,也没有足够的数据进行训练,这种投入是不明智的。因此,只有在必须使用训练,且基模无法解决问题时,我们才会引入预训练。

    写在最后:AI+云的「大电梯」

    最后,为大家回顾一下。

    我们在阿里云内部推进 AI 转型,本质上是需要为业务提供 Result as a Service(RaaS)。我们也是当前时点为数不多的,能够真正大规模实现 E2E 落地,给业务交付结果的实践团队。 

    而我们实现 Result as a Service 的方法叫 RIDE,RIDE 分别代表 Reorganize、Identify、Define 和 Execute。

    需要特别注意的是,在必要条件上再努力,也解决不了充分条件的问题,所以这个 RIDE 方法论的核心是在提醒大家:只有把落地所需要的充分条件补齐,才能真正开展 AI 企业有效落地的工作。

    呼应最开始讲的“电梯”,想表达的是,冰山之上,我带着团队一直在做业务的数字化转型,之所以能够实现,是因为冰山之下,有强大的阿里云作为底座。

    无论是涵盖通义千问在内各种模型服务的 MaaS 百炼,还是 PAI,ODPS,数据库等 PAAS 服务、或是底层 IaaS 比如 ECS、灵骏、存储、网络服务,都是我们依赖的企业应用的有力支撑武器。而且,这些能力的成本在不断下降,功能也在持续拓展。

    所以,当企业选择了一个强大的技术底座,随着技术水平的增长和成本的下降,企业的数字化转型也就能够搭上一部更好的“电梯”。我自己认为,阿里云就是这样一部“大电梯”,企业上云后,这部电梯持续为企业实现数字化转型,提供源源不断的上升动力。