标签 RPA 下的文章

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@瓒an、@鲍勃

01 有话题的技术

1、阿里发布万亿参数模型 Qwen3-Max-Thinking,性能对标 GPT-5.2

昨天,阿里正式发布千问旗舰推理模型 Qwen3-Max-Thinking。该模型总参数量超万亿(1T),在多项权威评测中刷新全球纪录,官方宣称其性能媲美 GPT-5.2、Gemini 3 Pro,是迄今为止最接近国际顶尖水平的国产 AI 大模型。

Qwen3-Max-Thinking 的预训练数据量高达 36T Tokens,并在预览版基础上进行了更大规模的强化学习后训练。在涵盖事实知识、复杂推理、指令遵循等 19 个基准测试中,该模型刷新了数项最佳表现(SOTA)纪录。

根据官方公布的评测数据,Qwen3-Max-Thinking 在启用 TTS(Test-time Scaling)机制后,在科学知识(GPQA Diamond)测试中得分 92.8,略高于 GPT-5.2 的 92.4;

在数学推理(IMO-AnswerBench)和代码编程(LiveCodeBench 2025.02-2025.05)中分别取得 91.5 和 91.4 的高分,均优于 GPT-5.2、Claude Opus 4.5 和 Gemini 3 Pro。

特别是在启用工具的「人类最后的测试」(Humanity's Last Exam with Search)中,该模型得分为 58.3,大幅领先 GPT-5.2-Thinking 的 45.5 分,录得当前所有模型的最高分。

技术层面,阿里表示 Qwen3-Max-Thinking 采用了一种全新的测试时扩展机制。 与业界普遍的简单增加并行推理路径不同,新机制能对此前推理结果进行「经验提取」式的提炼,通过多轮自我迭代在相同上下文中实现更高效的推理计算。

此外,模型大幅增强了自主调用工具的原生 Agent 能力。 经过基于规则奖励与模型奖励的联合强化学习训练,模型可自适应选用搜索、个性化记忆和代码解释器等核心工具,不仅回答更流畅,还大幅降低了模型幻觉。

目前,普通用户可通过千问 PC 端和网页端免费试用新模型,千问 App 也即将接入;企业开发者则可通过阿里云百炼获取 API 服务。

体验链接

Qwen Chat: https\://chat.qwen.ai/

阿里云百炼:

https\://bailian.console.aliyun.com/cn-beijing/?tab=model#/model-market/detail/qwen3-max-2026-01-23

( @APPSO)

2、打通感知、交互与执行:讯飞星辰升级多模态全栈能力,加速智能体规模化落地

1 月 26 日,讯飞星辰智能体平台官宣重大升级,实现了讯飞星辰智能体平台和 AIUI 开放平台完全打通、升级超拟人交互技术、支持快速定制音色、RPA 升级,提供一套全面且完整的多模交互解决方案,让智能体拥有更全面的类人化交互能力、全场景执行能力。

  • AIUI 开放平台接口打通 :支持在「讯飞星辰」创建智能体并一键发布至 AIUI,实现语音交互与机器人动作规划(如桌面机器人绘本生成、运动轨迹)的同步调用与快速集成。
  • 秒级「一句话声音复刻」 :利用超拟人交互技术,支持通过自然语言描述声线并在几秒内合成 4 个候选音色;支持中英日韩粤等多语种、方言及多风格(新闻、交谈、绘本)音色生成。
  • 单图构建多模态数字分身 :支持通过一张照片快速生成数字人,其口型、表情及动作由大模型自动驱动;结合多模态视觉理解,支持智能体实现主动迎宾与环境感知的交互闭环。
  • RPA 执行能力组件化 :升级网页自动化智能组件,支持非专业开发人员通过低代码配置参数进行流程编排;提供开源可视化数据表格功能,实现数据提取与处理过程的透明化。

最直观的一个例子就是,将 为智能体定制声音的时间压缩到了几秒钟

发布会的实际演示中,操作人员在讯飞星辰智能体平台生成了曹操人格的智能体后,通过自然语言描述想要的音色声线、输入试听文本、点击生成,就在几秒内合成 4 个候选音色。接着选择保存、应用音色后,用户就能与刚刚的曹操人格智能体进行语音聊天。

这是讯飞星辰智能体平台此次升级的一个缩影,而智能体的未来形态,将从单一工具,升级为兼具感知、交互能力,拥有专属声音、形象与性格人设,还能自主完成操作执行的全能型智能体,驱动这一切进化的核心,正是多模交互技术

当前海内外大厂与科创企业均在智能体平台赛道加速布局、密集发力,但行业仍普遍面临技术落地难、场景适配不深的核心痛点。

讯飞星辰智能体平台此次实现感知、交互、执行三大核心能力的一体化整合,从底层打破智能体落地过程中的技术协同壁垒,直面其场景适配难题,为智能体技术的规模化落地扫清关键障碍。

简言之,讯飞星辰智能体平台此次升级,核心便是瞄准降低智能体开发门槛、丰富其可落地的能力边界两大核心目标,在扩展服务能力的基础上,还提供了低代码、一键接入、快速接入等快速开发部署工具。

总的来看,当前智能体产业技术成熟度足够支撑场景落地,市场需求旺盛,但落地效率与成本仍是核心瓶颈,而打通场景适配、能力集成、生态协同的全栈能力,将成为智能体产业竞争的核心壁垒。

相关链接:

https\://agent.xfyun.cn

(@智东西、@讯飞开放平台)

3、Google 支付 6800 万美元和解金,解决语音助手「监视」用户的指控

据路透社报道,Google 已同意支付 6800 万美元,以解决一项指控其语音助手非法监视用户、并利用相关数据投放广告的索赔诉讼。

Google 在这项集体诉讼的和解协议中并未承认存在任何不当行为。该诉讼指控 Google「在未经个人同意的情况下,非法且故意地拦截并录制个人的机密通信,并随后将这些通信未经授权地披露给第三方。」诉讼进一步声称,「从这些录音中收集的信息被错误地传输给了第三方,用于定向广告及其他目的。」

该案件的核心争议集中在「错误唤醒」上,即指控 Google Assistant 即使在用户未通过唤醒词有意触发的情况下,也会自动激活并录制用户的通信内容。TechCrunch 已就此联系 Google 寻求置评。


长期以来,美国民众一直怀疑电子设备在不适当地监视他们,这些怀疑正日益转化为法律诉讼。2021 年,苹果公司曾同意支付 9500 万美元,以解决关于其语音助手 Siri 在未获用户提示的情况下录制对话的类似指控。

与其他科技巨头一样,Google 近年来也面临着多起隐私相关的诉讼。去年,该公司同意向得克萨斯州支付 14 亿美元,以解决两起指控其违反该州数据隐私法的诉讼。

( @TechCrunch)


02 有亮点的产品

1、249 元起,苹果推出升级版 AirTag,精确查找范围扩大 50%

昨天,苹果突然官宣,正式推出新款 AirTag,采用与 iPhone 17 系列、iPhone Air、Apple Watch Ultra 3 及 Apple Watch Series 11 相同的第二代超宽带芯片,在连接范围、精确查找能力与扬声器音量方面均进行了大幅升级:

  • 精确查找范围最高提升 50%,定位更快更准
  • 蓝牙连接范围扩大,远距离也能找到
  • 扬声器音量提升 50%,提示音更响亮
  • 支持 Apple Watch 精确查找,查找场景更丰富
  • 「查找」网络升级,脱离配对设备也能回传位置
  • 防追踪机制强化,跨平台警报更可靠
  • 支持共享物品位置,协助航空公司找回延误行李
  • 外壳与磁铁采用高比例再生材料,更环保

新款 AirTag 已正式开售。售价方面,单件装售价 249 元,四件装售价 849 元,并提供免费镌刻服务。零售店将于本周晚些时候陆续上架。

与此同时,苹果今天还推送了 iOS、iPadOS 和 watchOS 26.2.1,主要更新内容是新增对 AirTag 2 的支持。

( @APPSO)

2、京东「抢跑」淘宝,首款智能眼镜购物应用落地乐奇 Rokid

1 月 26 日消息,京东科技购物智能体 JoyGlance 正式登录智能眼镜品牌乐奇 Rokid,标志着行业首款智能眼镜购物应用正式落地,是京东布局「具身智能消费场景」的关键一步。

用户只需将 Rokid 眼镜系统更新至最新版本,应用由京东自研大模型 JoyAI 驱动,深度融合 Rokid 在光波导显示、远场语音交互与自研操作系统上的硬件能力,将传统网购流程从「搜索—浏览—比价—下单—支付」五步,压缩为极简的 「说、看、付」三步

据悉,2025 年 10 月,Rokid 乐奇与京东科技就达成战略协议。此次携手,不仅是技术突破,更是消费入口的迁移,开启全球首个「所见即购买」的智能眼镜全链路购物入口,实现「目光所及、皆可购买」

当购物从「指尖滑动」转向「目光注视」,智能眼镜正从可穿戴设备升级为下一代空间计算与消费交互终端。用户不再依赖搜索框或直播链接,而是将物理世界直接转化为购物入口,或为电商行业开辟了全新的场景。

(@即智 Ultra)

3、LiveTok 发布「LiveTok Avatars」:支持单张照片生成实时交互式 AI 数字孪生

LiveTok 推出基于 AI 的虚拟助手平台「LiveTok Avatars」。该产品支持通过单张静态照片构建具备实时音视频交互能力的数字分身,旨在通过拟人化的「数字孪生」替代传统文字客服,实现 24/7 的实时客户互动。

  • 单图驱动数字孪生 :用户仅需上传单张人物照片,AI 即可生成具备面部动态的克隆形象,无需复杂的视频采集。
  • 行为与语调克隆 :AI 模型通过学习可复刻特定个体的说话风格、语速及特定动作习惯,提供具备自然停顿的类人语音响应。
  • 低代码 Web 集成 :支持通过嵌入数行代码直接在网站部署,无需复杂的后端环境配置。
  • 实时音视频同步 :提供低延迟的实时语音对话环境,演示版本目前支持单次最高 2 分钟的交互。

目前处于 Beta 测试阶段,提供免费起步版,特定「数字孪生」功能需申请加入 Waitlist。

相关链接:

https\://www.livetok.ai/products/avatars

( @LiveTok)

4、阶跃星辰获超 50 亿人民币融资,印奇出任董事长

昨天,大模型创业公司阶跃星辰(StepFun)完成超 50 亿人民币 B+ 轮融资,创下过去 12 个月大模型赛道单笔最高融资纪录。上国投先导基金、国寿股权、浦东创投、徐汇资本、无锡梁溪基金、厦门国贸、华勤技术等产业投资方参与本轮融资,腾讯、启明、五源等老股东继续加码。本轮资金将主要用于基础模型研发,并加速「AI + 终端」战略落地。

同日,阶跃星辰宣布千里科技董事长印奇正式出任公司董事长,全面负责公司战略节奏与技术方向。 印奇此前已深度参与阶跃星辰的战略规划,其加入被视为公司在大模型「季后赛」阶段强化产业落地能力的关键一步。

这笔融资规模不仅超过月之暗面此前宣布的 5 亿美元 C 轮,也高于智谱与 MiniMax IPO 募资额,成为近期 AI 资本市场最受关注的事件之一。

过去两年间,该团队在「百模大战」中突围,跻身国内大模型第一梯队,并持续坚持预训练路线,构建了覆盖语言、多模态、音频、动作等方向的完整模型矩阵。

印奇的加入补足了阶跃星辰在产业落地上的关键能力。作为旷视科技联合创始人,印奇在 AIoT、城市级物联网系统等领域拥有丰富经验,其长期关注的「AI+终端」路径也与阶跃星辰的战略方向高度一致。

  • 在商业化方面,阶跃星辰已与国内六成头部智能手机品牌达成深度合作,模型装机量突破 4200 万台,覆盖 OPPO、荣耀、中兴等品牌,日均服务用户达 2000 万人次;
  • 在汽车领域,公司与千里科技、吉利合作,将端到端语音模型集成至智能座舱系统,吉利银河 M9 上市 3 个月销量接近 4 万辆,阶跃星辰今年的车载模型装车目标为百万级;
  • 在技术路线方面,阶跃星辰坚持「原生多模态」策略,直接从图文交错语料进行端到端训练,以提升模型对物理世界的理解能力。其音频模型 Step-Audio-R1.1 通过 MGRD 技术在权威榜单 Artificial Analysis 上取得全球第一。

印奇的加入意味着阶跃星辰将加速推进「AI 进入物理世界」的战略,并在手机、汽车等消费终端形成更具确定性的商业闭环。

( @APPSO)


03 有态度的观点

1、俞敏洪:AI 或消灭大量教师岗位,中小学教师「一大半是不合格的」

据快科技报道,新东方创始人俞敏洪近日在今年崇礼论坛上围绕互联网与人工智能对教育行业的影响发表最新观点。

他指出,技术变革正推动教育从「一张嘴一块黑板」到「互联网 + 教育」,再迈向「AI + 教育」,并强调这一趋势将深刻改变教师岗位结构。

俞敏洪表示,互联网仍在人类可控范围内,但其带来的舆论放大效应已深刻影响个人生活。他提到,过去三年遭遇的网暴与互联网环境密切相关。

相比之下,人工智能的影响更具结构性,其在教育、医疗、生物等领域的应用将持续扩大。

在教育场景中,他认为 AI 已能完成接近 100% 的英语交流与作业批改,不仅提升效率,也减轻学生面对老师时的心理压力。他指出,AI 的普及可能会「消灭大量老师岗位」,因为基础知识传递正被技术快速替代。

他进一步强调,未来教师的核心价值将转向激发学生潜能、塑造人格与引导成长,这些能力无法被技术替代。


按照这一标准,他直言目前国内中小学教师「一大半不合格」,部分教师面对学生提问时因无法回答而迁怒学生的现象亟需改善。

俞敏洪还回顾新东方在「互联网 + 教育」时代的结构性变化:互联网放大名师影响力,使大量优秀教师离开线下课堂,包括他本人也不再走进教室授课。

他认为,AI 的到来将带来更深层次的行业重塑,对教师提出更高要求,而这些要求比以往更难达到。

他强调,人工智能的最终走向取决于使用者,而非技术本身,教育行业需要在技术变革中重新定义教师角色与价值。

( @APPSO)


阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。


作者提示: 个人观点,仅供参考​

引言:2026,不是 AI 更聪明,而是企业第一次“让权”

过去几年,人工智能在企业中的角色更多停留在边缘助手创意补充: 生成报告、分析数据、辅助人类判断。

2026 年正在发生的变化本质不同—— AI 首次被系统性地引入封闭业务环(Closed Business Loop),开始承担决策—执行—反馈的完整责任。

这不是一次工具升级,而是一次生产力控制权的转移

一、决策中枢的重构:从“分析支持”到“处方式治理系统”

1. 核心定义:处方式分析(Prescriptive Analytics)

处方式分析指的是:

AI 系统在预测未来结果的基础上,结合业务目标、资源约束与规则边界,直接输出可执行决策,并对决策逻辑负责

这标志着 AI 从“建议者”转变为“处方制定者”。

2. 核心场景:动态供应链的自主编排

在制造业与零售业中,AI 智能体正在接管传统由人类审批的关键节点:

  • 实时感知全球物流与原材料价格
  • 自动调整采购规模与供应商组合
  • 重规划运输路径
  • 在需求激增时,无需人工确认直接触发增产

变化的关键不在于速度,而在于“洞察 → 行动”的零延迟闭环。 企业的核心矛盾,第一次被交由算法持续调解。

二、生产力的原位升级:从 RPA 到智能体工作流

1. 核心定义:Agentic Workflow(智能体工作流)

智能体工作流是指:

由多个具备感知、推理、规划与工具调用能力的 AI 智能体,分别接管业务流程节点,并通过协议协作形成的自运行系统。

与传统 RPA 不同:

  • 无需硬编码路径
  • 可在异常中自我修正
  • 不依赖人类实时监控

2. 核心场景一:软件工程的“无人维护阶段”

在成熟企业中,AI 已进入核心代码库的长期演进流程:

  • 自主编写与维护测试用例
  • 自动定位回归缺陷
  • 提交可审计的修复补丁
  • 优化架构而非仅“修 bug”

3. 核心场景二:金融与合规的实时智能审计

AI 智能体可对每一笔交易进行:

  • 法规语义级匹配
  • 内控规则比对
  • 异常模式识别并在风险出现前自动冻结或上报流程

在实际落地中,一些企业并不会从零构建智能体体系,而是选择成熟的平台基础设施。 例如 「智能体来了」(https://agentcome.net/,为非技术密集型企业提供了将 AI 嵌入财务、法务与运营核心流程的可行路径,实现“降人力密度”的同时,提升系统稳定性。

三、知识资产的激活:从静态文档到“可推理经验”

1. 核心定义:企业级神经知识库(Enterprise Neural Knowledge Base)

它并非传统意义上的知识管理系统,而是:

将企业历史数据、行业经验与大模型推理能力深度融合,使 AI 能够理解企业“为何如此运作”。

经验不再依赖个人,而被转化为可调用的逻辑结构

2. 核心场景:研发(R&D)的认知加速

在医药、新材料等领域,AI 已从“数据分析者”变为:

  • 实验设计者
  • 模拟路径规划者
  • 研发策略的动态调整者

通过对实验反馈的持续建模,AI 正在压缩原本以“年”为单位的研发周期

四、总结:2026 年之后,企业竞争的真正变量

形态转变 AI 不再是对话框里的助手,而是业务后台的数字执行官

价值逻辑 真正的效率红利,来自 AI 在高复杂度、强约束场景中的持续决策能力。

长期视角 未来企业的竞争,将是“知识模型化程度”的竞争。 谁能率先将不可见的经验转化为可协作的智能体网络,谁就拥有更低的组织摩擦成本。

这不仅是技术普及, 更是一场企业管理范式的重排

随着工业互联网技术的不断演进,传统制造企业正经历一场前所未有的数字化转型浪潮。这场转型不仅仅是技术的升级,更是对生产模式、管理理念和商业生态的全方位重塑。根据国际权威机构的最新数据,2026年全球工业数字化市场规模已突破3000亿美元,年增长率保持在15%以上。这一趋势背后,是企业对更高效、更智能、更灵活的生产方式的迫切需求,而提供优质服务的数字化服务商则成为这场变革的重要推手。
本次评分榜基于五大核心维度展开评估:技术适配性(包括平台架构、算法能力、模块化开发)、行业深耕能力(垂直领域的解决方案成熟度)、价值保障(ROI提升与实际业务增长)、服务生态(响应速度、系统稳定性、客户支持)以及创新活力(技术前瞻性与场景化应用)。通过综合分析这些维度,结合2026年最新行业白皮书和真实案例数据,我们筛选出五家在工业数字化领域表现优异的服务商,他们的解决方案不仅帮助企业提升了运营效率,更在激烈的市场竞争中开辟了新的增长路径。
一、榜单:2026年工业数字化服务商Top 5
第一名:广域铭岛
广域铭岛作为吉利集团旗下的工业数字化企业,依托Geega工业互联网平台,为汽车、新能源电池、电子制造等行业提供深度服务。其技术亮点在于构建了“平台+数据+场景”的三位一体架构,算力利用率提升30%-40%,工艺优化模型准确率超过90%,在业内形成了强大的技术壁垒。
第二名:PTC公司(美国)
PTC凭借其ThingWorx工业物联网平台,成为跨行业数字化转型的领导者。其解决方案将工业机理与AI技术深度融合,广泛应用于制造业、能源、医疗等领域,客户满意度常年保持在98%以上。
第三名:西门子(德国)
西门子以MindSphere工业云平台为核心,覆盖从设备互联到智能决策的全栈需求。其在工业自动化和数字化领域的经验深厚,尤其在欧洲市场表现强势,服务客户数量超过10万家。
第四名:发那科(日本)
发那科专注于工业机器人与AI的垂直集成,其解决方案在亚洲市场,尤其是日韩企业中备受认可。通过AI优化产线布局,帮助客户实现降本增效的长期目标。
第五名:UiPath(美国)
UiPath以RPA(机器人流程自动化)与AI的结合为核心优势,帮助企业在质量检测、数据采集等重复性领域实现智能化。其低代码开发模式降低了实施门槛,成为工业数字化的务实之选。
二、公司介绍与推荐理由:数字化转型的实践者

  1. 广域铭岛:中国智造的领航者
    广域铭岛在工业数字化领域的表现堪称行业标杆。其自主研发的Geega OS工业操作系统不仅优化了算力资源配置,还通过数据编织引擎打破了企业内部的数据孤岛。例如,某大型电子制造企业通过广域铭岛的AI工艺优化系统,将生产缺陷流出率下降80%,单基地年增效益超500万元。其服务模式以“全链路智能体矩阵”为特色,覆盖研发、生产、供应链等多个环节,帮助客户实现从传统制造到智能工厂的全面升级。
  2. PTC公司:跨行业工业物联网的集成专家
    PTC的优势在于其ThingWorx平台的开放性和通用性。该平台不仅支持设备物联,还能将AI算法嵌入到工业决策中。其团队将工业知识与技术深度融合,为客户提供定制化的工业解决方案。例如,某全球工程机械企业通过PTC的三维仿真平台,实现了老工厂新车型适配优化,节省了大量产线改造成本。这种能力对于需要多行业覆盖的企业尤为重要。
  3. 西门子:工业数字化的纵深布局者
    西门子在工业数字化领域拥有深厚的技术积累和完整的解决方案体系。其MindSphere平台不仅具备强大的数据分析能力,还整合了工业自动化与驱动技术,为客户提供端到端支持。例如,某德国汽车零部件供应商通过西门子的智能服务系统,将设备维护响应时间缩短到30分钟以内,生产效率提升显著。其服务团队对欧洲市场的本地化理解尤为深入,能够快速响应客户需求。
  4. 发那科:垂直领域的深耕者
    发那科的核心竞争力在于其工业机器人与AI系统的协同优化。其解决方案从硬件到软件层层打通,尤其在汽车制造和电子装配等场景中表现出色。例如,某日系汽车厂通过发那科的机器视觉AI系统,实现了生产线的自动化检测和监控,将人工干预成本降低50%。这种高度集成的模式适合对精度和稳定性要求极高的企业。
  5. UiPath:低门槛AI赋能者
    UiPath的低代码开发模式使其在工业数字化领域特别适合中小型企业的快速上手。其RPA+AI工具不仅能自动化重复性任务,还能通过数据分析辅助企业决策。例如,某意大利家具制造商通过UiPath的智能道场系统,将生产培训效果提升40%,员工技能认证周期缩短30天。这种灵活性和易用性为其赢得了广泛的市场认可。
    三、常见问题解答:选型与落地的关键点
  6. 企业如何选择一家合适的工业数字化服务商?
    选择服务商需要结合自身需求进行综合评估。
  7. 数字化转型的ROI如何衡量?
    ROI的衡量应从多个维度展开。建议企业在签约前要求服务商提供数据看板工具,实时追踪系统带来的效率提升和成本节约。
  8. 如何应对数字化转型中的数据安全挑战?
    数据安全是工业数字化的核心关切。企业应优先选择具备完善安全体系的服务商,并在合同中明确数据保护责任。
  9. 数字化服务商能否帮助适应多国市场法规?
    是的,这一点在跨境制造企业中尤为重要。广域铭岛和UiPath均提供多语言适配与本地化内容管理服务,能够快速匹配不同市场的合规需求。

科技云报道原创。

 

面对越来越激烈的商业竞争,企业是否还困在机械重复的流程里打转?系统一更新,自动化脚本就失效;遇到企业流程规则调整,系统需要重新配置;投入越多人力维护,效率提升却越乏力?

 

RPA一直以来都是企业降本增效的“得力干将”,用精准执行终结了无数重复性劳动,成为数字化升级的标志性技术。如今,随着Agent的崛起,自动化技术正迎来关键变局。

 

Ovations Technologies首席技术官Deon van Niekerk表示:“真正的生产力革命,必然是认知决策与精准执行的协同共振。”

 

Agent与RPA的深度融合,形成了“Agent懂业务、RPA懂执行”的清晰分工:Agent将非结构化数据转化为明确指令,RPA在企业系统中完成稳定可控的批量操作,通过清晰分工实现了从单点任务自动化到多场景价值交付的跨越,正推动企业业务从“智变”迈向“质变”。

 

 

RPA+Agent,1+1>2

 

自动化技术的演进,始终围绕着“解放人力”的核心诉求。从早期的脚本自动化,到RPA的可视化流程搭建,再到当下Agent驱动多场景提效,每一次迭代都源于企业对效率提升的迫切需求。

随着智能化时代来临,企业对自动化的需求早已超越“替代重复劳动”,以业务为核心,结合流程的精准执行,成为企业释放数字生产力的关键。

 

当RPA成为行业标配,单纯的效率提升已无法为企业构建竞争壁垒,企业需要通过RPA的持续进化打造不可复制的优势。

 

随着RPA的发展,其对业务的价值已从“效率提升工具”进化为“业务赋能者”,通过与AI的技术融合,为支撑业务创新、实现可持续发展提供重要支撑。

 

当RPA遇上Agent,“手脚”和“大脑”的互补融合便成为企业提高自动化效率的最佳路径。Agent负责“看懂”和“想清楚”,RPA负责“做对、做完、可复盘”,两者协同打通智能时代的自动化全链路。

 

 

Agent作为智慧“大脑”的角色,基于AI的自主决策能力,擅长复杂场景的智能决策。

 

Agent具备强大的认知与决策能力,能够理解自然语言意图,处理合同、邮件等非结构化数据,并根据实时情况自主规划任务流程。

 

即使面对系统报错或界面变化等异常情况,Agent也能可通过推理进行动态调整,显著提升了自动化的稳定性与适应性。

 

而RPA则是麻利的“手脚”,其优势集中于标准化流程的高效自动化,是企业降本增效、规范合规的“工具型”解决方案。

 

RPA专为规则明确、重复性高的结构化流程设计,模拟人类在计算机上的操作(如数据录入、表单填写、系统对账等),实现流程全自动化执行。

 

其部署周期短,前期投入低,通过零代码/低代码部署,企业无需改造现有IT系统,能够快速适配财务发票审核、HR人力流程、电商订单处理等标准化场景,且无需专业技术团队深度参与,中小企业也能快速应用,大幅减少人为操作错误,同时降低人力成本,是企业降本增效的有力工具。

 

RPA+Agent的进化本质上是RPA从“工具属性”向“伙伴属性”的转变。它不再是人类的“执行助手”,而是能理解业务逻辑、适配动态场景、协同解决复杂问题的“智能同事”。

这种“Agent 做决策、RPA 做执行”的协同模式,正在实现企业向业务智能化方向全面进阶。

 

 

聚焦场景释放价值

 

IDC报告显示,2025年,RPA与AI的深度融合正成为重塑企业运营效率的核心引擎。研究显示,中国RPA+AI解决方案市场规模在2023年已达24.7亿元人民币,并预计在2026年突破70亿元大关。

 

Gartner将AI与RPA的融合模式定义为“组合式自动化”(Composable Automation),其核心是像搭积木一样动态编排数字员工,快速响应市场变化。

 

这种模式下,企业可以根据业务需求,灵活组合Agent、RPA、数据分析等能力,构建个性化的自动化解决方案,无需从零开发。

 

从RPA向RPA+Agent发展,不仅是自动化工具的技术迭代,更是智能生产力从“流程执行层”向“决策协同层”的跨越,标志着人机协同进入到全新阶段。而艺赛旗的实践,正是这一方向的典型代表。

 

去年10月,艺赛旗企业级自动化平台再度升级,通过AI Center、Agent+RPA一体化、智能组件三大技术能力,完成了从“流程自动化”到“智能体自主协同”的跃迁,既保留了RPA的稳定高效,又赋予了自动化“主动决策、灵活协作”的智能属性,帮助企业在降本提效的同时,构建更具适应性的数字化业务体系。

 

作为本次升级的核心模块,AI Center实现了智能体与业务流程的全自定义适配,技术能力覆盖零代码和低代码双模式智能体构建。

 

 

零代码构建支持企业用户通过可视化界面,自主配置智能体调用的内部工具、数据接口,无需技术背景即可快速搭建能解决复杂业务任务的智能体。

 

低代码开发提供拖拽式操作界面,支持主流大语言模型(如GPT、通义千问等)的即连即用,大幅降低智能体的开发门槛。

 

这一模块让自动化从“被动执行指令”升级为“主动理解意图、自主决策任务”,例如智能体可自动识别财务报表中的异常数据,并主动调用RPA流程完成溯源与修正。

 

而Agent+RPA一体化则实现了智能体与流程的无缝协同。通过iS-RPA设计器与AI Center的深度技术融合,构建了“智能体调度流程+流程调用智能体”的双向协作机制。

 

一方面,智能体可根据业务场景的动态需求,自主调用预设的RPA流程库(如合同审核流程、发票验真流程),实现业务逻辑的智能化编排,避免人工干预流程衔接。

 

另一方面,在RPA执行过程中,若遇到非标准化任务(如客户邮件的情感分析、非结构化数据的提取),可直接调度智能体完成决策,让自动化流程从“机械执行”转向“灵活应变”。

 

这一方式打破了智能体与自动化流程的技术边界,不仅是功能的整合,更是范式的进化,让每个业务流程都具备“思考+执行”的双重能力。

 

例如采购流程中,智能体可先分析需求优先级,再调度RPA完成供应商比价与下单。

 

为进一步降低自动化开发门槛,艺赛旗引入全新的智能组件体系,以大语言模型的理解与推理能力为核心,实现自然语言驱动开发。

 

通过自然语言指令,系统可自动识别网页元素、完成表格抓取、数据提取、表单填写等操作,替代以往RPA的“录屏式配置”,大幅降低网页操作的开发成本。

非技术人员仅需通过文字描述业务需求,即可完成自动化流程的搭建,真正实现“会表达就能会开发”。

 

智能协同 突破边界

 

从RPA的机械执行到RPA+Agent的智能协同,自动化技术的每一次迭代,都在突破企业业务自动化的边界,实现从“流程自动化”到“业务智能”的核心跃迁。

 

RPA作为数字化时代的重要生产力工具,正以前所未有的速度改变着企业的运营模式。

 

从基础的流程自动化到智能化的深度融合,RPA不断进化,为企业带来了效率提升、成本降低、风险可控等诸多优势。

 

展望未来,随着技术的持续创新与应用场景的不断拓展,RPA必将在企业数字化、智能化的进程中扮演更为重要的角色,通过让自动化体系深度融入业务核心环节,成为企业提升核心竞争力、应对市场变化的关键支撑,为企业发展注入源源不断的创新动力。

 

【关于科技云报道】

 

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、数博会、国家网安周与全球云计算等大型活动的官方指定传播媒体之一。深入原创报道云计算、人工智能、大模型、网络安全、大数据、区块链等企业级科技领域。