近日,多家机器人公司宣布成为 2026 年央视春晚合作伙伴,这种密集的集体登场,也成为产业加速寻求公众认知与市场突破的强烈信号。行业报告显示,我国具身智能产业规模正以超 50% 的增速跨越发展,整体已迈入全球第一梯队。在“十五五”规划等顶层设计推动下,产业正从技术探索迈向规模应用的关键阶段。

在这一关键节点,原力灵机举办了其首次技术开放日,并完整推出了全球首个具身原生大模型 DM0、具身原生开发框架 Dexbotic 2.0 以及具身应用的量产工作流 DFOL,分别从智能基座、开发效率与场景进化三个层面,为产业提供了新的落地范式。

应对泛化瓶颈,让智能“通用”

具身智能目前面临的核心挑战,集中体现在数据与泛化能力上。许多在受控实验室环境中训练出来的模型,一旦部署于开放的真实场景或适配不同的硬件平台,其性能往往出现显著衰减。而这种泛化能力的缺失,将行业限制在了昂贵的定制化开发循环中。

我们观察主流技术路线发现,许多研究通常默认通过互联网图文数据训练获得的“认知”,足以指导物理世界的行动。因此,大量研究重点便转向了如何将这种已有“认知”能力,有效迁移并适配到实体机器人系统上。

然而,物理交互有其特殊性。真实环境中的摩擦力、重量感和空间关系等关键信息很难仅从二维图像中完全掌握。于是,“具身原生”这一路径被提出。原力灵机认为,具身智能从诞生之初就需立足真实世界,聚焦“复杂环境中精准完成人类任务”,这也是此次发布具身原生大模型 DM0 的底层设计逻辑。

这一设计逻辑,首先体现为向物理世界要数据的范式转变。原力灵机合伙人周而进介绍,DM0 本质上是一个从头训练的多模态大模型,它的数据采集方案遵循了“熵在哪里,数据就投向哪里”的原则,除了提供通用语义的互联网图文,它更关键地纳入了体现复杂时空决策的自动驾驶序列数据,以及来自多种机器人平台的真实交互数据。这种融合为构建模型关于空间、力学与因果的认知框架,实现稳定泛化的动作执行能力提供基础。

具体实现上,DM0 模型采用的多任务与跨机型协同的训练方法进一步提升了强跨机型的泛化和迁移能力。DM0 技术报告显示,DM0 在预训练阶段就被置于一个多样环境中,同步学习抓取、导航、全身控制 3 类核心任务,并覆盖 UR、Franka、ARX、UMI、Aloha、R1-Lite、Realman、DOS-W1 等 8 种差异显著的机型。这种设计迫使模型剥离对特定硬件参数的机械记忆,转而学习通用逻辑与物理规律。

在这一设计路径下,DM0 模型在真机测试中获得了关键验证。DM0 在 RoboChallenge 平台的“Table 30”任务中取得了综合最高分,而其参数量仅为 2.4B,这意味着它的智能密度非常高。

此外,为了满足工业级精细操作,DM0 专门设计了 728×728 的高分辨率视觉输入,使其能在 720p的视频中捕捉细微的空间差异,显著提升精密装配等任务的定位可靠性。更具突破性的是,DM0 将机器人的“动作”从关节控制扩展为包含“拍照、扫码”等抽象指令的广义集合。这让机器人能够以连续、类人的作业逻辑,自主完成“抓取-调整-识别-扫码”的端到端流程。

目前,DM0 2.4B 版本已全面开源,支持在消费级显卡上微调。周而进介绍道,此举意在降低开发与科研门槛,让更多研究者能够基于 DM0 做二次开发或训练,从而推动产业共同验证并丰富“具身原生”这一技术范式。这或将为行业突破当前规模化落地的关键瓶颈,提供一条可供协作与迭代的开放路径。

破解效率困境,让研发“自由”

DM0 模型为产业提供了一个更强的泛化起点,但要将这类前沿模型转化为现实生产力,还需克服工程落地的重重障碍。高度碎片化的开发环境是核心痛点,数据格式、仿真平台与硬件接口的标准不一,使得从算法研究到真机部署的链条冗长而低效,大量创新精力被消耗在重复的适配工作中。

为了系统性地破解这一效率瓶颈,原力灵机将其开源框架 Dexbotic 升级至 2.0 版本。原力灵机合伙人汪天才阐述了此次重构的目的,“我们想通过这次重构进一步扩大 Dexbotic 在整个具身生态下的职能范围,让更多用户能够用它进行算法的开发,降低进行具身算法开发的门槛。” 其最核心的革新是采用了模块化架构,将机器人策略解耦为 V(Vision encoder)、L(LLM)、A(Action Expert)三个可自由组合的独立模块。开发者能通过像搭乐高一样,自由组合、快速验证新想法并适配不同硬件。更关键的突破是,这一设计统一了机器人长期以来相互割裂的操作与导航能力,推动其最终迈向全身协同控制的更高阶段。

框架的另一个特征是支撑多源异构数据的混合训练。这直接服务于如 DM0 这类“具身原生”模型的训练需求,能够无缝协调处理来自互联网、自动驾驶和机器人本体的不同性质数据,让模型在完整的统一流程中同步学习通用知识与专用技能。

为支撑这一复杂的多源训练范式并使其能够高效、可复现地转化为实际能力,Dexbotic 2.0 构建了一套从“数据—训练—评测—硬件”四个环节的标准化具身开发全流程。它定义了统一的数据规范以消除格式壁垒,集成了主流仿真评测工具以简化验证环节,并原生适配了多种机器人硬件平台,彻底将开发者从繁复的环境配置与适配工作中解放,提供了一条从算法原型直达真机验证的清晰路径。

伴随此次升级,Dexbotic 2.0 的开源生态建设也取得了实质进展。其与 RLinf 达成战略合作,目前已初步完成环境层面对接,并计划通过仿真复现与真机演示共同验证这套协同系统在复杂物理场景中形成有效生产力的潜力。

对于此次合作,汪天才的期望远超工具层面的对接。他认为,大语言模型之所以能爆发,关键在于找到了“SFT 和 RLHF”这套让模型与人类价值对齐的方法论。而现在,具身智能正站在相似的历史节点前。“我们期望与 RLinf 的合作能够复现并建立起这一已被验证的范式,最终形成覆盖具身智能全开发流程的‘SFT+RLHF’生态。”

填补进化缺口,让生产力“持续”

在原力灵机 CEO 唐文斌看来,“所有的价值是可以被衡量和计算的,如果不能的话,那这个东西是不能长期存续的。”当智能模型与开发工具就绪,如何让机器人在千差万别的真实场景中持续创造可靠价值,成为检验技术的最终标尺。

作为本次开放日的第三项重要发布,具身应用的量产工作流 DFOL(Distributed Field Online Learning)是原力灵机让具身智能从“展品”变为“产品”最具现实意义的一环。据介绍,DFOL 采用“硬件通用+模型智能”模式,构建了一套链接云端与现场的数据进化闭环。部署在产线或仓库中的机器人,能将作业过程中产生的训练片段(episode)与负样本块(negative chunk)实时反馈至云端。这些来自真实场景的数据经过处理,持续优化模型策略,并再次部署到所有机器人。这使得系统能够在实际运行中自主学习,应对物料差异、环境变化等不确定性,从而将固定程式转变为可持续进化的生产力。

值得关注的是,这一方案的有效运转,与 DM0 与 Dexbotic 2.0 两项技术基座的成熟度密切相关。DM0 模型所提供的强泛化能力,是系统能够快速理解新任务、获得可靠初始策略的智能前提;而 Dexbotic 2.0 框架及其标准化工具链,则为海量现场数据的高效回流、处理与迭代更新提供了工程化路径。三者共同构建了一个从“通用能力储备”到“高效开发部署”,最终实现“持续价值创造”的增强循环。

面对这种深度技术耦合可能带来的风险,DFOL 的设计逻辑本身便是应对之道。通过将现场运行数据实时反馈用于模型迭代,它将风险考量从依赖某一静态模块的“完美性”,转化为依赖整个系统“动态进化能力”的健康度。这意味着,对其商业落地的评估,将不再仅仅是评估一个固定版本模型的好坏,而是评估一套系统的学习与适应效率。

由此来看,此次相继发布的模型、框架与方案,是一条贯穿“能力构建-效率提升-价值闭环”的连贯路径。它们共同呈现了原力灵机的技术纵深,更展示了其对“具身智能规模化落地”的系统性思考。其“具身原生”的范式探索,不仅关乎企业的自身发展,也为整个产业如何打通从技术研发到规模商业化的路径,提供了一个值得深入观察的范例。

标签: none

添加新评论