标签 AI硬件 下的文章

当 AI 长出身体,从能听会说到能看会动!Agora Convo AI World 拉斯维加斯之夜活动回顾

主笔:周森

审校:小炫

编辑:陈述

AI 不再仅仅是屏幕里的对话框,从能感知情绪的陪护机器人,到具备实时翻译能力的智能眼镜,AI 硬件化成为 CES 2026 呈现的重要趋势。

然而,在 AI 硬件热潮背后,行业也在迫切寻找一个答案:当 AI 试图长出「身体」,它需要怎样的底层架构与交互逻辑?

1 月 9 日晚,Agora(声网兄弟公司)联合 RiseLink(博通集成)在拉斯维加斯 The LOFT at Cabo Wabo Cantina 举办了 Convo AI World 论坛活动。

这场吸引了近 300 位全球科技精英参与的盛会,意在为这股 AI 硬件热潮指引风向。

两家企业不仅联合发布了基于 BK7259 芯片的 R2 全场景 AI 机器人开发套件,更首次系统性地提出了「物理 AI 的蓝图」。

△ 活动现场

具身 AI 的蓝图:从「工具」到「生命形态」

当前,行业正处于从文本模型、语音助手,迈向具备长期记忆、情绪理解与陪伴能力的 AI 伙伴的早期阶段。

Physical AI,本质上是具身智能(Embodied AI) 在消费级市场的落地呈现。AI 硬件不再是冰冷的电子零件,而是一种正在形成的数字生命形态。

由 Agora 与 RiseLink 联合提出的 Physical AI 蓝图,则试图为下一阶段的具身智能发展提供一套以体验为核心的设计方法论。

Tony Wang 在演讲中强调,Physical AI 的关键不在于堆砌硬件参数,而在于对话体验,即在复杂环境中理解语境、识别说话者并感知情绪的能力。

未来,AI 的核心语言将从单向的「指令」彻底转变为双向的「对话」,其商业模式也将从硬件单次销售,转向以订阅制为核心的长期服务。


△ 发言嘉宾:Tony Wang,Agora 联合创始人兼 CRO

张鹏飞博士进一步阐述道,Physical AI 时代的竞争已演变为协同效率的竞争。想要成为或持续保持第一,前提是与各自领域中已经处于领先位置的伙伴深度协作。

RiseLink 将通信、算力与功耗管理深度整合,配合 Agora 的 RTC 实时互动能力,构成了 Physical AI 的基础引擎:以低延迟保障交互的自然性,以高能效支撑长时间的在线陪伴。

△ 发言嘉宾:张鹏飞博士,RiseLink(博通集成) CEO

真实的 AI 堆栈:重构技术底层

当 AI 跨越数字边界、从云端软件形态进入物理硬件,底层的技术架构不应该只是「模型 + 数据 + 算力」,而需要从「原子」到「比特」实现闭环。

在论坛环节,嘉宾们探讨和回答了什么是「真实的 AI 堆栈」并达成共识:AI 是否好用,取决于设备能否通过物理感知快速理解语境并做出即时反应。

△ Panel: The Real AI Stack

圆桌主持人:Rin Yunis 博士,RiseLink 开发者体验负责人 (中)

圆桌嘉宾: (自左向右)

  • Max Fillin, WowCube CEO
  • Blake Margraff, Healthcare Technology 创始人
  • Amir Eitan, Nanit CPO
  • Lin Chen 博士, Wyze 首席科学家

在架构选择上,边缘(Edge)与云端(Cloud)的分工不再是二选一,而是基于延迟、隐私和成本的精密平衡 。对实时性和隐私敏感的能力更适合本地运行,而需要持续迭代、受成本约束的功能则更适合放在云端,工程实践应从验证出发,再逐步优化边云分配。

在消费级场景中,成本是最硬的约束条件。无论技术听起来多么具有颠覆性,如果缺乏可持续的单位经济模型(Unit Economics),产品终究无法走出实验室成为长期的生意。

同时,嘉宾们达成了一个感性却深刻的共识:AI 必须具备稳定的记忆和一致的行为 。一个今天热情、明天健忘的 AI 硬件,是无法真正建立起用户信任的。

△ 圆桌嘉宾:Max Fillin, WOWcube CEO(左)

这种信任的建立,在家庭与健康等强私密场景下尤为微妙。品牌的真实投入与清晰的价值传递,远比罗列一堆天衣无缝的安全技术术语更有效。 用户对 Physical AI 的接受度,往往并不取决于你背书了多少项加密协议,而取决于极其直观的交互体感,即:反馈要即时(低延迟)、过程要透明(可解释)、底线要有人守(人类参与)。

△ 圆桌嘉宾:Lin Chen 博士, Wyze 首席科学家

应用与具身落地:AI 硬件的场景爆发

Physical AI 最令人兴奋的特质在于它的多模态能力,以及在各个场景的迅速渗透。

△ WOWcube(左):将经典的 2x2 魔方形态与 24 个高分辨率屏幕相结合,通过扭转、倾斜和触觉交互,让玩家在立体的物理空间中体验沉浸式的游戏与应用。

△ Wyze(右上): 新款户外安防摄像头采用贴纸式安装方式固定在窗户上,可从室内进行户外录像

△ Nanit Pro(右下): 全功能婴儿监控系统,新增用于记录宝宝成长发育的功能

在医疗与健康领域,Physical AI 的价值在于它能实时处理复杂的生理信号,并以人类能理解、能接受的方式进行交互,从而在专业性与亲和力之间找到平衡。

Blake Margraff 指出,AI 在医疗中的落地绝非简单的自动化,而是要实现「自动化的患者监测与干预」。

△ 圆桌嘉宾:Blake Margraff,Healthcare Technology 创始人

Amir Eitan 则从育儿与家庭监测的角度补充道,真正的信任来自于 AI 能在特定场景下提供「可解释的反馈」。

△ 圆桌嘉宾:Amir Eitan,Nanit CPO

在 AI 陪伴的主题论坛中,各位嘉宾围绕 AI 陪伴产品在儿童与家庭场景中的实际落地展开话题。

△ Panel:Where AI Companionship Comes to Life

圆桌主持人:Patrick Ferriter,Agora 产品与市场高级副总裁(左下)

圆桌嘉宾:

  • 孙兆治,珞博智能 CEO(左上)
  • Angela Qian,灵宇宙 Luka AI 战略负责人 (右上)
  • Wayne Zhang, Dify Chief of Staff(右中)
  • Margo Wang,Lgenie &灵机一动 Agent 市场总监(右下)

稳定性和一致性是影响儿童用户对 AI 硬件接受度的关键因素。无论是故事内容、角色设定还是互动方式,一旦发生变化,都会显著影响使用体验。

低延迟是实时陪伴场景中的基本要求,是建立用户与产品情感连接的底线,响应过慢会直接削弱互动的自然感。

长期留存更具挑战性。吸引用户首次尝试与长期留存两者的差异性需要引起重视,长期留存更具挑战性,需要 AI 在持续使用中形成稳定的互动节奏和情感连接,而不仅是单次回应。

安全与责任方面需要引入多层防护思路,包括年龄匹配内容、实时干预机制、以及对儿童隐私的明确告知与限制。当 AI 承担陪伴角色时,如何在维持互动亲密性的同时设立清晰边界,仍是行业需要持续面对的问题。

△ Fuzozo 芙崽(左上):面向 Z 世代的 AI 养成系潮玩

△ Luka AI Cube(右上):灵宇宙小方机,儿童 AI 学伴

△ Lgenie (左下):小匠宠物陪伴小车 & 四足桌面机器人

△ 海马爸比(右下): AI 智能婴儿看护器

在产品演示环节,Diana Zhu 博士主持发布了 Choochoo AI 教育机器人。她提到,Choochoo 能够实现流畅的视觉与动作反馈,核心在于集成了 RiseLink 的高集成度 SoC 方案。该芯片在单颗硅片上整合了 Wi-Fi 连接、音视频处理与 AI 加速引擎,使得开发者能够绕过复杂的底层硬件调优,直接在 R2 套件上通过简单的 API 调用,实现原本需要高性能服务器才能支撑的「视觉-语言-动作」协同。

△ 发言嘉宾:Diana Zhu 博士,RiseLink 美国负责人

作为首款由 RiseLink 芯片与 Agora 对话式 AI 引擎深度驱动的教育机器人,Choochoo 不仅能听懂孩子的提问,更能通过视觉传感器「看」到周围的环境与孩子的动作,并做出相应的物理反馈。

△ Choochoo / 延伸阅读:对话式 AI 升级,不仅能看还能动

值得一提的是,作为 R2 全场景 AI 机器人开发套件标杆案例,陆吾智能旗下的桌面机器人「陆卡卡」也同步亮相。现场,陆卡卡展示了如何在紧凑的形态下实现高频、低延迟的 AI 交互。

△ 陆卡卡 / 延伸阅读:桌宠陆卡卡,一只「兵蚁」从二次元走进现实

在两款极具代表性的具身智能产品身上,我们看到,当 AI 拥有了强大的「大脑」(大模型)与灵敏的「身体」后,交互的边界已彻底被打破。两款产品的发布,共同定义了 AI 硬件的新高度,同时也标志着基于 Agora 与 RiseLink 合作的 AI 方案已经完全成熟。

在快闪分享环节,Joey Jiang 分享了打造 AI 原生硬件的最短路径,强调了模块化硬件对快速实现概念落地的意义。他指出,AI 原生硬件的开发不应再遵循「从零打样」的旧逻辑。通过 Seeed Studio 提供的模块化感知节点(如传感器、视觉模块)与 RiseLink 方案的即插即用式结合,硬件原型的验证周期可以从数月缩短至几周。这种「搭积木」式的开发模式,正是初创团队在 Physical AI 浪潮中抢占市场窗口期的最短路径。


△ 发言嘉宾:Joey Jiang,Seeed Studio 销售副总裁

Kim Jin 分享了打造糯宝 AI 机器人的背后故事。在研发背后,团队耗费大量精力对用户意图的深度理解。通过多模态感知,敏锐地捕捉视觉、触觉与语音背后的感性信息,实现拟人化的回复。这种交互不只是指令的执行,而是基于对用户意图的精准洞察,让机器人产生真实的「情感共鸣」。这标志着 Physical AI 真正跨越了工具属性,进化为懂得用户灵魂的情感伴侣。

△ Pophie (机器灵动) 产品负责人 Kim Jin

△ Maxevis(左):迈威儿童拍学机

△ Pophie 糯宝(右):桌面级情感陪伴机器人

隐私、授权与信任:环境式 AI 的底线

随着环境式 AI(Ambient AI)走向「始终在线」,隐私与信任已不再是合规问题,而是产品体验本身。用户真正担心的并非模型出错,而是设备在「不被察觉的情况下」收集和使用数据。

△ Panel:When AI Is Everywhere: Redefining Data Privacy, Consent, and Trust

圆桌主持人:Ramana Kapavarapu,Agora 首席信息安全官 (CISO) & IT 运营负责人(中)

圆桌嘉宾:(自左向右)

  • Diana Zhu 博士,RiseLink 美国负责人
  • Joe Tham,Ellie 海马爸比联合创始人
  • Gibran Mourani,MiniMax 全球客户经理
  • 卜峥,Kaamel AI 联合创始人兼 CEO

△ 成立于 2021 年底的 MiniMax 刚刚宣布港股上市,成为从成立到 IPO 用时最短的 AI 公司。大家首先向 MiniMax 的 Gibran Mourani 道贺。

围绕隐私实践,嘉宾们形成了一个明确共识:说到做到、做到可见。

透明性: 相比冗长的隐私条款,产品应在交互层面清晰呈现系统是否在监听、收集了什么数据,以及用户如何即时控制这些行为。透明性体现在硬件指示、软件状态和使用流程中,比如用物理指示灯直观地告诉用户系统是否在监听。

边缘保护: 通过边缘计算最小化数据流动,让原始语音和视觉数据停留在本地,是保护隐私的最有效路径。对多数场景而言,无需上传云端、本地处理并仅传递必要信号,既有助于隐私保护,也降低了系统暴露面。

响应机制: 谈及安全事件响应,需要成熟、结构化的应对机制,而非临时决策。快速隔离、明确影响、及时修复与复盘改进,比短期业务考量更重要。过往大型数据泄露案例反复证明,延迟或回避只会放大长期损失。

真正可规模化的信任,来自硬件与软件的一致设计以及可实时验证的控制能力。认证和合规是基础,但只有当系统行为与承诺持续一致,用户对「无处不在的 AI」才会产生长期接受度。

△ 活动现场

AI 具身化不可挡!

纵观整场活动,我们可以从三个层面理解这场关于 Physical AI 的深刻变革:

技术本质: 从「挂载」到「具身」。 AI 不再是硬件外挂的一个功能,而是通过专用芯片和实时通讯协议,深度融合进硬件的神经系统。

交互范式: 从「指令」到「共生」。 当 AI 能够理解语境、感知情绪并拥有长期记忆,它就从一个「好用的工具」进化为一个「理解你的物种」。对话不再是手段,而是其存在的形式。

商业本质: 从「买断」到「订阅」。 物理 AI 的核心价值在于其随时间不断进化的能力。厂商卖出的不再是零件,而是长期的服务与情感陪伴。

在 Agora 和 Riselink 两家公司和来自人工智能、芯片和硬件、AI 算法,以及数字健康、家居安防、AI 陪伴和教育等领域的数十家 AI 软硬件企业代表和顶尖专家的背书下,AI 将跳出单纯的数字世界,开始在物理世界中,真正长出它的身体。■

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

模力工场新鲜事

  • 模力工场作为官方生态合作伙伴,诚邀您共赴产业前沿盛会——「逐梦 AI ·天使筑基」2026 中关村早期投资论坛暨 AI 新场景产业创新大会。本次大会汇聚政策、资本与产业领袖,深度聚焦机器人、智能体、大模型应用等前沿赛道,共同把脉 AI 趋势、破解落地难题,为您提供决策的一手洞察。1 月 28 日,北京中关村,期待与您共筑未来!

029 周榜单总介绍

模力工场第 029 周 AI 应用榜来袭!本周共有 23 款应用上架,我们从榜单中精选出十款代表性应用与大家分享。本期榜单应用多为近期热门或美国 CES 参展应用,整体呈现“软硬结合、多领域并进”的特点,涵盖大模型应用、智能硬件、生活方式工具及 AI 基础设施等多个方向。从中可以看出,当前 AI 应用正朝着更实用、更集成、更富交互感的方向演进,硬件创新与场景化服务正成为推动 AI 走向普及的关键动力。以下为本周精选的十款应用简介:

  • GLM-Image(智谱 AI): 图像设计、AI Infra 类,开源图像生成模型

  • 千问App: AI 搜索问答、生活方式类, 阿里最强模型官方 AI 助手

  • 雷鸟 AI 眼镜(RayNeo): AI 硬件类,想象万千,终于一见

  • 影目 GO3 (IMMO): AI 硬件类,AI 眼镜美学标杆

  • Lynx Ring(云康宝): AI 硬件类,小巧智能戒指,24 小时健康监测随身管理

  • Bonjour 数字名片: 生活方式类,Bonjour!创意工作者的 Portfolio

  • 智元机器人 AgiBot A2: AI 硬件类,业内首个规模化商用的全尺寸人形机器人

  • Loona(可以科技): AI 硬件类,具备情感反馈的家庭 AI 宠物陪伴机器人

  • 蓝耘星河: AI Infra、新媒体创作、营销增长类,蓝耘星河以智能,驱动增长

  • Tunee: AI Agent、音频语音、视频多媒体类,Tunee!The smartest AI music agent.

本周必试应用

应用名称:GLM-Image(智谱 AI)

关键词:开源图像生成模型 | 复杂视觉文本生成 | 长文本渲染

模力小 A 推荐:GLM-Image 在中文长文本准确性与小字脚注生成上表现突出,尤其适合法律文书、产品说明等对文字保真度要求极高的场景。此外,其价格仅为 Nano Banana Pro 的一半左右,性价比显著。

上榜冷门但有趣的应用

应用名称:千问App

关键词:阿里官方出品|多场景智能问答|搜索增强|生活助手

模力小 A 推荐:如果说之前的千问还是一位“聊天伙伴”,那么现在的它,已经进化成了能真正帮你“办事”的智能管家。随着 1 月 15 日新版本的发布,千问 App 全面接入了淘宝、支付宝、高德等阿里核心生态,这意味着你可以直接通过和千问对话完成点外卖、买机票、订酒店等一系列操作。

本周上榜应用趋势解读

本周的 AI 趋势呈现出清晰的双线演进:软件正变得更深、更实用,而硬件则在变得更轻、更自然。

软件:从“能说会道”到“能干实事”

近期两个标志性进展值得关注。其一,GLM-Image 登顶 Hugging Face 榜单,证明了国产模型能在专业场景(如法律文书、产品说明)中精准生成文本和图像,同时还具备显著的成本优势,让专业级 AI 工具变得触手可及。其二,千问 App 全面接入阿里生态,意味着 AI 已从单纯的“问答对话”进阶到“办事调度”阶段——用户可以通过自然对话直接完成点外卖、订机票等操作。AI 正从一个聊天对象,转变为串联现实服务的智能中枢。

硬件:从“技术秀场”到“场景适配”

从 CES 的趋势来看,AI 硬件近期正在褪去“极客玩具”的标签,转向更务实的设计哲学:不刻意刷存在感,但需要时总在身边。

  • 入口更轻了:新一代 AR 眼镜(如雷鸟、影目)不再追求取代手机,而是通过更轻巧的设计,专注做好“信息提示”“即时导航”这类“抬头即用”的场景,成为生活中的“第二块屏幕”。类似地,像 Loona DeskMate 这样的产品,让用户闲置的旧手机成为桌面机器人的“面孔”,以几乎零成本的方式,把熟悉的设备变成了桌面上可互动、可陪伴的 AI 伙伴。

  • 陪伴更久了:以智能戒指为代表的健康设备,正变得像首饰一样无感佩戴。竞争的关键不再是“能测多少项”,而是能否让用户愿意长期佩戴,从而获得持续、有价值的健康数据。同样,人形机器人(如智元 AgiBot A2)也迈入了新阶段:能量产了。接下来的核心问题,是它能在工厂、商场等具体场景中解决什么实际工作,创造什么经济价值。

  • 表达更活了:AI 也开始赋能个人形象展示。像 Bonjour 数字名片这样的工具,让个人主页从静态的“电子名片”变成了可动态展示作品、风格乃至个性的“互动橱窗”,帮助用户在社交与职场中更生动地呈现自己。

整体而言,当前 AI 的发展更加注重与真实场景、既有习惯的衔接。无论是软件的能力延伸,还是硬件的形态演进,都体现出同一种思路:在用户需要时提供恰到好处的支持,而非刻意强调技术本身的存在。或许只有当技术彻底融入行为日常,才是其真正成熟的标志。

最后再介绍一下模力工场的上榜机制和加入榜单的参与方式,欢迎大家继续积极参与提交 AI 应用:

模力工场 AI 应用榜并非依靠“点赞刷榜”,而是参考以下权重维度:

  • 评论数(核心指标,代表社区真实反馈)

  • 收藏与点赞(次级指标)

  • 推荐人贡献(注册推荐人可直接为好应用打 Call)

加入榜单的参与方式:

  • 如果你是开发者:上传你的 AI 应用,描述使用场景与核心亮点;

  • 如果你是推荐人:发现好工具,发布推荐理由;

  • 如果你是用户:关注榜单,评论互动,影响榜单权重,贡献真实声音。

One More Thing,对于所有在模力工场上发布的 AI 应用,极客邦科技会借助旗下各品牌资源进行传播,短时间内触达千万级技术决策者与开发者、AI 用户:

  • InfoQ 全媒体矩阵

  • AI 前线全媒体矩阵

  • 极客时间全媒体矩阵

  • TGO 鲲鹏会全媒体矩阵

  • 霍太稳视频号

模力工场新鲜事

  • 模力工场将亮相 OceanBase 社区嘉年华!诚邀您加入我们的上海现场展位。作为 OceanBase 合作的创新社区,模力工场将于 1 月 31 日 登陆上海社区嘉年华,并拥有专属展位。这不仅是一次技术交流——我们更希望和您一起,在现场用 AI Coding 展现创造力、在开放麦分享您的项目故事、与行业先锋面对面切磋、在开源市集交换灵感。我们为您预留了专属席位,期待与您共同呈现:当开源精神遇上 AI 创造力,能碰撞出多少令人惊艳的可能。立即报名,锁定与数百位技术同行深度连接的一天!

028 周榜单总介绍

模力工场第 028 周 AI 应用榜来啦!本周上榜的应用大多来自美国 CES 展及阿里云通义智能硬件展,从优必选的集群物流调度系统到银河通用的零样本抓取机器人,从众擎的拟人步态双足机器人到 Walulu 的情感陪伴毛绒玩具——这些应用共同见证了一场时代风暴:AI 硬件正在集体跨越“工具”属性,进化为真正的“智能体”。它们不再是被动响应指令的机械装置,而是具备了理解环境、自主规划、闭环执行乃至情感交互能力的“数字生命体”。这场从“功能叠加”到“语音助手”再到“智能体化”的范式革命,正同时重塑生产力与生产关系:在工业场景成为可靠的“数字员工”,在消费领域则成为可建立羁绊的“数字伙伴”,标志着人机协同进入了全新的历史阶段。

  • OiiOii: 一款面向创作者与普通用户的 AI 互动式内容生成应用,通过自然语言或轻量交互,快速生成有趣、可分享的内容。

  • 云深处巡检机器人: 专注于工业复杂环境的自主巡检解决方案。其四足机器人具备强运动与感知能力,可在无网络支持下独立完成巡检任务并安全返回,已在电力、能源等领域实现落地应用。

  • 优必选(UBTECH)搬运/物流机器人: 提供从智能搬运机器人到集群调度系统的软硬件一体化智慧物流方案,帮助企业实现仓储搬运环节的自动化升级与效率提升。

  • 众擎机器人: 聚焦高动态双足人形机器人的研发,致力于突破拟人步态与平衡控制技术,为未来机器人在人类环境中的通用移动能力提供底层支撑。

  • walulu 📍成都: 一款具备情感交互与离线记忆能力的 AI 智能毛绒玩具,通过多模态交互设计,为用户提供个性化、可长期互动的陪伴体验。

  • 银河通用机器人: 研发面向仓储、零售等场景的通用移动操作机器人,具备视觉识别与自主抓取能力,可在动态环境中完成物品拣选、搬运等任务。

  • 千寻智能Spirit AI: 从事通用人形机器人系统研发,整合高性能硬件平台与 AI 算法栈,探索机器人在多场景下的感知、决策与执行能力。

本周必试应用

应用名称:OiiOii

关键词:全流程托管|零门槛动画|AI 协同创作

模力小 A 推荐:通过七个 AI 智能体(导演、编剧、美术等)分工协作,将你的文字想法自动转化为包含分镜、角色与场景的动画视频,大幅降低了专业动画内容的制作门槛。

上榜冷门但有趣的应用

应用名称:walulu

关键词:AI 硬件|可成长陪伴|离线记忆

模力小 A 推荐:一款结合了情感计算模型的智能玩具。它能够记住与你的互动,并做出个性化的反应,提供一种注重私密性与持续性的陪伴体验。

本周上榜应用趋势解读

AI 正在从虚拟世界走向物理世界,为自己寻找真实的“身体”。本周模力工场榜单上的应用清晰地展示了这一趋势——AI 不再是停留在软件层面的算法,更是成为驱动各类硬件的“大脑”。这次上榜的八大应用,集中体现了 AI 硬件在两大关键赛道的爆发:工业效率革命与情感陪伴需求。

在工业领域,AI 机器人正从简单的机械臂进化为真正的“智能员工”。云深处的巡检机器狗能够在无网络环境的复杂场景中自主完成巡检任务,实现了从“自动化”到“自主化”的跨越;优必选的智慧物流方案已超越单台设备,提供机器人群调度与仓储管理系统深度集成的整套解决方案;银河通用的物流机器人则实现了“零样本抓取”能力,即使面对全新商品也能准确识别搬运。这些进展表明,工业机器人正从实验室原型走向工程化落地,其核心价值在于可量化的投资回报。

在消费领域,情感陪伴型机器人正开辟全新市场。Walulu 的 AI 毛绒宠物通过情感模型与离线记忆技术,创造出能随互动成长的“伙伴关系”,本质是在贩卖情感价值而非功能价值。这反映了 AI 正从解决效率问题,转向满足更深层的心理需求。未来,能否建立稳定、专属的“数字亲密关系”,或将成为此类产品发展的关键。

特别值得关注的是众擎的人形机器人——虽然步态尚显蹒跚,但其对双足行走、自然步态的追求,瞄准的是机器人无缝进入人类环境的终极目标。这种对“通用形态”的前瞻布局,代表着产业在为更广阔的未来场景做技术储备。

除了实体硬件产品,OiiOii 这款 AI 动画创作应用近期也备受瞩目。其“全流程托管模式”尤为亮眼——平台将传统动画制作中的艺术总监、编剧、分镜师、角色设计师、场景设计师、动画师、音效总监等七个核心角色,分别由七个 AI 智能体担任。这些智能体不仅形象亲切可爱,更如导师般指引用户一步步完成创作。用户只需输入创意想法,并在关键节点进行确认,即可产出完整动画作品。这极大降低了创作门槛,让普通用户也能轻松上手动画制作。

综上,AI 硬件已越过“加个语音模块”的简单升级阶段,进入以智能体化为特征的第三阶段。产业不再满足于制造“能联网的工具”,而是致力于创造“能自主行动的数字生命体”。从工业现场到家庭空间,AI 正在改写生产力与生产关系的定义——在工厂成为可靠的数字员工,在生活场景成为温暖的数字伙伴。当 AI 真正获得在物理世界中感知、决策和执行的能力,人机协同或将进入一个前所未有的新纪元。

模力工场新鲜事

  • 模力工场将亮相 OceanBase 社区嘉年华!诚邀您加入我们的上海现场展位。作为 OceanBase 合作的创新社区,模力工场将于 1 月 31 日 登陆上海社区嘉年华,并拥有专属展位。这不仅是一次技术交流——我们更希望和您一起,在现场用 AI Coding 展现创造力、在开放麦分享您的项目故事、与行业先锋面对面切磋、在开源市集交换灵感。我们为您预留了专属席位,期待与您共同呈现:当开源精神遇上 AI 创造力,能碰撞出多少令人惊艳的可能。立即报名,锁定与数百位技术同行深度连接的一天!

028 周榜单总介绍

模力工场第 028 周 AI 应用榜来啦!本周上榜的应用大多来自美国 CES 展及阿里云通义智能硬件展,从优必选的集群物流调度系统到银河通用的零样本抓取机器人,从众擎的拟人步态双足机器人到 Walulu 的情感陪伴毛绒玩具——这些应用共同见证了一场时代风暴:AI 硬件正在集体跨越“工具”属性,进化为真正的“智能体”。它们不再是被动响应指令的机械装置,而是具备了理解环境、自主规划、闭环执行乃至情感交互能力的“数字生命体”。这场从“功能叠加”到“语音助手”再到“智能体化”的范式革命,正同时重塑生产力与生产关系:在工业场景成为可靠的“数字员工”,在消费领域则成为可建立羁绊的“数字伙伴”,标志着人机协同进入了全新的历史阶段。

  • OiiOii: 一款面向创作者与普通用户的 AI 互动式内容生成应用,通过自然语言或轻量交互,快速生成有趣、可分享的内容。

  • 云深处巡检机器人: 专注于工业复杂环境的自主巡检解决方案。其四足机器人具备强运动与感知能力,可在无网络支持下独立完成巡检任务并安全返回,已在电力、能源等领域实现落地应用。

  • 优必选(UBTECH)搬运/物流机器人: 提供从智能搬运机器人到集群调度系统的软硬件一体化智慧物流方案,帮助企业实现仓储搬运环节的自动化升级与效率提升。

  • 众擎机器人: 聚焦高动态双足人形机器人的研发,致力于突破拟人步态与平衡控制技术,为未来机器人在人类环境中的通用移动能力提供底层支撑。

  • walulu 📍成都: 一款具备情感交互与离线记忆能力的 AI 智能毛绒玩具,通过多模态交互设计,为用户提供个性化、可长期互动的陪伴体验。

  • 银河通用机器人: 研发面向仓储、零售等场景的通用移动操作机器人,具备视觉识别与自主抓取能力,可在动态环境中完成物品拣选、搬运等任务。

  • 千寻智能Spirit AI: 从事通用人形机器人系统研发,整合高性能硬件平台与 AI 算法栈,探索机器人在多场景下的感知、决策与执行能力。

本周必试应用

应用名称:OiiOii

关键词:全流程托管|零门槛动画|AI 协同创作

模力小 A 推荐:通过七个 AI 智能体(导演、编剧、美术等)分工协作,将你的文字想法自动转化为包含分镜、角色与场景的动画视频,大幅降低了专业动画内容的制作门槛。

上榜冷门但有趣的应用

应用名称:walulu

关键词:AI 硬件|可成长陪伴|离线记忆

模力小 A 推荐:一款结合了情感计算模型的智能玩具。它能够记住与你的互动,并做出个性化的反应,提供一种注重私密性与持续性的陪伴体验。

本周上榜应用趋势解读

AI 正在从虚拟世界走向物理世界,为自己寻找真实的“身体”。本周模力工场榜单上的应用清晰地展示了这一趋势——AI 不再是停留在软件层面的算法,更是成为驱动各类硬件的“大脑”。这次上榜的八大应用,集中体现了 AI 硬件在两大关键赛道的爆发:工业效率革命与情感陪伴需求。

在工业领域,AI 机器人正从简单的机械臂进化为真正的“智能员工”。云深处的巡检机器狗能够在无网络环境的复杂场景中自主完成巡检任务,实现了从“自动化”到“自主化”的跨越;优必选的智慧物流方案已超越单台设备,提供机器人群调度与仓储管理系统深度集成的整套解决方案;银河通用的物流机器人则实现了“零样本抓取”能力,即使面对全新商品也能准确识别搬运。这些进展表明,工业机器人正从实验室原型走向工程化落地,其核心价值在于可量化的投资回报。

在消费领域,情感陪伴型机器人正开辟全新市场。Walulu 的 AI 毛绒宠物通过情感模型与离线记忆技术,创造出能随互动成长的“伙伴关系”,本质是在贩卖情感价值而非功能价值。这反映了 AI 正从解决效率问题,转向满足更深层的心理需求。未来,能否建立稳定、专属的“数字亲密关系”,或将成为此类产品发展的关键。

特别值得关注的是众擎的人形机器人——虽然步态尚显蹒跚,但其对双足行走、自然步态的追求,瞄准的是机器人无缝进入人类环境的终极目标。这种对“通用形态”的前瞻布局,代表着产业在为更广阔的未来场景做技术储备。

除了实体硬件产品,OiiOii 这款 AI 动画创作应用近期也备受瞩目。其“全流程托管模式”尤为亮眼——平台将传统动画制作中的艺术总监、编剧、分镜师、角色设计师、场景设计师、动画师、音效总监等七个核心角色,分别由七个 AI 智能体担任。这些智能体不仅形象亲切可爱,更如导师般指引用户一步步完成创作。用户只需输入创意想法,并在关键节点进行确认,即可产出完整动画作品。这极大降低了创作门槛,让普通用户也能轻松上手动画制作。

综上,AI 硬件已越过“加个语音模块”的简单升级阶段,进入以智能体化为特征的第三阶段。产业不再满足于制造“能联网的工具”,而是致力于创造“能自主行动的数字生命体”。从工业现场到家庭空间,AI 正在改写生产力与生产关系的定义——在工厂成为可靠的数字员工,在生活场景成为温暖的数字伙伴。当 AI 真正获得在物理世界中感知、决策和执行的能力,人机协同或将进入一个前所未有的新纪元。

今年的 CES,中国硬件又一次成为主角。活跃在拉斯维加斯展台上的诸多出海产品,背后依托的是深圳的研发效率与供应链能力,而其智能化核心,则越来越多建立在以 Qwen 为代表的多模态、全尺寸的大模型基础上。

与沙漠赌城的 CES 同期,在深圳蛇口,阿里云也举办了一场智能硬件展。这场展会面向公众免费开放,选址于本地居民日常散步、观海和看展的滨海文化地标,却意外成为 AI 硬件从实验室走向真实市场的缩影。1000 余款智能硬件在这里集中亮相,其中超过 200 款与 CES 同款甚至首发。这里既有来自北京、杭州的创新团队,也有来自义乌、华强北等产业带的制造与渠道力量——他们对技术趋势的嗅觉,向来快过任何市场报告。

技术验证与市场反馈在同一空间同时发生。在这里你可以听到合作方直接询价“多少钱,做 OEM 吗,能做多少套”,也可以看到消费者直接下单,把 399 元的 AI 玩具带回家。许多普通家庭第一次在这里集中体验到能对话的毛绒玩具、教用户跳舞的镜子、能翻跟头的机器狗,和具备实时提醒能力的 AI 眼镜。

早在 2024 年云栖大会上,阿里云董事长吴泳铭就明确指出,未来 AI 最大的想象力会来自于物理世界:“我们不能只停留在移动互联网时代去看未来,深层次 AI 最大的想象力绝对不是在手机屏幕上做一两个超级 APP,而是接管数字世界,改变物理世界。”

但在这轮 AI 硬件浪潮中,阿里云没有选择去做终端硬件的制造者,而是以软硬一体的融合理念,向产业提供底层模型能力、云基础设施与生态支持。

数据显示,通义大模型的多模态能力已深度赋能超过 15 万家智能硬件厂商。

从雷鸟的 AI 眼镜、听力熊的儿童 AI Pin,到优必选机器人、趣丸科技的生成式 AI 吉他,这些走进全球家庭的产品背后,都能看到以通义为代表的阿里云基础设施的支撑。而它们从概念到量产、从深圳到世界的惊人速度,也再次印证了深圳这座“硬件硅谷”在研发、供应链与商业化效率上的独特优势。

For everyone, by everyone 的 AI 硬件

逛完阿里云通义智能硬件展,一个强烈的感受是,这是我经历过为数不多,能让普通人玩得开心、让创业者看到机会、让厂商验证商业模式,同时清晰传递主办方战略意图的展会。

阿里云租下深圳海上世界文化艺术中心三层空间,用一种近乎“生活化”的方式,向公众展示:AI 能长在玩具里、眼镜上、健身镜中,甚至成为家庭一员的日常存在。向企业展示:你能快速依托阿里云的生态,快速做出能进入全球家庭的产品。

展会围绕两条主线展开:一是呈现阿里云的底层能力,二是展示其赋能下的千款智能硬件成果。

一楼以“智能中枢”为核心,展示通义大模型的能力:观众上传一张照片,就能生成一段短视频;走过一段互动迷宫,便能直观感受多模态 AI 如何理解图像、语音和动作。

智能中枢周围环绕着“创造有 AI”“生活有 AI”“AI 实训营”等主题区,OPPO、理想、影石等品牌在此展示手机、智能座舱和 AI 影像设备,而像趣丸科技的 AI 吉他、Looki 这样的新奇产品,则让人看到 AI 如何重塑音乐、娱乐等日常互动。

趣丸科技与阿里云合作推出的全球首款生成式 AI 吉他 TemPolor Melo-D,在通义大模型的支持下,重新定义了人与音乐的交互方式,提供了个性化的 AI 音乐创作体验。

三楼聚焦陪伴、健康与安防,专设义乌厂商展区;四楼覆盖家居、教育、健身等提效场景,华强北的硬件老板们也把“一米柜台”搬到了现场。

通义联合听力熊为青少年定制随身 AI 对话智能体,打造国内首款儿童 “AI Pin” Mooni M1,提供多种角色选择。经过通义千问大模型加持,用户的 AI 使用时长提升 40 分钟。

阿里云想让大家知道,AI 有能力在所有场景里带来更好的体验。它同时也呈现出一种可能——不管是软件应用还是硬件产品,每个人都可以在这个时代搭建些什么。

阿里云 AI 实训营的 Agent 硬件搭建小课堂

对于普通人来说,硬件展是一个游戏体验。孩子和 AI 毛绒玩具对话,年轻人跟着镜子学舞,有人让 AI 解读运势、推荐香水,还有中学生在阿里云 AI 实训营中搭建了自己的第一个交互硬件。我们这代人仍然处于有“AI 硬件”概念的时期,而对于下一代人来说,可能已经不存在“AI 硬件”。当生活总所有一切都有 AI,AI 之于人,阿里云之于硬件和应用产品,就是水之于人的存在。

对创业者和企业主而言,展会成了高效的信息源。有用户的直接提问和反馈,也有工程师在展位前递上简历。采购顾问带着非洲、拉美的客户穿梭其间,现场询价、谈订单。

TCL、影石、安克创新的案例,更是为想要入局 AI 硬件和出海的企业打气——依托阿里云全球全栈 AI 基础设施,大型制造企业可实现研发、服务、出海一体化,新锐品牌也能快速站稳全球舞台。

刚在 CES 获得 Best of Innovation 奖项的影石,依托 Qwen-VL 实现视频与图片的分类打标和场景识别,结合 Qwen-Plus 生成剪辑脚本,赋能全球百万视频创作者。

安克创新依托阿里云“全球一张网”,实现跨境资源调度与合规部署,核心系统互访提速 30%,并将 Qwen 与 Wan 深度融入语音助手、多模态交互等产品功能。

TCL 则基于通义大模型打造了半导体显示专家系统 X-Intelligence,支撑其全球研发体系。

同时,阿里云把义乌、华强市场这些产品背后的“制造和分发网络”呈现在大家面前。在他们的摊位上,你可以看到很多产品尽管“粗糙”,却仍然有市场。在很多欠发达国家,AI 硬件需要的不是精致,而是先以成本最低的方法被用上。很多义乌玩具、小 3C 产品的批发商,嗅到 AI 风潮后,已经在深圳有了自己的硬件工厂。华强科技生态园等孵化器,也开始重点招募 AI 硬件的创业公司。

正如阿里云智能集团通义大模型业务总经理徐栋所说:“这样一个平台(以通义多模态交互开发套件为代表的 AI 硬件赋能平台)是我们非常重要的业务的选择,我们需要更多贴近阿里云的智能硬件开发伙伴。很多场景是碎片化的,只有做更贴近实际的生产环节、消费环节,每个人对 AI 硬件的体验才能更深。

AI 硬件,正在成为 for everyone, by everyone 的日常现实。而阿里云的角色,不是站在台前造产品,而是站在幕后,让创新更快实现。

阿里云,在 AI 硬件变革前夜

AI 硬件从极客圈层走向大众日常,标志着市场已从“启蒙期”进入“挑剔期”。当用户开始为 AI 服务付费、并将设备融入日常生活,产品的成败就不再取决于功能数量,而在于能否持续兑现可感知的价值——这要求厂商必须拥有一套覆盖模型、工程、服务与生态的系统性能力。

AI 硬件,特别是在消费级市场,正经历着一场根本性的转型。从传统的联网设备到如今的“端侧智能体”,AI 不再只是硬件的附加功能,而是直接决定产品核心价值的引擎。这一转变的核心标志在于:AI 不再作为附加功能嵌入硬件,而是成为产品定义、体验构建与价值交付的底层引擎。

早期智能硬件以“连接+控制”为基本范式,其智能化主要体现在远程操作与数据回传;而新一代 AI 硬件则要求设备具备持续感知、上下文理解、自主决策与协同执行的能力,成为一个能在真实场景中与用户形成闭环互动的“智能体”。

这一转变正在重塑硬件的设计逻辑、用户的价值预期与厂商的技术路径。

用对 AI 硬件的认知早已超越“新奇感”,转而关注端到端体验是否流畅、可靠、有用。更重要的是,用户开始愿意为持续服务付费。例如按月订阅儿童 AI 陪伴内容,或为高级健身指导功能续费。这催生了“硬件+服务”的新商业模式,但也带来新挑战,如果 AI 不能提供可感知的显性价值,订阅就难以为继。

技术架构也随之重构。端云协同的逻辑发生了变化。之前的端云协同更多指向算力分工,即端上承载不了的算力放在云上,但现在的端云协同是指能力互补。安全、延时、功耗的问题必须在端上解决,而生态打通这些能力可能在云上做。同时,交互方式正走向“无感化”——不是让用户察觉不到 AI 存在,而是让使用门槛足够低,无需学习就能自然融入原有生活节奏。

然而,对大多数硬件厂商而言,这场转型并不轻松。模型迭代速度远超硬件研发周期,而一个产品往往需要组合多个模型才能实现完整功能,集成复杂度陡增。与此同时,Agent 架构、工具链和工程平台快速演进,传统硬件团队难以跟上软件层的节奏。更棘手的是,许多厂商擅长制造和渠道,却缺乏用户运营、数据闭环和订阅服务能力,难以构建可持续的商业模型。

面对这些系统性挑战,阿里云提供了 AI 硬件的全链路支持体系。

在基础设施层面,阿里云面向 AI 应用场景全面升级计算、存储与网络能力,为高并发、低延迟的智能硬件业务提供稳定底座。

在模型层面,通义大模型家族(包括 Qwen3、Qwen-VL、QwQ 等)全面开源,并提供闭源高阶版本,同时接入第三方优质模型,帮助厂商一站式、低成本调用全球先进 AI 能力。针对多模态交互场景,阿里云还推出专有优化模型,降低端到端语音和视频交互时延。

阿里云的模型能力,已经获得顶尖手机、汽车、具身智能、智能配件品牌的认可和验证:

  • 目前,全球 Top 10 手机厂商已都在使用阿里云的大模型能力。例如,OPPO 利用阿里云人工智能平台 PAI 对 Qwen 开源模型进行后训练,以支持其 AI 多场景应用;荣耀则联合阿里云百炼打造 VQA 端到端方案,图片细分场景识别率提升近 40%,延迟降低 30%。荣耀 Magic V5 接入飞猪旅行、高德地图两个垂直 Agent 两个月即斩获百万级用户好评。基于“模型+工程+生态”三位一体的战略,阿里云正持续加速手机行业的 AI 功能创新与规模化落地。

  • 理想汽车基于阿里云 MindGPT 大模型,整合高德、飞猪、支付宝等生态,实现全球首个“车机 AI 扫码支付”;

  • 雷鸟创新联合阿里云推出行业首个面向智能眼镜的 AI 大模型,意图识别准确率达 98%,搭载该模型的雷鸟眼镜出货量领跑 AR 行业。

    • 优必选的萌 UU 陪伴机器人,搭载通义千问与自研情感智能体“点灵”,且具有长期记忆

    特别值得注意的是,阿里云此次还推出了全模态智能交互开发套件,将上述能力封装为标准化工具。该套件适配 30 多款主流 ARM、RISC-V 和 MIPS 架构芯片,覆盖市面上绝大多数终端设备。未来,通义大模型还将与玄铁 RISC-V 实现软硬全链路协同优化,进一步提升在国产芯片上的部署效率与推理性能。

    这套开发套件不仅提供基础能力,还预置十余款 MCP 工具和 Agent,覆盖生活、工作、娱乐、教育等高频场景。例如,基于出行规划 Agent,用户可直接调用路线规划、旅行攻略、本地探索等功能。同时,套件深度集成阿里云百炼平台生态,支持开发者添加社区模板,或通过 A2A 协议兼容第三方 Agent,极大扩展了应用边界。

    无论是 OPPO、理想这样的品牌厂商,还是华强北的创客、义乌的出海团队,甚至“一人公司”,都能借助阿里云的解决方案快速验证想法、打造产品,并参与全球竞争。

    正是阿里云“基础设施先行”的思路,让展会上那些看似天马行空的产品,得以从概念走向量产。

    有趣的是,阿里云大模型能力的升级节奏,与 AI 硬件的集中爆发高度同步。

    2023 年 8 月,阿里云开源 Qwen-VL 视觉语言模型,首次让中小厂商能免费调用工业级多模态能力;2024 年,Qwen-Audio、Qwen2-VL 等模型集中发布,补齐了语音、图像与文本融合交互的关键拼图;到 2025 年初,原生端到端的 Qwen3-Omni 模型的发布,以及 Qwen-Agent,进一步支持硬件端构建任务型智能体。这一连串技术释放,恰好为 AI 硬件创新提供了可落地的底层支撑。

    从 2024 年下半年起,阅读器、眼镜、耳机、学习机等细分品类迎来 AI 功能的规模化落地:文石、闪极、AIxFU、听力熊、云希谷等能纷纷接入阿里云大模型能力。

    这些产品的共同点,是都受益于通义的“全谱系开源”策略——0.5B 到 480B 的模型全覆盖,文本、语音、视觉、视频能力一应俱全。无论是大型企业,还是华强北的硬件作坊,都能找到适合自己的解决方案。

    正是这种低成本接入到快速验证的正向循环,让 AI 硬件从概念走向规模化落地。阿里云没有造 AI 硬件产品,却通过持续开源和能力迭代,成为这场硬件浪潮背后最坚实的推手。

    据台媒《经济日报》及供应链消息透露,OpenAI 正在加速推进其首款个人 AI 硬件设备的研发进程。该项目在公司内部被称为 “Project Gumdrop”,标志着 OpenAI 正正式从纯软件服务向硬件领域跨界。

    目前,该设备仍处于设计阶段,其具体形态尚未最终敲定,但大概率将以 “智能笔” 或 “便携式音频设备” 的形式呈现。

    功能方面,该设备预计将配备麦克风与摄像头,核心卖点是能够让用户直接将手写笔记内容传输至 ChatGPT 进行处理。为了确保全球供应链的稳定性并避开特定地区的制造风险,OpenAI 已决定将代工订单从立讯精密转交给富士康,生产线预计将落地越南或美国。该专案最初计画由立讯代工,现已转向鸿海,主要考量制造地点,OpenAI 不希望新的 AI 装置在中国制造。

    不过此前有报道指出,Project Gumdrop 曾面临软件漏洞、隐私合规以及云端基础设施不完善等技术挑战。

    目前 OpenAI 的目标是在 2026 年或 2027 年正式发布该产品。届时,富士康不仅将负责终端设备的生产,还可能接手 OpenAI 相关的云端基础设施订单,双方的合作将覆盖从算力底座到消费电子的全产业链。而 Foxconn 将负责处理从云端基础设施到终端设备的全面生产。


    📌 转载信息
    原作者:
    BunnHack
    转载时间:
    2026/1/4 18:29:29