标签 千问APP 下的文章

模力工场新鲜事

  • 模力工场作为官方生态合作伙伴,诚邀您共赴产业前沿盛会——「逐梦 AI ·天使筑基」2026 中关村早期投资论坛暨 AI 新场景产业创新大会。本次大会汇聚政策、资本与产业领袖,深度聚焦机器人、智能体、大模型应用等前沿赛道,共同把脉 AI 趋势、破解落地难题,为您提供决策的一手洞察。1 月 28 日,北京中关村,期待与您共筑未来!

029 周榜单总介绍

模力工场第 029 周 AI 应用榜来袭!本周共有 23 款应用上架,我们从榜单中精选出十款代表性应用与大家分享。本期榜单应用多为近期热门或美国 CES 参展应用,整体呈现“软硬结合、多领域并进”的特点,涵盖大模型应用、智能硬件、生活方式工具及 AI 基础设施等多个方向。从中可以看出,当前 AI 应用正朝着更实用、更集成、更富交互感的方向演进,硬件创新与场景化服务正成为推动 AI 走向普及的关键动力。以下为本周精选的十款应用简介:

  • GLM-Image(智谱 AI): 图像设计、AI Infra 类,开源图像生成模型

  • 千问App: AI 搜索问答、生活方式类, 阿里最强模型官方 AI 助手

  • 雷鸟 AI 眼镜(RayNeo): AI 硬件类,想象万千,终于一见

  • 影目 GO3 (IMMO): AI 硬件类,AI 眼镜美学标杆

  • Lynx Ring(云康宝): AI 硬件类,小巧智能戒指,24 小时健康监测随身管理

  • Bonjour 数字名片: 生活方式类,Bonjour!创意工作者的 Portfolio

  • 智元机器人 AgiBot A2: AI 硬件类,业内首个规模化商用的全尺寸人形机器人

  • Loona(可以科技): AI 硬件类,具备情感反馈的家庭 AI 宠物陪伴机器人

  • 蓝耘星河: AI Infra、新媒体创作、营销增长类,蓝耘星河以智能,驱动增长

  • Tunee: AI Agent、音频语音、视频多媒体类,Tunee!The smartest AI music agent.

本周必试应用

应用名称:GLM-Image(智谱 AI)

关键词:开源图像生成模型 | 复杂视觉文本生成 | 长文本渲染

模力小 A 推荐:GLM-Image 在中文长文本准确性与小字脚注生成上表现突出,尤其适合法律文书、产品说明等对文字保真度要求极高的场景。此外,其价格仅为 Nano Banana Pro 的一半左右,性价比显著。

上榜冷门但有趣的应用

应用名称:千问App

关键词:阿里官方出品|多场景智能问答|搜索增强|生活助手

模力小 A 推荐:如果说之前的千问还是一位“聊天伙伴”,那么现在的它,已经进化成了能真正帮你“办事”的智能管家。随着 1 月 15 日新版本的发布,千问 App 全面接入了淘宝、支付宝、高德等阿里核心生态,这意味着你可以直接通过和千问对话完成点外卖、买机票、订酒店等一系列操作。

本周上榜应用趋势解读

本周的 AI 趋势呈现出清晰的双线演进:软件正变得更深、更实用,而硬件则在变得更轻、更自然。

软件:从“能说会道”到“能干实事”

近期两个标志性进展值得关注。其一,GLM-Image 登顶 Hugging Face 榜单,证明了国产模型能在专业场景(如法律文书、产品说明)中精准生成文本和图像,同时还具备显著的成本优势,让专业级 AI 工具变得触手可及。其二,千问 App 全面接入阿里生态,意味着 AI 已从单纯的“问答对话”进阶到“办事调度”阶段——用户可以通过自然对话直接完成点外卖、订机票等操作。AI 正从一个聊天对象,转变为串联现实服务的智能中枢。

硬件:从“技术秀场”到“场景适配”

从 CES 的趋势来看,AI 硬件近期正在褪去“极客玩具”的标签,转向更务实的设计哲学:不刻意刷存在感,但需要时总在身边。

  • 入口更轻了:新一代 AR 眼镜(如雷鸟、影目)不再追求取代手机,而是通过更轻巧的设计,专注做好“信息提示”“即时导航”这类“抬头即用”的场景,成为生活中的“第二块屏幕”。类似地,像 Loona DeskMate 这样的产品,让用户闲置的旧手机成为桌面机器人的“面孔”,以几乎零成本的方式,把熟悉的设备变成了桌面上可互动、可陪伴的 AI 伙伴。

  • 陪伴更久了:以智能戒指为代表的健康设备,正变得像首饰一样无感佩戴。竞争的关键不再是“能测多少项”,而是能否让用户愿意长期佩戴,从而获得持续、有价值的健康数据。同样,人形机器人(如智元 AgiBot A2)也迈入了新阶段:能量产了。接下来的核心问题,是它能在工厂、商场等具体场景中解决什么实际工作,创造什么经济价值。

  • 表达更活了:AI 也开始赋能个人形象展示。像 Bonjour 数字名片这样的工具,让个人主页从静态的“电子名片”变成了可动态展示作品、风格乃至个性的“互动橱窗”,帮助用户在社交与职场中更生动地呈现自己。

整体而言,当前 AI 的发展更加注重与真实场景、既有习惯的衔接。无论是软件的能力延伸,还是硬件的形态演进,都体现出同一种思路:在用户需要时提供恰到好处的支持,而非刻意强调技术本身的存在。或许只有当技术彻底融入行为日常,才是其真正成熟的标志。

最后再介绍一下模力工场的上榜机制和加入榜单的参与方式,欢迎大家继续积极参与提交 AI 应用:

模力工场 AI 应用榜并非依靠“点赞刷榜”,而是参考以下权重维度:

  • 评论数(核心指标,代表社区真实反馈)

  • 收藏与点赞(次级指标)

  • 推荐人贡献(注册推荐人可直接为好应用打 Call)

加入榜单的参与方式:

  • 如果你是开发者:上传你的 AI 应用,描述使用场景与核心亮点;

  • 如果你是推荐人:发现好工具,发布推荐理由;

  • 如果你是用户:关注榜单,评论互动,影响榜单权重,贡献真实声音。

One More Thing,对于所有在模力工场上发布的 AI 应用,极客邦科技会借助旗下各品牌资源进行传播,短时间内触达千万级技术决策者与开发者、AI 用户:

  • InfoQ 全媒体矩阵

  • AI 前线全媒体矩阵

  • 极客时间全媒体矩阵

  • TGO 鲲鹏会全媒体矩阵

  • 霍太稳视频号

2026 年,AI 真正“下地干活”的第一战,被阿里打响了。

1 月 15 日,在杭州阿里园区举行的千问 App 发布会上,阿里巴巴集团总裁吴嘉做了一次并不复杂、却很直观的演示:他用千问给现场嘉宾点了 40 杯“伯牙绝弦”奶茶。整个过程没有人工介入。千问自行匹配附近奶茶店,下单,并调用支付宝完成支付。没一会儿,淘宝闪购的骑手把奶茶送进会场。发布会的气氛,也在这一刻被彻底点燃。

事后,有杭州的网友恍然大悟“怪不得刚刚西溪附近叫不动外卖!”

image

相比 PPT 上的参数和模型指标,这个场景更容易被理解:AI 第一次在公开场合,完整地替人把一件现实中的事情办成了。

在这次更新中,阿里将千问定位成 “每个人的生活助手”。路径也很明确:不从新场景做起,而是直接接入阿里现有的业务体系,让 AI 先把眼前的事干好。

在 日常生活 层面,千问首批接入了 淘宝闪购、支付宝、淘宝、飞猪和高德 五大业务,可以一句话 点外卖、买东西、订机票、订酒店、查路线,这些原本需要在多个 App 之间来回切换的操作,现在可以交给一句话来完成。

image

在 “办事” 这一层,千问的能力被进一步拉长。它开始尝试处理更复杂的任务,比如打电话订餐厅、整理调研资料、处理财务文件、辅助搭建网站等。这类功能目前仍处于定向邀测阶段,

吴嘉在发布会上表示:“AI 在拥有超强大脑之后,正在长出能够触达真实世界的手和脚,在生活中实实在在地替用户‘干活’。 千问的优势在于‘最强的 Qwen 模型’与‘阿里最完整的商业生态’的结合。AI 办事的时代才刚刚开始,我们会持续探索,把千问打造成真正有用的个人 AI 助手。”

自千问上线两个月以来,月度活跃用户已突破 1 亿。 吴嘉认为,随着 AI coding、全模态理解以及超长上下文等关键能力逐步成熟,AI 正在走出手机屏幕,进入更复杂、也更真实的生产与生活场景。

把阿里折叠进千问中, 通过统一的 AI 入口,让千问拥有 400 余项办事能力,在 生活、办公、教育 等方面全场景覆盖,让千问成为 AI 时代的超级应用入口,这正是阿里的野心。

办事之上如何理解需求,才能判断是不是一个合格的助手

伴随着模型能力的跃迁,思考让 Agent 做事,已经是近几年行业的集体共识。但 干的活好不好,这才是能否放心 AI 当助手的关键。

阿里此次的更新方向,既在意料之中,又有些意料之外的惊喜,这个惊喜的落脚点就在于 对需求的理解

在对千问用户数据观察中,用户主动询问商品推荐的月环比高达 300%,这引起了阿里的注意,利用好千问与淘宝的链接,让千问拥有更可用的商品推荐能力,这确实踩中了不少人的真实需求,也成为千问区别其他通用 Agent 的功能独特切入点。

image

这不仅发挥了阿里在电商上的传统优势,也让庞大的商品供给和相对成熟的推荐体系真正被用起来。用户只需一句话,就能完成从商品推荐到下单的完整流程。其背后,是 阿里各业务接口的打通和协同调用,用起来足够顺,也足够省事。

但更令人惊喜的是 对决策层面的关注,这也是 模型深入理解真实需求的表现,如何调用工具做更好的决策,体现了阿里强大的整合能力。

比如,现场展示了要给老人购买一款家庭扫地机,并且家里还养了一只猫,预算在 2000-4000 左右。千问在综合产品的价格与能力之上,还进一步老人的便捷需求与对猫毛的清洁效果,在综合这些复杂的条件后,给出推荐产品与相关理由,这正是大模型方便人类决策的一个虚拟需求感知。

image

在另一个徒步推荐的方案中,千问不仅推荐出行路线,结合天气情况给出建议,还将徒步需要的产品直接发送到了千问界面上,确实让人看到 AI 未来融入世界的真实摸样。

image

不是只做简单的一件事,而是将好多事做好,形成闭环,阿里已经迈出第一步。

笔者能想到的弊端,可能就是如何避免大模型被商家刷的假好评和广告垃圾数据污染,根据错误数据给出错误推荐。

在一个全家人考虑去三亚出行的案例中,千问综合了路线、预算、老人与孩子的需求等,给出了路线选择,并给出三套酒店方案。

image

不过,酒店的均价都在两三千左右,不少人吐槽这恐怕没人住得起,方案不适用,不接地气,这或许是笔者认为的阿里迈出的是“半步”,还需要进一步的地方。

现场还有一个小惊喜是,千问演示现场定饭店的时候,有一段与老板确定需求的打电话环节,从包间大小,价格,有小朋友等需求进行多方拉扯沟通,直到最后,电话结尾说,“我是千问 AI 助手在与你沟通”,大家才恍然大悟,原来是千问的语音功能在完成订酒店的“最后一公里”。

这正是各种多模态打通后,AI 能做到的程度,留给人更多想象空间。

这种好用,同时体现在在对办公需求上,在更专业的场景上,需要更好的交付结果,要求也更难。

千问可以集成各种复杂工具,完成做表格、整理数据、处理报表、汇报 PPT 等各种具体业务。从如何处理资料到最后成品展现,从效果来看,确实还不错。

image

此次,阿里找来了专业人士来验收干活效果,千万财经博主小 Lin 说,亲自下场演示了用千问生成一份《2026 毕业生就业报告》,从信息汇总,消化资料,角度分析,文章演示到 PPT 的生成,千问干了一个完整的活。

不过,如果把千问当做个工作三年内的大学生,来干这些活,效果还是不错的,如果要求更高,可能就是把控 PPT 的内容重点质量,PPT 的设计是否美观。

image

而在教育领域,千问也做出一些精心设计,令人印象深刻的是在各种题目中,除了思路的讲解,还会生成一段动态视频进行图示演说,能随时对话沟通,给出思路和解法,并且多模态展示,这让千问更像一个人一样解决问题。

image

笔者也亲自进行了一个上手测评,一个是用千问点奶茶,还有一个是用千问询问如何落户问题,千问都给出了较为实用的操作结果。

image

总体来看,千问并没有试图一下子把所有事都做好,而是在尝试把复杂的事做得更完整、更贴近人的真实需求。它距离“完全可靠的 AI 助手”还有距离,但已经明显走出了聊天框,开始进入决策和执行的真实环节。而对干活质量的进一步打磨,恐怕正是阿里下一步要发力的方向。

在几家最受关注的 AI 巨头中,字节跳动 选择从系统层切入,通过豆包手机助手借助操作系统能力,去调度第三方应用,与现实世界建立连接;阿里 的路线则更为直接,依托自身已高度成熟的电商、支付、物流、出行等业务体系,将这些能力整体接入千问,形成一个以自有生态为核心的闭环。腾讯 目前尚未对外展示完整方案,但从近期在 Agent 和多模态方向上的密集招聘来看,其下一步布局大概率仍将围绕微信这一超级入口展开。

image

表面上看,Agent 之争比拼的是模型能力,但更深层的竞争,实际上取决于谁能更稳定、更规模化地承接真实世界的复杂需求。

1 月 16 日,支付宝联合千问 App、淘宝闪购、Rokid、大麦、阿里云百炼等伙伴,正式发布 ACT 协议(Agentic Commerce Trust Protocol,智能体商业信任协议)。这是中国首个面向 Agent 商业需求设计的开放技术协议框架,为 AI 与电商、外卖等服务平台的协同打造一套 “通用语言”,让跨终端、跨系统、跨平台的 AI 任务执行,变得更便捷、更高效。

以千问 App 为例,依托 ACT 协议 ,千问 App 成功打通淘宝闪购与支付宝 AI 付:用户只需向千问发出指令 “帮我点杯珍珠奶茶”,千问基于用户地理位置,智能推荐附近符合需求的商品,同步完成比价与优惠券自动核销。

用户仅需点击 “选它”,确认支付宝付款,即可一键完成结账。整个购物流程以对话式、自动化、不跳端的方式推进,千问化身专属 “购物助手”,包办繁琐操作。

当 AI 的能力边界不断拓展,从“聊天对话”延伸至购物付款等“办事时代”,新的问题也随之浮现:AI 操作是否获得用户明确授权?资金交易过程是否足够安全?更换设备或应用后,服务体验能否保持连贯?

ACT 协议的诞生正是为破解这些问题而来。支付宝为其搭建了 “委托授权域”“商业交互域”“支付服务域”“信任服务域” 四大核心基础设施标准,实现 AI 操作全流程可追溯、可验证,让人更放心;支持自动化交易流程,减少不必要的人工干预,提升服务效率;统一多平台服务标准,避免体验的割裂。

与传统付款模式不同,在 ACT 协议的规则框架下,AI 仅承担下单操作的执行角色,付款环节始终由用户主导或自主授权。在保障资金安全的前提下,为用户大幅节省时间成本。而对商家而言,未来接入 AI 原生应用时,只需按照协议标准配置统一接口,即可对接全渠道入口,无需单独进行复杂的 API 开发,大幅降低对接成本。

目前,ACT 协议可使用在 AI 代买、企业自动化采购等多元场景,并提供两种付款模式:一是即时付款,用户与 AI 实时对话,基于推荐列表自主决策,确认后完成付款授权与身份验证,适用于 AI 点外卖、日常购物等高频场景;二是委托授权,用户可提前设定时间窗口、金额上限、商家范围等条件,即便离线无指令,AI 也能自动监测商品动态并完成下单结算,适用于机票、酒店预订等场景。

该协议最大限度遵循兼容性、隐私性、开放性三大原则,全面适配现有商业与支付系统,并将伴随 AI 行业技术发展持续优化。支付宝同时表示,正积极推动更多支付服务商、商家与平台、AI 开发者、智能终端生态厂商加入,共同完善协议内容,共建 AI 商业信任新生态。

随着 AI 原生应用能力的持续升级,“AI 代办” 服务日渐普及,支付作为其中特殊且关键的环节,正成为全球科技企业的布局焦点。此前,OpenAI 联合 Stripe 推出协议以支持 ChatGPT 结账功能;近期,谷歌也发布 AI 购物全流程通用商务协议(Universal Commerce Protocol,简称 UCP),将实现用户在 Gemini 内直接下单。

2026 年,AI 真正“下地干活”的第一战,被阿里打响了。

1 月 15 日,在杭州阿里园区举行的千问 App 发布会上,阿里巴巴集团总裁吴嘉做了一次并不复杂、却很直观的演示:他用千问给现场嘉宾点了 40 杯“伯牙绝弦”奶茶。整个过程没有人工介入。千问自行匹配附近奶茶店,下单,并调用支付宝完成支付。没一会儿,淘宝闪购的骑手把奶茶送进会场。发布会的气氛,也在这一刻被彻底点燃。

事后,有杭州的网友恍然大悟“怪不得刚刚西溪附近叫不动外卖!”

image

相比 PPT 上的参数和模型指标,这个场景更容易被理解:AI 第一次在公开场合,完整地替人把一件现实中的事情办成了。

在这次更新中,阿里将千问定位成 “每个人的生活助手”。路径也很明确:不从新场景做起,而是直接接入阿里现有的业务体系,让 AI 先把眼前的事干好。

在 日常生活 层面,千问首批接入了 淘宝闪购、支付宝、淘宝、飞猪和高德 五大业务,可以一句话 点外卖、买东西、订机票、订酒店、查路线,这些原本需要在多个 App 之间来回切换的操作,现在可以交给一句话来完成。

image

在 “办事” 这一层,千问的能力被进一步拉长。它开始尝试处理更复杂的任务,比如打电话订餐厅、整理调研资料、处理财务文件、辅助搭建网站等。这类功能目前仍处于定向邀测阶段,

吴嘉在发布会上表示:“AI 在拥有超强大脑之后,正在长出能够触达真实世界的手和脚,在生活中实实在在地替用户‘干活’。 千问的优势在于‘最强的 Qwen 模型’与‘阿里最完整的商业生态’的结合。AI 办事的时代才刚刚开始,我们会持续探索,把千问打造成真正有用的个人 AI 助手。”

自千问上线两个月以来,月度活跃用户已突破 1 亿。 吴嘉认为,随着 AI coding、全模态理解以及超长上下文等关键能力逐步成熟,AI 正在走出手机屏幕,进入更复杂、也更真实的生产与生活场景。

把阿里折叠进千问中, 通过统一的 AI 入口,让千问拥有 400 余项办事能力,在 生活、办公、教育 等方面全场景覆盖,让千问成为 AI 时代的超级应用入口,这正是阿里的野心。

办事之上如何理解需求,才能判断是不是一个合格的助手

伴随着模型能力的跃迁,思考让 Agent 做事,已经是近几年行业的集体共识。但 干的活好不好,这才是能否放心 AI 当助手的关键。

阿里此次的更新方向,既在意料之中,又有些意料之外的惊喜,这个惊喜的落脚点就在于 对需求的理解

在对千问用户数据观察中,用户主动询问商品推荐的月环比高达 300%,这引起了阿里的注意,利用好千问与淘宝的链接,让千问拥有更可用的商品推荐能力,这确实踩中了不少人的真实需求,也成为千问区别其他通用 Agent 的功能独特切入点。

image

这不仅发挥了阿里在电商上的传统优势,也让庞大的商品供给和相对成熟的推荐体系真正被用起来。用户只需一句话,就能完成从商品推荐到下单的完整流程。其背后,是 阿里各业务接口的打通和协同调用,用起来足够顺,也足够省事。

但更令人惊喜的是 对决策层面的关注,这也是 模型深入理解真实需求的表现,如何调用工具做更好的决策,体现了阿里强大的整合能力。

比如,现场展示了要给老人购买一款家庭扫地机,并且家里还养了一只猫,预算在 2000-4000 左右。千问在综合产品的价格与能力之上,还进一步老人的便捷需求与对猫毛的清洁效果,在综合这些复杂的条件后,给出推荐产品与相关理由,这正是大模型方便人类决策的一个虚拟需求感知。

image

在另一个徒步推荐的方案中,千问不仅推荐出行路线,结合天气情况给出建议,还将徒步需要的产品直接发送到了千问界面上,确实让人看到 AI 未来融入世界的真实摸样。

image

不是只做简单的一件事,而是将好多事做好,形成闭环,阿里已经迈出第一步。

笔者能想到的弊端,可能就是如何避免大模型被商家刷的假好评和广告垃圾数据污染,根据错误数据给出错误推荐。

在一个全家人考虑去三亚出行的案例中,千问综合了路线、预算、老人与孩子的需求等,给出了路线选择,并给出三套酒店方案。

image

不过,酒店的均价都在两三千左右,不少人吐槽这恐怕没人住得起,方案不适用,不接地气,这或许是笔者认为的阿里迈出的是“半步”,还需要进一步的地方。

现场还有一个小惊喜是,千问演示现场定饭店的时候,有一段与老板确定需求的打电话环节,从包间大小,价格,有小朋友等需求进行多方拉扯沟通,直到最后,电话结尾说,“我是千问 AI 助手在与你沟通”,大家才恍然大悟,原来是千问的语音功能在完成订酒店的“最后一公里”。

这正是各种多模态打通后,AI 能做到的程度,留给人更多想象空间。

这种好用,同时体现在在对办公需求上,在更专业的场景上,需要更好的交付结果,要求也更难。

千问可以集成各种复杂工具,完成做表格、整理数据、处理报表、汇报 PPT 等各种具体业务。从如何处理资料到最后成品展现,从效果来看,确实还不错。

image

此次,阿里找来了专业人士来验收干活效果,千万财经博主小 Lin 说,亲自下场演示了用千问生成一份《2026 毕业生就业报告》,从信息汇总,消化资料,角度分析,文章演示到 PPT 的生成,千问干了一个完整的活。

不过,如果把千问当做个工作三年内的大学生,来干这些活,效果还是不错的,如果要求更高,可能就是把控 PPT 的内容重点质量,PPT 的设计是否美观。

image

而在教育领域,千问也做出一些精心设计,令人印象深刻的是在各种题目中,除了思路的讲解,还会生成一段动态视频进行图示演说,能随时对话沟通,给出思路和解法,并且多模态展示,这让千问更像一个人一样解决问题。

image

笔者也亲自进行了一个上手测评,一个是用千问点奶茶,还有一个是用千问询问如何落户问题,千问都给出了较为实用的操作结果。

image

总体来看,千问并没有试图一下子把所有事都做好,而是在尝试把复杂的事做得更完整、更贴近人的真实需求。它距离“完全可靠的 AI 助手”还有距离,但已经明显走出了聊天框,开始进入决策和执行的真实环节。而对干活质量的进一步打磨,恐怕正是阿里下一步要发力的方向。

在几家最受关注的 AI 巨头中,字节跳动 选择从系统层切入,通过豆包手机助手借助操作系统能力,去调度第三方应用,与现实世界建立连接;阿里 的路线则更为直接,依托自身已高度成熟的电商、支付、物流、出行等业务体系,将这些能力整体接入千问,形成一个以自有生态为核心的闭环。腾讯 目前尚未对外展示完整方案,但从近期在 Agent 和多模态方向上的密集招聘来看,其下一步布局大概率仍将围绕微信这一超级入口展开。

image

表面上看,Agent 之争比拼的是模型能力,但更深层的竞争,实际上取决于谁能更稳定、更规模化地承接真实世界的复杂需求。

刚刚,喝到了千问APP给我点的奶茶

0%
icon展开列表
刚刚,喝到了千问APP给我点的奶茶
今天
img
人脸机器人登上Science Robotics封面:用AI教会仿生人脸机器人「开口说话」
今天
img
实测夸克「千问划词快捷指令」,这7个邪修Prompt,建议收藏
今天
img
已证实!清华姚班陈立杰全职加入OpenAI,保留伯克利教职
今天
img
解锁任意步数文生图,港大&Adobe全新Self-E框架学会自我评估
今天
img
5分钟定制一个AI采购专家:讯飞发布“招采智能体工厂”,重新定义行业开发范式
今天
img
Agent时代,为什么多模态数据湖是必选项?
今天
img
大模型长脑子了?研究发现LLM中层会自发模拟人脑进化
今天
img
性能提升60%,英特尔Ultra3这次带来了巨大提升
01月14日
img
继宇树后,唯一获得三家大厂押注的自变量:具身模型不是把DeepSeek塞进机器人
01月14日
img
Sebastian Raschka 2026预测:Transformer统治依旧,但扩散模型正悄然崛起
01月14日
img
端到端智驾新SOTA | KnowVal:懂法律道德、有价值观的智能驾驶系统
01月14日
img
仅用10天?Anthropic最新智能体Cowork的代码竟然都是Claude写的
01月14日
img
AAAI 2026|AP2O-Coder 让大模型拥有「错题本」,像人类一样按题型高效刷题
01月14日
img
用AI从常规病理切片重建空间蛋白图谱:基于H&E图像的高维蛋白质表达预测
01月14日
img
京东首届AI影视创作大赛启动 最高奖金10万元邀全民共创AI视频
01月14日
img
合合信息多模态文本智能产品“上新”,覆盖AI教育、AI健康、AI Infra多元场景
01月14日
img
500万次围观,1X把「世界模型」真正用在了机器人NEO身上
01月14日
img
跳出「黑盒」,人大刘勇团队最新大语言模型理论与机理综述
01月14日
img
百川开源全球最强医疗大模型M3,「严肃问诊」定义AI医疗新能力
01月14日
img

刚刚,喝到了千问APP给我点的奶茶

2026 一开年,智能体的发展立马进入狂奔状态。

本周二,Anthropic 发布 Cowork 掀起了打工人的革命。它不再像 Claude Code 一样专门面向程序员,而是把大模型与智能体能力推进到电脑桌面上,可以解决大部分人的工作问题。

同一时间,谷歌联合 Walmart 等零售商推出了一项专为智能体购物场景设计的开放标准 —— 通用商务协议(UCP)。此举旨在推动智能体购物全流程的标准化,实现从商品推荐、购买决策到支付结算的无缝衔接。

1 月 15 日上午,千问又前进了一大步,已经准备让智能体全面接管我们的日常生活了。

这一次,千问 App 上线了全新 AI Agent 能力「任务助理」,同时全面打通阿里生态,一次开启了 400 多项新功能,邀请测试与灰度上线已经同步开启,全都是免费可用的。

图片

      千问 C 端事业群总裁吴嘉

国内最强的 AI 模型,与最全的应用生态,现在合而为一了。

现在,你只需要对 AI 说「我要两杯奶茶」,千问就可自动找到相应的店铺,选好你的地址、选好商品、下好订单,你只需要点击最终的支付即可。

图片

如果你想买点什么东西拿不定主意,也可以和千问「任务助理」商量一下,它不仅可以讨论出个符合需求的结果,而且可以直通商店的付款链接。

图片

可以看到,千问能够接入的应用包括淘宝、闪购、飞猪、高德地图和支付宝。如果你有需要,千问还能帮你打电话。在发布会现场,千问就展示了 AI 帮人订餐,看起来餐厅老板没有认出与他交谈的是千问。

图片

除了各种有意思的功能,我们也初步体验到了 AI 智能体带来的交互革命 —— 强大的千问模型,正在把阿里独有的生态优势全部并联起来。不论生活还是工作,以后通行的方法,或许都会被 AI 重新整理一遍。

图片

一手实测  触角已经碰到了物理世界

刚过去的 2025 年被普遍视为智能体元年,智能体在人工智能领域的热度一直没有断过。从 Manus、ChatGPT Agent 到更多国产 Agent 大模型与应用,几乎每一次发布都会引起轰动。

智能体的出现,让大模型从拥有智能「大脑」进化出灵活的「手」和「脚」,对复杂任务的自动分析、拆解、执行能力与日俱增。有了智能体的参与,人们可以从繁冗的流程性工作中解放出来,大大节省了工作量与时间成本。

在全面接入一众阿里生态业务之后,千问 App 上的这个智能体新面孔能带来哪些不一样的东西呢?带着这个疑问,我们在拿到内测资格之后,马上对它来了一次摸底测验。

多品牌团购不在话下

在上文,我们已经见识到千问「任务助理」点奶茶的便利。接下来的实测中,我们给它上上难度,看能不能搞定多品牌、跨店铺的团购任务。

团购不同牌子的奶茶通常需要我们进入购物 App 并一一查找、浏览对应牌子的奶茶店,还要确认店中有没有自己想要的口味,这会浪费不少时间。在将类似的任务交给千问「任务助理」后,一切的麻烦都没有了。

我们输入指令「帮我点 3 杯霸王茶姬,5 杯瑞幸,8 杯茶百道」,它在确认你的收货地址之后会首先询问你的口味需求。

图片

在确认你有无特殊的口味需求之后,它便开始马不停地自动跑完接下来的所有流程,包括分析用户点单需求、核对点单数量、以及搜索并获取购物平台(这里是淘宝闪购)商品信息。随着一系列内外部信息被它吸收消化,紧接着会进入到制定最佳点单方案的环节。

图片

在制定点单方案时,它会根据距离的远近等因素自动为你匹配合适的商家,并初步完成满足你需求的商品筛选与推荐。

图片

一套丝滑连招下来,它为我们推荐了三种差异化的方案,或想更快收到货、或是选择评分高销量高的门店、或想要订单中包含更多样的饮品种类。这些潜在的用户意图被它精准地捕捉并考虑进来,转化为对应的优先级推荐方案。

图片

最后一步,凭自己的喜好下单付款即可。整个操作过程中,除了在有特殊口味需求时需要你的手动介入,其他时候全权交给千问「任务助理」就行了。

定制旅游计划一气呵成

前几天,「威海暴雪」的新闻登上了微博热搜,让这座滨海城市闯入了人们的视线。提起山东,大家可能更多地想到青岛。相比之下,威海的名气没有那么大。但从网上的口碑来看,威海以「小而美」著称。

带着对这座城市的好奇,我们让千问「任务助理」制定一份 1 月 16 日(这周五)北京出发的威海两日游计划。

在接收到任务之后,它便自动进入到了任务规划以及逐步的任务执行流程。首先会对我们的需求进行一个整体分析,将威海的景点、美食、住宿等因素统统考虑进来,并启动搜索子任务,即调用搜索工具查询相关的背景知识。

通过不间断地搜索、查询多类型网络来源(包括门户网站新闻、旅行社区热帖等)的威海旅游攻略,尽可能地确保信息准确可靠。

图片

紧接着,根据筛选后的优质搜索结果,它为我们规划详细的两日游行程,这里全程对高德飞猪进行了调用。

图片

最终在整合所有行程信息之后,它在高德地图上呈现出了两条交互式路线图。

图片

完整的威海两日游计划出来之后,我们发现,不仅囊括了威海热门景点,还兼顾自然风光与历史文化,并综合考虑了预算成本与游玩体验。

图片

在生成的行程计划中,你既可以一键跳转高德来导航去某处景点的路线并一键打车,也能跳转飞猪去订景区门票和酒店。

在日常购物、旅游规划之外,千问「任务助理」擅长的事情还有很多,比如政务场景,在接入支付宝政务服务之后,只需用户一句话就能快速完成政策解读、材料清单梳理等步骤,覆盖办签证、查社保等等场景,并直达办理入口,效率高得惊人。

图片

简单的几个任务测下来,我们感受颇深的一点是:在交互方式上,以前我们是与大模型「对话」,现在是给智能体「派单」。只需要给出任务,然后等待结果即可。该说不说,这才是智能体真正的定义。

千问 AI 助手  有一套「拟人化」思考架构

千问不仅是能点外卖这么简单,千问「任务助理」已经完成了一套基于通用 Agent 体系的底层重构。

首先,千问 App 采用了一套全新的通用 Agent 体系。它基于 MCP 和 A2A 协议,在其中,主 Agent 作为指挥者,它基于千问最强模型拆解和规划任务;子 Agent 作为执行者,它们是多个具有反思能力的智能体,在其领域具有完全决策执行的权限,可以根据任务情况动态纠偏。

这套范式实现了高效的分层规划,在特定任务领域上也可以保证正确的决策,大幅提升了跨领域、长链路的复杂任务执行效率和准确率。

千问深度重构了 Agent 的原生能力栈。不同于目前流行的基于视觉识别(GUI)的 Agent 路线,千问选择了更加直接的协议打通,提升了 Agent 在执行任务时的精度和效率,在隐私安全上也更有保障。为了进一步提升效率,千问还专门为 AI 进行了工具栈的重构。

比如在搜索时,Agent 能够自主选择不同的搜索方式,或是进行并发搜索;操作浏览器的 Agent 经过了专门训练,结合阿里自研浏览器内核,具备毫秒级响应和极高的交互精度;在处理可视化、写小程序或复杂表格时,智能体会检索、对齐经过验证的成熟代码范式,确保产出结果具备「工程级」稳定性。

「任务助理」多层 Agent 的系统,深度集成了阿里自家生态的各种应用、工具,大量的应用会被拆解成原子化的指令级,确保了工具调用的准确。在跨场景任务上,系统能够正确地感知实时的位置、价格等时效信息,减少了大模型常见的幻觉问题。

千问的 Agent 系统还具备可以持续演进的能力。在完成任务之后,Agent 并不是就结束工作了,而是会像人一样进行「反思」并沉淀经验,让 Agent 可以持续进化。实践的经验会被转化为结构化经验库,作为先验知识在后续任务中动态加载。

这样,AI Agent 就可以逐渐具备人类的工作直觉。

最后,通过 AI Coding 的能力,千问现在可以在执行任务时发动 AI 生成代码能力现写工具。前面说到在大量任务上,Agent 可以实现精准的识别与操作。而在比较少见的任务上,千问的 Agent 可以启动 Agentic Learning 机制,自主编写、测试并封装新的原子工具。随着人们的使用,千问「任务助理」的能力会持续增强。

前天 Anthropic 发布的 Cowork,据说是十天之内用 AI 生成代码能力写出来的。看起来现在千问把类似的能力已经给你集成在智能体上了。千问表示,目前在数百个常用工具中,有超过一半是由 AI Coding 编程自主生成的。

智能体的 AI 革命  已经开始了

今年,AI 领域正在进入产品爆发的阶段。

仅在 1 月份,业界就出现了 Anthropic 的 Cowork,OpenAI 的 ChatGPT Health 等一系列新产品。各家科技公司正在快速兑现 OpenAI 总裁 Greg Brockman 对于智能体在企业、专业领域落地的预言。

刚刚千问的新发布,更是把智能体拉近到了我们身边:它能用快速精准的方式连接最常用的 App,让 Agent 进入到你生活的每一步。在国内,能做到覆盖如此全面的生活场景的公司,还真的只有阿里,其生态囊括了购物、出行、支付、办公等方方面面。

我们能够看出,目前这些 Agent 能力还显得比较简单 —— 正如第一代 iPhone 功能的简单并没有掩盖其划时代的意义一样,千问 APP 今日的推出,也许就像是智能体的 iPhone 时刻。从鼠标点击到手指触控,再到自然语言对话的交互方式升级,从这场发布开始打响了第一枪,人与机器的关系也进入到了第三次革命的关口。

当 AI 开始帮你整理发票、规划行程、甚至下单买咖啡时,它不再是云端那个高冷的「先知」,而变成了身边能干活的「助理」,这是 AI 从「言」到「行」的分水岭。

千问,会像淘宝开启移动互联网时代那样,开启一个全新的 AI 时代吗?我们拭目以待。