刚刚，喝到了千问APP给我点的奶茶｜

刚刚，喝到了千问APP给我点的奶茶

展开列表

刚刚，喝到了千问APP给我点的奶茶

今天

人脸机器人登上Science Robotics封面：用AI教会仿生人脸机器人「开口说话」

今天

实测夸克「千问划词快捷指令」，这7个邪修Prompt，建议收藏

今天

已证实！清华姚班陈立杰全职加入OpenAI，保留伯克利教职

今天

解锁任意步数文生图，港大&Adobe全新Self-E框架学会自我评估

今天

5分钟定制一个AI采购专家：讯飞发布“招采智能体工厂”，重新定义行业开发范式

今天

Agent时代，为什么多模态数据湖是必选项？

今天

大模型长脑子了？研究发现LLM中层会自发模拟人脑进化

今天

性能提升60%，英特尔Ultra3这次带来了巨大提升

01月14日

继宇树后，唯一获得三家大厂押注的自变量：具身模型不是把DeepSeek塞进机器人

01月14日

Sebastian Raschka 2026预测：Transformer统治依旧，但扩散模型正悄然崛起

01月14日

端到端智驾新SOTA | KnowVal：懂法律道德、有价值观的智能驾驶系统

01月14日

仅用10天？Anthropic最新智能体Cowork的代码竟然都是Claude写的

01月14日

AAAI 2026｜AP2O-Coder 让大模型拥有「错题本」，像人类一样按题型高效刷题

01月14日

用AI从常规病理切片重建空间蛋白图谱：基于H&E图像的高维蛋白质表达预测

01月14日

京东首届AI影视创作大赛启动最高奖金10万元邀全民共创AI视频

01月14日

合合信息多模态文本智能产品“上新”，覆盖AI教育、AI健康、AI Infra多元场景

01月14日

500万次围观，1X把「世界模型」真正用在了机器人NEO身上

01月14日

跳出「黑盒」，人大刘勇团队最新大语言模型理论与机理综述

01月14日

百川开源全球最强医疗大模型M3，「严肃问诊」定义AI医疗新能力

01月14日

刚刚，喝到了千问APP给我点的奶茶

2026 一开年，智能体的发展立马进入狂奔状态。

本周二，Anthropic 发布 Cowork 掀起了打工人的革命。它不再像 Claude Code 一样专门面向程序员，而是把大模型与智能体能力推进到电脑桌面上，可以解决大部分人的工作问题。

同一时间，谷歌联合 Walmart 等零售商推出了一项专为智能体购物场景设计的开放标准 —— 通用商务协议（UCP）。此举旨在推动智能体购物全流程的标准化，实现从商品推荐、购买决策到支付结算的无缝衔接。

1 月 15 日上午，千问又前进了一大步，已经准备让智能体全面接管我们的日常生活了。

这一次，千问 App 上线了全新 AI Agent 能力「任务助理」，同时全面打通阿里生态，一次开启了 400 多项新功能，邀请测试与灰度上线已经同步开启，全都是免费可用的。

^{千问 C 端事业群总裁吴嘉}

国内最强的 AI 模型，与最全的应用生态，现在合而为一了。

现在，你只需要对 AI 说「我要两杯奶茶」，千问就可自动找到相应的店铺，选好你的地址、选好商品、下好订单，你只需要点击最终的支付即可。

如果你想买点什么东西拿不定主意，也可以和千问「任务助理」商量一下，它不仅可以讨论出个符合需求的结果，而且可以直通商店的付款链接。

可以看到，千问能够接入的应用包括淘宝、闪购、飞猪、高德地图和支付宝。如果你有需要，千问还能帮你打电话。在发布会现场，千问就展示了 AI 帮人订餐，看起来餐厅老板没有认出与他交谈的是千问。

除了各种有意思的功能，我们也初步体验到了 AI 智能体带来的交互革命 —— 强大的千问模型，正在把阿里独有的生态优势全部并联起来。不论生活还是工作，以后通行的方法，或许都会被 AI 重新整理一遍。

一手实测触角已经碰到了物理世界

刚过去的 2025 年被普遍视为智能体元年，智能体在人工智能领域的热度一直没有断过。从 Manus、ChatGPT Agent 到更多国产 Agent 大模型与应用，几乎每一次发布都会引起轰动。

智能体的出现，让大模型从拥有智能「大脑」进化出灵活的「手」和「脚」，对复杂任务的自动分析、拆解、执行能力与日俱增。有了智能体的参与，人们可以从繁冗的流程性工作中解放出来，大大节省了工作量与时间成本。

在全面接入一众阿里生态业务之后，千问 App 上的这个智能体新面孔能带来哪些不一样的东西呢？带着这个疑问，我们在拿到内测资格之后，马上对它来了一次摸底测验。

多品牌团购不在话下

在上文，我们已经见识到千问「任务助理」点奶茶的便利。接下来的实测中，我们给它上上难度，看能不能搞定多品牌、跨店铺的团购任务。

团购不同牌子的奶茶通常需要我们进入购物 App 并一一查找、浏览对应牌子的奶茶店，还要确认店中有没有自己想要的口味，这会浪费不少时间。在将类似的任务交给千问「任务助理」后，一切的麻烦都没有了。

我们输入指令「帮我点 3 杯霸王茶姬，5 杯瑞幸，8 杯茶百道」，它在确认你的收货地址之后会首先询问你的口味需求。

在确认你有无特殊的口味需求之后，它便开始马不停地自动跑完接下来的所有流程，包括分析用户点单需求、核对点单数量、以及搜索并获取购物平台（这里是淘宝闪购）商品信息。随着一系列内外部信息被它吸收消化，紧接着会进入到制定最佳点单方案的环节。

在制定点单方案时，它会根据距离的远近等因素自动为你匹配合适的商家，并初步完成满足你需求的商品筛选与推荐。

一套丝滑连招下来，它为我们推荐了三种差异化的方案，或想更快收到货、或是选择评分高销量高的门店、或想要订单中包含更多样的饮品种类。这些潜在的用户意图被它精准地捕捉并考虑进来，转化为对应的优先级推荐方案。

最后一步，凭自己的喜好下单付款即可。整个操作过程中，除了在有特殊口味需求时需要你的手动介入，其他时候全权交给千问「任务助理」就行了。

定制旅游计划一气呵成

前几天，「威海暴雪」的新闻登上了微博热搜，让这座滨海城市闯入了人们的视线。提起山东，大家可能更多地想到青岛。相比之下，威海的名气没有那么大。但从网上的口碑来看，威海以「小而美」著称。

带着对这座城市的好奇，我们让千问「任务助理」制定一份 1 月 16 日（这周五）北京出发的威海两日游计划。

在接收到任务之后，它便自动进入到了任务规划以及逐步的任务执行流程。首先会对我们的需求进行一个整体分析，将威海的景点、美食、住宿等因素统统考虑进来，并启动搜索子任务，即调用搜索工具查询相关的背景知识。

通过不间断地搜索、查询多类型网络来源（包括门户网站新闻、旅行社区热帖等）的威海旅游攻略，尽可能地确保信息准确可靠。

紧接着，根据筛选后的优质搜索结果，它为我们规划详细的两日游行程，这里全程对高德和飞猪进行了调用。

最终在整合所有行程信息之后，它在高德地图上呈现出了两条交互式路线图。

完整的威海两日游计划出来之后，我们发现，不仅囊括了威海热门景点，还兼顾自然风光与历史文化，并综合考虑了预算成本与游玩体验。

在生成的行程计划中，你既可以一键跳转高德来导航去某处景点的路线并一键打车，也能跳转飞猪去订景区门票和酒店。

在日常购物、旅游规划之外，千问「任务助理」擅长的事情还有很多，比如政务场景，在接入支付宝政务服务之后，只需用户一句话就能快速完成政策解读、材料清单梳理等步骤，覆盖办签证、查社保等等场景，并直达办理入口，效率高得惊人。

简单的几个任务测下来，我们感受颇深的一点是：在交互方式上，以前我们是与大模型「对话」，现在是给智能体「派单」。只需要给出任务，然后等待结果即可。该说不说，这才是智能体真正的定义。

千问 AI 助手有一套「拟人化」思考架构

千问不仅是能点外卖这么简单，千问「任务助理」已经完成了一套基于通用 Agent 体系的底层重构。

首先，千问 App 采用了一套全新的通用 Agent 体系。它基于 MCP 和 A2A 协议，在其中，主 Agent 作为指挥者，它基于千问最强模型拆解和规划任务；子 Agent 作为执行者，它们是多个具有反思能力的智能体，在其领域具有完全决策执行的权限，可以根据任务情况动态纠偏。

这套范式实现了高效的分层规划，在特定任务领域上也可以保证正确的决策，大幅提升了跨领域、长链路的复杂任务执行效率和准确率。

千问深度重构了 Agent 的原生能力栈。不同于目前流行的基于视觉识别（GUI）的 Agent 路线，千问选择了更加直接的协议打通，提升了 Agent 在执行任务时的精度和效率，在隐私安全上也更有保障。为了进一步提升效率，千问还专门为 AI 进行了工具栈的重构。

比如在搜索时，Agent 能够自主选择不同的搜索方式，或是进行并发搜索；操作浏览器的 Agent 经过了专门训练，结合阿里自研浏览器内核，具备毫秒级响应和极高的交互精度；在处理可视化、写小程序或复杂表格时，智能体会检索、对齐经过验证的成熟代码范式，确保产出结果具备「工程级」稳定性。

「任务助理」多层 Agent 的系统，深度集成了阿里自家生态的各种应用、工具，大量的应用会被拆解成原子化的指令级，确保了工具调用的准确。在跨场景任务上，系统能够正确地感知实时的位置、价格等时效信息，减少了大模型常见的幻觉问题。

千问的 Agent 系统还具备可以持续演进的能力。在完成任务之后，Agent 并不是就结束工作了，而是会像人一样进行「反思」并沉淀经验，让 Agent 可以持续进化。实践的经验会被转化为结构化经验库，作为先验知识在后续任务中动态加载。

这样，AI Agent 就可以逐渐具备人类的工作直觉。

最后，通过 AI Coding 的能力，千问现在可以在执行任务时发动 AI 生成代码能力现写工具。前面说到在大量任务上，Agent 可以实现精准的识别与操作。而在比较少见的任务上，千问的 Agent 可以启动 Agentic Learning 机制，自主编写、测试并封装新的原子工具。随着人们的使用，千问「任务助理」的能力会持续增强。

前天 Anthropic 发布的 Cowork，据说是十天之内用 AI 生成代码能力写出来的。看起来现在千问把类似的能力已经给你集成在智能体上了。千问表示，目前在数百个常用工具中，有超过一半是由 AI Coding 编程自主生成的。

智能体的 AI 革命已经开始了

今年，AI 领域正在进入产品爆发的阶段。

仅在 1 月份，业界就出现了 Anthropic 的 Cowork，OpenAI 的 ChatGPT Health 等一系列新产品。各家科技公司正在快速兑现 OpenAI 总裁 Greg Brockman 对于智能体在企业、专业领域落地的预言。

刚刚千问的新发布，更是把智能体拉近到了我们身边：它能用快速精准的方式连接最常用的 App，让 Agent 进入到你生活的每一步。在国内，能做到覆盖如此全面的生活场景的公司，还真的只有阿里，其生态囊括了购物、出行、支付、办公等方方面面。

我们能够看出，目前这些 Agent 能力还显得比较简单 —— 正如第一代 iPhone 功能的简单并没有掩盖其划时代的意义一样，千问 APP 今日的推出，也许就像是智能体的 iPhone 时刻。从鼠标点击到手指触控，再到自然语言对话的交互方式升级，从这场发布开始打响了第一枪，人与机器的关系也进入到了第三次革命的关口。

当 AI 开始帮你整理发票、规划行程、甚至下单买咖啡时，它不再是云端那个高冷的「先知」，而变成了身边能干活的「助理」，这是 AI 从「言」到「行」的分水岭。

千问，会像淘宝开启移动互联网时代那样，开启一个全新的 AI 时代吗？我们拭目以待。

刚刚，喝到了千问APP给我点的奶茶｜

添加新评论

最新文章

最近回复

分类

归档

其它

刚刚，喝到了千问APP给我点的奶茶 ｜

添加新评论

最新文章

最近回复

分类

归档

其它

刚刚，喝到了千问APP给我点的奶茶｜