标签 MaxCompute 下的文章

在新零售不断演进的今天,用户走进瑞幸,要的不只是咖啡,更是一种“被真正理解”的体验——口味、习惯、场景,甚至那一刻的心情。作为国内领先的连锁咖啡品牌,瑞幸咖啡正从数字化迈入智能化新阶段,以人工智能技术驱动“人、货、场”核心业务平台的智能化重构,构建面向未来的智慧商业决策体系。

为此,瑞幸与阿里云深度共创,基于阿里云人工智能平台PAI,共同打造了一套真正“以用户为中心”的端到端智能推荐系统。它不再依赖静态规则,而是通过理解用户的偏好和需求,为用户提供贴心的咖啡选择建议——无论是清晨提神的美式,还是周末慵懒的生椰拿铁,当你唤醒AI Lucky,“为你而选”的新品、优惠与搭配,就会送到你眼前,让每一次选择都更轻松、更安心。

过去依赖人工规则的推荐方式,难以动态响应用户变化;如今,借助双方联合打磨的数据链路、算法模型与运营机制,瑞幸不仅实现了推荐精准度的跃升,也让用户获得更流畅、更贴心的服务体验。

这次合作,是瑞幸AI能力体系进化的重要一步,更是与阿里云“一起设计、一起验证、一起交付、一起沉淀”的技术共创典范——不是单方面交付产品,而是共同构建面向未来的智能零售能力。

从规则驱动到 AI 驱动:赋能增长新范式

截至2025年第三季度,瑞幸咖啡已建立起覆盖全国超2.9万家门店的庞大网络。随着用户规模持续扩大,瑞幸咖啡也在不断探索新技术增加对于客户的理解,为客户提供更加灵活的服务,促进增长的发展。

为探索AI赋能增长新范式,瑞幸致力于构建一套具备高精度、可迭代、可扩展能力的AI推荐系统。经过多轮技术评估与方案论证,瑞幸最终与阿里云大数据AI平台合作共创,采用MaxCompute+DataWorks+Flink+Hologres+PAI技术架构,以PAI-Rec作为其新一代推荐引擎,依托其强大的大数据、算法能力与全链路服务支持,开启提升用户推荐体验的智能化升级。

与客户共创,助力客户能力沉淀

此次合作不仅是技术产品的落地,更是一次深度的“技术共创”实践。阿里云技术团队与瑞幸技术团队紧密协作,全程参与需求分析、POC验证、系统上线与效果优化。

在项目推进过程中,阿里云技术团队与瑞幸团队高效协同,高质量完成多组对比实验,并组织多次技术交流,协助瑞幸系统性地沉淀了数据处理规范、特征工程方法、模型调优策略及测试体系,为其后续自主迭代与业务扩展打下坚实基础。

展望未来:AI 驱动“更懂你的咖啡”

本次合作不仅为瑞幸带来了显著的业务升级,也为阿里云人工智能平台PAI在零售行业树立了标杆案例。

“本次与阿里云合作的AI智能推荐场景,提供的不仅是一个工具、一个解决方案,更是一次双方共创合作经验的落地。”瑞幸技术负责人表示,“从POC到全量上线,阿里云团队展现了极强的技术实力与服务意识。我们相信,AI将成为瑞幸持续领跑行业的重要引擎。”

一杯咖啡的背后,是海量数据的流转与AI模型的精准计算。随着推荐系统的持续优化,瑞幸咖啡的运营模式实现“更智能、更个性、更高效”。未来,双方还将探索大模型在用户意图理解、生成式推荐、跨场景联动等方向的创新应用,进一步释放AI在消费场景中的潜力。

瑞幸咖啡 x 阿里云大数据AI平台的合作,不仅是一次技术升级,更是AI赋能实体经济的生动实践。在智能化浪潮中,AI将成为您的专属咖啡助手——从海量风味中,AI推荐为您探索意想不到的惊喜之选,让咖啡更懂你。

阿里云 AI 推荐方案:打造端到端智能推荐引擎

下面将重点介绍阿里云AI推荐方案在该场景中的技术亮点与应用优势。

阿里云AI推荐方案是面向企业级场景的全托管推荐算法服务平台,深度融合阿里巴巴在电商、本地生活等高并发、高实时性场景下的推荐实践经验,提供从数据处理、特征工程、模型训练、测试验证到在线服务的一站式解决方案。

在本次合作中,阿里云为瑞幸咖啡量身打造了覆盖“数据 → 模型 → 服务 → 迭代”的完整推荐链路:

  • 端到端系统搭建:基于全托管架构的阿里云大数据AI平台,搭建实时推荐全链路,快速构建从数据采集、实时特征计算、深度学习模型训练到在线推理的全流程系统,实现毫秒级响应的AI推荐服务。
  • 精准转化率提升:通过引入深度CTR/CVR预估模型、多目标优化(MMOE)及序列建模(如DIEN),显著提升推荐内容的相关性与转化效率。经测试验证,最终转化率较原有规则系统提升明显
  • 全托管运维,释放技术负担:依托人工智能平台PAI的自动化运维与弹性伸缩能力,瑞幸团队得以从繁重的系统维护中解放,聚焦核心业务创新,大幅降低AI落地门槛。

阿里云智能推荐系统解决方案

阿里云为企业开发者提供全链路深度定制的推荐系统解决方案。方案涵盖了离线处理、在线服务、实时数据流和工程架构等多个维度,包括召回、排序、过滤和重排等功能模块,提供多种数据诊断分析、推荐结果调试和引擎发布管理等工具,通过A/B testing服务和实验报表平台提升推荐系统的迭代效率。

搭建一套智能推荐系统,主要分为四个步骤:数据准备、离线训练、在线服务以及算法迭代。
b2c90afc7fb4401ea91455467a5526dc.png

1. 数据准备

  • 基础埋点与采集:首先需完成用户行为数据的埋点采集,包括曝光、点击、加购、收藏及下单等核心行为。 
  • 基础表构建:进行数据ETL,产出三张核心基础表:用户表(包含属性及偏好标签)、物品表(包含类目、价格等属性)及行为表(记录用户与物品的交互时间及类型)。 
  • 数据智能诊断:对原始数据进行潜在问题分析,评估特征的可用性与覆盖率,确保模型训练的质量。

2. 离线训练

  • 算法定制开发:对召回(如Etrec协同过滤)、粗排、精排(如DBMTL多目标训练)等算法的深度定制。 
  • 特征与样本准备:通过离线调度任务,完成特征抽取与正负样本构造。统一管理离线特征,确保离在线特征的一致性。 
  • 模型训练与调优:模型训练,并利用AutoML进行自动调参,提升模型性能。

3. 在线服务

  • 推荐引擎部署:部署召回和排序模型,处理在线推理请求。
  • 特征实时读取:在线推理时,推荐引擎高性能存储中读取用户和物品特征,并传递给PAI-EAS打分。
  • 联调与测试:上线前进行全链路联调,验证特征一致性,并观察推荐结果是否符合预期业务逻辑。

4. 算法迭代

  • AB实验监控:通过配置AB实验报表实时观察AB实验效果。在实验结束后,进行数据诊断任务以深入分析实验表现。
  • 闭环优化:根据实验结果调整特征和样本,或者调整模型架构后重新训练。
  • 特征自动挖掘:引入 AutoFE(自动特征工程) 技术,利用算法自动挖掘新特征,进一步提升推荐的精准度。

搭建一套智能推荐系统方案,主要依赖的云产品,包括:PAI-Rec、PAI、FeatureStore、MaxCompute+Dataworks等。
99f82c99fb984380a2e17d23d9210218.png

PAI-Rec使用EasyRec训练召回和排序模型,使用PAI-Rec引擎搭建推荐系统;通过 DataWorks 编辑和调度特征工程、样本和模型训练的代码;使用特征数据库FeatureDB存储用户特征、i2i相关物品和向量库;使用PAI-EAS 提供可弹性扩缩容的打分服务。

具体说明如下:

  • 人工智能平台PAI:面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务。
  • EasyRec算法框架:内置业界先进的深度学习模型,支持多种Tensorflow版本(>=1.12, <=2.4, PAI-TF)和 PyTorch 版本,覆盖了推荐全链路的需求,包括召回、粗排、排序、重排、多目标和冷启动等。开发者可基于EasyRec算法框架加速迭代推荐全链路需求。
  • 大数据开发治理平台DataWorks/云原生大数据计算服务MaxCompute:基于云原生的大数据服务,可搭配使用,针对推荐系统中特征处理、样本生成、画像管理、模型调度、数据更新等环节,提供了易用的开发工具和稳定的数据环境。
  • 特征平台管理工具FeatureStore:用于存储和管理离线和在线服务中的特征数据,确保了从离线到在线的特征统一与高效复用。同时,整合了阿里云上DataHub、Flink、Hologres和Tablestore等产品,并且自研了搜索推荐专用的特征数据库FeatureDB,提供特征管理功能。

这套“MaxCompute+DataWorks+Flink+Hologres+PAI”深度融合的技术架构,是面向零售、金融、出行等多行业场景的通用型智能数据中台范本。无论是构建AI驱动的推荐系统,还是实现全域数据资产的价值释放,阿里云Data+AI系列产品都能为企业提供从“数据到智能”的全栈赋能。

未来已来,智能不止于推荐。让每一次交互更懂用户,让每一份数据创造价值——阿里云大数据与AI产品组合,助力企业驶入智能化快车道。

在大模型迈向“专业决策”的关键拐点,数据质量与智能体能力正成为AI落地的核心引擎。语料重复、噪声泛滥,如何高效构建万亿级高质量训练数据?通用问答已成过去,企业呼唤能理解业务、调用工具、自主推理的AI智能体——真正的“所想即所得”,正在从愿景走向工程实践。

在此背景下,2026年1月11日起,阿里云联合 NVIDIA 正式发起“寻找AI全能王”——Data+AI工程师全球大奖赛,面向全球高校学子与企业开发者,开启一场覆盖“数据处理”与“智能体构建”的全链路AI工程实战。

大赛官网 >>
本次大赛设置 高校赛道 与 企业赛道,双轨并行、独立评审,聚焦两大前沿挑战:

赛题1 - 向下深挖:挑战万亿语料去重极限
基于 MaxCompute MaxFrame + DataWorks,直面海量互联网数据中的重复与噪声,系统性提升超大规模数据去重的计算效率与精度,攻克工业级数据预处理难题。

赛题2 - 向上突破:构建 DeepSearch 智能体
基于 PAI-LangStudio,在真实业务场景中构建具备意图理解、多步推理、工具调用与结果验证能力的 AI Agent,实现从自然语言到知识洞察、从查询指令到自动化执行的端到端闭环,推动 AI Agent 应用规模化落地。

在这里你将收获:

  • 丰厚现金奖励与官方认证荣誉瓜分高额奖金池,斩获最高7万元大奖,并获得阿里云官方认证的获奖证书,为个人能力加冕。单赛题所有 Top100 完赛队伍均可获得价值200元完赛礼包,另有征文活动赢取定制好礼。
  • 与顶尖技术专家深度对话赛事期间将开放导师答疑与赛题解析环节,优秀选手更有机会与阿里云技术专家面对面交流,获取专业指导与发展建议。
  • 真实场景下的全链路AI工程历练基于 MaxFrame、PAI-LangStudio 等工业级平台,在万亿规模语料处理与智能体构建中,掌握从数据清洗到Agent推理的端到端实战能力,积累可落地的技术经验。 

这不仅是一场比赛,更是 Data 与 AI 深度融合的产业试验场。优秀成果将有机会被纳入阿里云产品技术演进,成为驱动 AI 原生时代的关键组件。

以代码驱动变革,用数据释放智能——AI全能王,等你来战!
立即报名参赛:
高校赛道https://tianchi.aliyun.com/competition/entrance/532448
企业赛道https://tianchi.aliyun.com/competition/entrance/532449