标签 Hologres 下的文章

在新零售不断演进的今天,用户走进瑞幸,要的不只是咖啡,更是一种“被真正理解”的体验——口味、习惯、场景,甚至那一刻的心情。作为国内领先的连锁咖啡品牌,瑞幸咖啡正从数字化迈入智能化新阶段,以人工智能技术驱动“人、货、场”核心业务平台的智能化重构,构建面向未来的智慧商业决策体系。

为此,瑞幸与阿里云深度共创,基于阿里云人工智能平台PAI,共同打造了一套真正“以用户为中心”的端到端智能推荐系统。它不再依赖静态规则,而是通过理解用户的偏好和需求,为用户提供贴心的咖啡选择建议——无论是清晨提神的美式,还是周末慵懒的生椰拿铁,当你唤醒AI Lucky,“为你而选”的新品、优惠与搭配,就会送到你眼前,让每一次选择都更轻松、更安心。

过去依赖人工规则的推荐方式,难以动态响应用户变化;如今,借助双方联合打磨的数据链路、算法模型与运营机制,瑞幸不仅实现了推荐精准度的跃升,也让用户获得更流畅、更贴心的服务体验。

这次合作,是瑞幸AI能力体系进化的重要一步,更是与阿里云“一起设计、一起验证、一起交付、一起沉淀”的技术共创典范——不是单方面交付产品,而是共同构建面向未来的智能零售能力。

从规则驱动到 AI 驱动:赋能增长新范式

截至2025年第三季度,瑞幸咖啡已建立起覆盖全国超2.9万家门店的庞大网络。随着用户规模持续扩大,瑞幸咖啡也在不断探索新技术增加对于客户的理解,为客户提供更加灵活的服务,促进增长的发展。

为探索AI赋能增长新范式,瑞幸致力于构建一套具备高精度、可迭代、可扩展能力的AI推荐系统。经过多轮技术评估与方案论证,瑞幸最终与阿里云大数据AI平台合作共创,采用MaxCompute+DataWorks+Flink+Hologres+PAI技术架构,以PAI-Rec作为其新一代推荐引擎,依托其强大的大数据、算法能力与全链路服务支持,开启提升用户推荐体验的智能化升级。

与客户共创,助力客户能力沉淀

此次合作不仅是技术产品的落地,更是一次深度的“技术共创”实践。阿里云技术团队与瑞幸技术团队紧密协作,全程参与需求分析、POC验证、系统上线与效果优化。

在项目推进过程中,阿里云技术团队与瑞幸团队高效协同,高质量完成多组对比实验,并组织多次技术交流,协助瑞幸系统性地沉淀了数据处理规范、特征工程方法、模型调优策略及测试体系,为其后续自主迭代与业务扩展打下坚实基础。

展望未来:AI 驱动“更懂你的咖啡”

本次合作不仅为瑞幸带来了显著的业务升级,也为阿里云人工智能平台PAI在零售行业树立了标杆案例。

“本次与阿里云合作的AI智能推荐场景,提供的不仅是一个工具、一个解决方案,更是一次双方共创合作经验的落地。”瑞幸技术负责人表示,“从POC到全量上线,阿里云团队展现了极强的技术实力与服务意识。我们相信,AI将成为瑞幸持续领跑行业的重要引擎。”

一杯咖啡的背后,是海量数据的流转与AI模型的精准计算。随着推荐系统的持续优化,瑞幸咖啡的运营模式实现“更智能、更个性、更高效”。未来,双方还将探索大模型在用户意图理解、生成式推荐、跨场景联动等方向的创新应用,进一步释放AI在消费场景中的潜力。

瑞幸咖啡 x 阿里云大数据AI平台的合作,不仅是一次技术升级,更是AI赋能实体经济的生动实践。在智能化浪潮中,AI将成为您的专属咖啡助手——从海量风味中,AI推荐为您探索意想不到的惊喜之选,让咖啡更懂你。

阿里云 AI 推荐方案:打造端到端智能推荐引擎

下面将重点介绍阿里云AI推荐方案在该场景中的技术亮点与应用优势。

阿里云AI推荐方案是面向企业级场景的全托管推荐算法服务平台,深度融合阿里巴巴在电商、本地生活等高并发、高实时性场景下的推荐实践经验,提供从数据处理、特征工程、模型训练、测试验证到在线服务的一站式解决方案。

在本次合作中,阿里云为瑞幸咖啡量身打造了覆盖“数据 → 模型 → 服务 → 迭代”的完整推荐链路:

  • 端到端系统搭建:基于全托管架构的阿里云大数据AI平台,搭建实时推荐全链路,快速构建从数据采集、实时特征计算、深度学习模型训练到在线推理的全流程系统,实现毫秒级响应的AI推荐服务。
  • 精准转化率提升:通过引入深度CTR/CVR预估模型、多目标优化(MMOE)及序列建模(如DIEN),显著提升推荐内容的相关性与转化效率。经测试验证,最终转化率较原有规则系统提升明显
  • 全托管运维,释放技术负担:依托人工智能平台PAI的自动化运维与弹性伸缩能力,瑞幸团队得以从繁重的系统维护中解放,聚焦核心业务创新,大幅降低AI落地门槛。

阿里云智能推荐系统解决方案

阿里云为企业开发者提供全链路深度定制的推荐系统解决方案。方案涵盖了离线处理、在线服务、实时数据流和工程架构等多个维度,包括召回、排序、过滤和重排等功能模块,提供多种数据诊断分析、推荐结果调试和引擎发布管理等工具,通过A/B testing服务和实验报表平台提升推荐系统的迭代效率。

搭建一套智能推荐系统,主要分为四个步骤:数据准备、离线训练、在线服务以及算法迭代。
b2c90afc7fb4401ea91455467a5526dc.png

1. 数据准备

  • 基础埋点与采集:首先需完成用户行为数据的埋点采集,包括曝光、点击、加购、收藏及下单等核心行为。 
  • 基础表构建:进行数据ETL,产出三张核心基础表:用户表(包含属性及偏好标签)、物品表(包含类目、价格等属性)及行为表(记录用户与物品的交互时间及类型)。 
  • 数据智能诊断:对原始数据进行潜在问题分析,评估特征的可用性与覆盖率,确保模型训练的质量。

2. 离线训练

  • 算法定制开发:对召回(如Etrec协同过滤)、粗排、精排(如DBMTL多目标训练)等算法的深度定制。 
  • 特征与样本准备:通过离线调度任务,完成特征抽取与正负样本构造。统一管理离线特征,确保离在线特征的一致性。 
  • 模型训练与调优:模型训练,并利用AutoML进行自动调参,提升模型性能。

3. 在线服务

  • 推荐引擎部署:部署召回和排序模型,处理在线推理请求。
  • 特征实时读取:在线推理时,推荐引擎高性能存储中读取用户和物品特征,并传递给PAI-EAS打分。
  • 联调与测试:上线前进行全链路联调,验证特征一致性,并观察推荐结果是否符合预期业务逻辑。

4. 算法迭代

  • AB实验监控:通过配置AB实验报表实时观察AB实验效果。在实验结束后,进行数据诊断任务以深入分析实验表现。
  • 闭环优化:根据实验结果调整特征和样本,或者调整模型架构后重新训练。
  • 特征自动挖掘:引入 AutoFE(自动特征工程) 技术,利用算法自动挖掘新特征,进一步提升推荐的精准度。

搭建一套智能推荐系统方案,主要依赖的云产品,包括:PAI-Rec、PAI、FeatureStore、MaxCompute+Dataworks等。
99f82c99fb984380a2e17d23d9210218.png

PAI-Rec使用EasyRec训练召回和排序模型,使用PAI-Rec引擎搭建推荐系统;通过 DataWorks 编辑和调度特征工程、样本和模型训练的代码;使用特征数据库FeatureDB存储用户特征、i2i相关物品和向量库;使用PAI-EAS 提供可弹性扩缩容的打分服务。

具体说明如下:

  • 人工智能平台PAI:面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务。
  • EasyRec算法框架:内置业界先进的深度学习模型,支持多种Tensorflow版本(>=1.12, <=2.4, PAI-TF)和 PyTorch 版本,覆盖了推荐全链路的需求,包括召回、粗排、排序、重排、多目标和冷启动等。开发者可基于EasyRec算法框架加速迭代推荐全链路需求。
  • 大数据开发治理平台DataWorks/云原生大数据计算服务MaxCompute:基于云原生的大数据服务,可搭配使用,针对推荐系统中特征处理、样本生成、画像管理、模型调度、数据更新等环节,提供了易用的开发工具和稳定的数据环境。
  • 特征平台管理工具FeatureStore:用于存储和管理离线和在线服务中的特征数据,确保了从离线到在线的特征统一与高效复用。同时,整合了阿里云上DataHub、Flink、Hologres和Tablestore等产品,并且自研了搜索推荐专用的特征数据库FeatureDB,提供特征管理功能。

这套“MaxCompute+DataWorks+Flink+Hologres+PAI”深度融合的技术架构,是面向零售、金融、出行等多行业场景的通用型智能数据中台范本。无论是构建AI驱动的推荐系统,还是实现全域数据资产的价值释放,阿里云Data+AI系列产品都能为企业提供从“数据到智能”的全栈赋能。

未来已来,智能不止于推荐。让每一次交互更懂用户,让每一份数据创造价值——阿里云大数据与AI产品组合,助力企业驶入智能化快车道。

作者: 闵加坤 | 淘天集团价格平台开发工程师

业务介绍

淘天价格力团队作为平台价格治理的核心部门,承载着淘宝天猫全域商品价格管理的重要职责。团队掌握着淘内外所有商品的全量价格信息,包括商品原价、券后价等多维度价格数据,每日增量数据规模达亿级以上。

在电商大促上下线时(如618、双11),价格变动频率会呈现数倍增长,这些海量数据不仅体量大,而且具有高时效性、强关联性和复杂变化特征。在大促常态化的现状下,行业运营急需高时效性的数据看板以便及时发现问题,并且需要商品维度、店铺维度等多维圈选能力,及时圈选出符合要求的数据并进行处理或分析。Hologres Dynamic Table完美契合业务需求。

Hologres Dynamic Table介绍

视图是基于表的虚拟表,不存储数据只存储查询逻辑,每次访问时动态执行SQL,返回最新结果,主要帮助我们简化复杂查询。如果没有视图,那么对于以下查询,需要我们自己保存到一个地方,查询时执行完整SQL。

SELECT region, SUM(amount) as total_sales 
FROM orders 
WHERE status = 'completed';

如果有视图,我们可以把查询托管给视图,直接查询视图,可以简化使用。

-- 创建视图
CREATE VIEW sales_summary AS 
SELECT region, SUM(amount) as total_sales 
FROM orders 
WHERE status = 'completed';

-- 查询视图
SELECT * FROM sales_summary;

视图虽然帮我们管理了SQL的定义,但是复杂逻辑SQL的执行通常很耗费时间。将视图的查询结果实际保存下来就是物化视图。物化视图的结果需要定期更新以保证数据新鲜度。所以物化视图就是预定义SQL + 物化结果 + 周期更新

Hologres Dynamic Table与物化视图类似,架构如下,提供全量刷新与增量刷新两种刷新模式。

全量刷新就是在周期到来时进行一次全量刷新覆盖,相当于Insert Overwrite。

增量刷新每次只处理增量数据,原理为在底层创建一个列存state表,存储中间状态(类似Flink state)。增量数据先以微批次方式做内存态聚合,再与state表合并,最后提交时以BulkLoad写入动态表。

在 Hologres V3.1 中 Dynamic Table 的能力如下。
image.png

业务实践

数据圈选

业务背景

价格力团队需要为多个业务场景如商品价格回滚、全网比价等提供灵活的数据圈选能力,要求支持动态的指标组合和筛选条件配置。圈选集创建后,圈选结果也需要随底表数据的变化而变动,不同业务场景可接受的数据变化时间间隔也有所不同。

解决方案

Dynamic Table完美符合场景要求:工程基于不同的筛选规则翻译成相应的DQL,并根据业务场景的需求灵活设置数据新鲜度等配置参数,最终生成完整的Dynamic Table DDL。

指标系统: 指标系统中将表列配置为实体指标。业务指标提供高阶能力如级联指标、聚合、召回计算。

筛选组件: 提供通用筛选配置组件,根据业务场景展示相应指标

业务场景默认配置:Diamond中保存不同业务场景默认配置,包括刷新周期、刷新模式、默认召回条件、默认Join条件等

DDL生成: 将筛选条件与默认条件通过DSL翻译为Hologres Dynamic Table DDL

状态监控: 实现刷新状态检查机制,定期检查动态表刷新状态,区分未完成刷新刷新后无数据两种情况

数据供给:动态表第一次刷新完成后,提供Flink分页查询两种数据供给方式。若选择Flink,在动态表创建完成后会自动根据默认条件创建Flink任务,通常把数据变更作为消息发送给MetaQ。

应用效果

该方案可在秒级亿级数据基表中完成Dynamic Table创建及初次数据刷新,已在价格力团队多个业务场景中部署应用,显著提升了数据圈选的灵活性和效率。


近实时报表构建

业务背景

数据看板的时效性越高,越能帮助运营及时发现问题,快速进行决策和业务调整。价格力团队内部分场景的报表数据原通过ODPS离线调度实现更新,但运营期望能有近实时分钟级数据。

解决方案

数据分层构建: 基于Hologres Dynamic Table实现ODS → DWD → DWS → ADS数据架构的近实时化改造

增量刷新策略: 采用动态表增量刷新机制,设置分钟级刷新间隔,实现近实时数据更新,并分钟级保存历史数据

资源隔离保障: 通过使用Hologres Serverless资源减少与其他任务的资源竞争。

应用效果

应用效果: 成功解决了数据看板的时效性痛点,亿级底表数据,输入RPS 1W的处理时延从小时级降低至分钟级,可以灵活比对任意分钟数据的同比,双十一期间为运营团队提供了及时可靠的数据支撑。