标签 多租户 下的文章

本文首发于 Aloudata 官方技术博客:《多业务线多租户指标治理:Aloudata CAN 分级管控与口径统一方案》 转载请注明出处。

摘要:本文探讨了集团型企业在多业务线、多租户场景下面临的指标口径不一、管控粗放、安全隔离困难等数据治理挑战。通过引入基于 NoETL 语义编织技术的 Aloudata CAN 指标平台,构建统一语义层,实现指标的分级定义、自动化生产与租户级权限隔离,从而达成企业级指标口径 100% 一致与安全合规的目标。关键词:指标平台,NoETL,语义层,数据治理,多租户。

在业务多元化与组织架构复杂的集团型企业中,数据治理正面临前所未有的挑战。“多业务线指标口径不一”与“多租户环境安全控制缺陷” 是导致数据价值无法释放、决策风险加剧的核心痛点。具体而言,这种挑战表现为相互交织的“三重困境”:

困境维度典型表现直接后果
口径定义混乱不同部门对“收入”、“客户数”等基础指标计算方式各异,数据相互矛盾。高层决策失据,市场策略失误。
管控粒度粗放缺乏适配“集团-事业部-部门”的分级授权与审批流,要么响应慢,要么口径失控。治理效率低下,业务敏捷性受损。
安全边界模糊在共享数据平台或 SaaS 化部署中,租户间数据隔离不严,存在越权访问风险。数据泄露隐患,合规风险剧增。

“某大型零售企业曾在内部调研中发现令人震惊的事实:公司内部对‘销售额’这一基础指标竟然存在 6 种不同的定义。” —— 行业调研报告

这三重困境共同指向一个根本性问题:传统基于物理表构建的“数仓+ETL+BI”模式,其业务逻辑与物理实现强耦合的架构,已无法适应现代企业灵活、安全、统一的治理需求。

困境一:业务线割裂,指标“同名不同义”成常态

当集团旗下拥有多条业务线时,看似相同的指标背后是截然不同的业务流程与考核目标。

  • 财务部门的“销售收入”指已确认、净额减退货的会计收入。
  • 市场部门的“销售收入”可能关注客户签约时的合同总额。
  • 销售部门的“销售收入”则常按实际回款到账金额统计。

这种“同名不同义”的现象,根源在于缺乏一个企业级、共识性的业务语义标准。各部门基于自身的数据源(ERP、CRM、OA 等)和利益诉求定义指标,导致在集团月度经营会议上,同一份业务报告却出现多套相互矛盾的数据。

困境二:管控一刀切,无法适配“集团-事业部-部门”分级需求

有效的指标治理需要在“集中管控”与“灵活放权”之间找到平衡。然而,传统指标平台或 BI 内置模块往往缺乏精细化的分级管控能力。

  • 过度集中:所有指标定义、变更需总部 IT 审批,一个简单的口径优化可能排期数周,业务响应迟缓。
  • 过度放权:各业务部门自行在本地报表工具中定义指标,缺乏校验与同步机制,导致集团层面口径彻底失控。

企业需要一套能够映射其组织架构的管控体系,对战略核心指标、业务线运营指标、部门级分析指标进行差异化管理。

困境三:多租户环境,数据权限与安全隔离存在漏洞

对于采用 SaaS 化部署的数据平台,或集团内为不同子公司、业务单元提供共享数据服务的情况,多租户数据隔离是刚性需求。传统方案通常基于数据库用户、视图或物理表分区来实现,方案复杂、运维成本高,且容易因配置疏忽产生安全漏洞。

例如,子公司 A 不应看到子公司 B 的客户交易明细;不同业务单元对同一张表中的敏感字段应有不同的访问权限。这种行级与列级的精细化权限控制,若在物理层实现,将导致数据模型异常复杂。

新模式重构:Aloudata CAN 的“语义编织+分级管控”一体化方案

面对上述困境,Aloudata CAN 提出了基于 NoETL 语义编织 的革新性方案。其核心在于将业务逻辑(指标定义)与物理数据实现进行解耦,通过构建企业级统一语义层,并在此之上实现灵活的分级管控与安全隔离。

架构核心:

1、底层:直接对接现有的 DWD 明细数据层,无需预先构建繁重的物理宽表(ADS/DWS)。

2、中间层(核心):Aloudata CAN 统一语义层。在此层,通过声明式策略定义业务实体间的逻辑关联,形成“虚拟业务事实网络”。所有指标均在此以“基础度量+业务限定+统计周期+衍生计算”的语义要素进行声明式定义。

3、上层:基于统一的语义层,向上提供:

  • 集团战略视图:确保核心指标口径一致。
  • 业务线分析视图:各业务线在授权范围内进行派生分析。
  • 租户独立空间:为不同租户提供逻辑隔离的数据访问环境。

这一架构使得指标治理从“事后盘点、人工对齐”的被动模式,转变为 “定义即治理、一处定义处处一致” 的主动嵌入模式。

核心能力一:基于统一语义层的指标“一次定义,处处一致”

Aloudata CAN 的语义引擎允许用户在虚拟的业务事实网络上,以零代码、配置化的方式声明式定义指标。

  • 复杂指标表达能力:支持跨表聚合、去重计数、比率、留存率、基于指标结果的动态筛选(指标转标签)等复杂业务逻辑。
  • 自动 SQL 生成与全局复用:定义完成后,系统自动生成最优查询 SQL。该定义被注册到企业唯一的指标库中,任何 BI 工具、报表或 API 调用都指向这一定义,从根本上杜绝了“同名不同义”。
  • 变更影响可控:当原子指标口径需要调整时,系统会自动分析并提示所有下游派生指标的影响范围,由管理员决策是否触发物化任务重建,确保变更过程可控、透明。

核心能力二:适配组织架构的指标分级管控与审批流

Aloudata CAN 支持对指标进行精细化分类分级,并配置差异化的管理流程。

  • 指标分级:可设置战略级、业务级、部门级等不同级别,并为每级配置相应的管理属性(责任人、部门、安全等级)。
  • 流程定制:不同级别的指标可关联不同的审批流。例如,战略级指标需经数据治理委员会审批上线;部门级指标可由部门负责人自行发布。
  • 权责清晰:通过指标价值树功能,可视化呈现指标从战略目标到业务执行的层层拆解关系,使管理者的目标追踪与一线业务的分析探索在同一套体系下无缝衔接,实现 “管得住”与“放得开” 的平衡。

核心能力三:行列级权限与租户级数据空间的天然隔离

基于统一的语义层,Aloudata CAN 实现了逻辑层面的精细化权限控制,这比物理层方案更灵活、更安全。

  • 行列级权限模型:可以在指标或数据表级别,为用户或角色配置行级过滤条件(如 分公司 = ‘上海’)和列级访问权限(如屏蔽“手机号”字段)。
  • 租户级逻辑隔离:每个租户(子公司/业务单元)拥有独立的语义视图和权限策略。查询时,语义引擎会自动将租户标识作为过滤条件下推至数据源,在计算层面实现天然隔离,无需为每个租户创建物理数据副本。
  • 性能保障:智能物化加速引擎会为不同租户的热点查询模式建立独立的物化表,避免计算资源争抢,确保各租户的查询性能(如亿级数据秒级响应)不受影响。

落地案例:某头部股份制银行的“总-分-支”指标治理实践

挑战:该银行总行与数百家分行、支行之间,核心经营指标(如存款、贷款)口径不一,报表数据需大量手工核对,决策滞后,且分行缺乏在合规范围内的灵活分析能力。

Aloudata CAN 解决方案:

  1. 统一语义层构建:在总行层面,基于全行明细数据,声明式统一定义“存款余额”、“贷款发放额”等核心原子指标的口径。
  2. 分级管控实施:总行科技部门管控原子指标;授权分行数据团队在原子指标基础上,通过配置“业务限定”(如“本地区域”、“特定产品线”)派生出本地化分析指标。
  3. 租户隔离保障:为每家分行创建逻辑隔离的数据空间,确保其只能访问和计算本行数据。

量化成效(来源:客户验证数据):

  • 口径 100% 一致:总行管理层视图数据完全统一。
  • 效率提升 10 倍:数据交付周期从平均 2 周缩短至 1 天。
  • 万级指标沉淀:全行沉淀可复用的指标资产超过 1 万个。
  • 性能优异:95% 的查询响应时间在 3 秒以内。
  • 自助化普及:65% 的数据分析需求由业务人员通过自助方式完成。

实施建议:五步构建可持续的指标治理体系

为避免治理项目“烂尾”,建议遵循以下可操作的落地路径:

  1. 成立虚拟治理委员会,明确权责:联合业务、数据、IT 部门关键角色,成立虚拟团队,明确各层级指标的归属、定义、审批职责。
  2. 盘点与分级现有指标资产:全面梳理散落在各报表、系统中的指标,识别出核心、通用、专用指标,建立分类分级目录,明确治理优先级。
  3. 以 NoETL 指标平台为统一技术基座:选择像 Aloudata CAN 这样支持语义定义、分级管控与多租户隔离的平台,作为企业指标资产的“唯一真相源”。
  4. 选择高价值业务场景进行试点:选取 1-2 个痛点明确、价值易显的业务场景(如管理层经营日报、营销活动分析)快速实施,在 1-2 周内形成标杆,积累信心与最佳实践。
  5. 建立指标运营与度量的长效机制:定期评审指标的使用率、业务满意度,监控数据质量,将指标运营工作常态化、制度化,持续优化治理体系。

延伸阅读:从指标治理到 AI-Ready 数据底座的演进

统一的指标语义层不仅是治理的核心,其价值更在于为未来奠定了基础。Aloudata CAN 构建的语义层本质上是高质量、结构化的企业业务知识图谱。

  • 根治 AI 幻觉:通过 NL2MQL2SQL 架构,将 AI 的自然语言问题转化为对已定义指标的查询(MQL),再由语义引擎翻译为精准 SQL,极大收敛搜索空间,确保 100% 的查询准确性。
  • 安全可控的 AI 访问:集成的 AI 访问控制层 确保所有 AI 查询请求先经过语义层的权限校验,杜绝越权访问,实现“先安检,后执行”。
  • 结构化知识载体:指标的口径、血缘、业务描述成为 RAG(检索增强生成)的最佳语料,让大模型以极低的成本理解企业专属业务,加速 Data Agent 等智能应用的落地。

常见问题 (FAQ)

Q1: 多业务线指标统一,会不会牺牲业务灵活性,导致“一刀切”?

不会。Aloudata CAN 的分级管控核心是 “统一原子口径,放开派生应用”。集团统一“销售收入”的原子计算规则,各业务线可在此基础上,通过配置化的“业务限定”和“衍生计算”派生出“线上销售收入”、“会员复购收入”等指标,既保证源头一致,又满足灵活分析。

Q2: 多租户场景下,如何确保不同子公司之间的数据绝对隔离,且不会相互影响查询性能?

Aloudata CAN 通过逻辑数据空间实现租户隔离。每个租户拥有独立的语义视图和权限策略,查询时,语义引擎会自动将租户标识作为过滤条件下推至底层数据源。同时,智能物化加速引擎会为不同租户的热点查询建立独立的物化表,避免资源争抢,保障各租户的查询性能。

Q3: 传统数据治理项目往往周期长、见效慢,Aloudata CAN 的方案如何能快速看到价值?

关键在于 “定义即开发” 和 “增量原生” 策略。传统治理需先花大量时间梳理物理模型、开发 ETL。而 Aloudata CAN 允许业务人员直接基于已有明细数据,以零代码方式定义指标,分钟级上线。建议从 1-2 个高频、痛点的分析场景切入,快速验证价值,形成标杆。

核心要点

  1. 架构解耦是根本:通过 NoETL 语义编织技术,将业务逻辑从物理数据中解耦,是解决多业务线、多租户治理困境的技术前提。
  2. 分级管控实现平衡:适配组织架构的指标分级与审批流,能在保障口径一致性的同时,释放业务端的分析敏捷性。
  3. 逻辑隔离优于物理隔离:基于语义层的行列级权限与租户空间,能以更低的复杂度实现更安全、灵活的数据访问控制。
  4. 统一语义层是未来基石:标准化的指标资产不仅是治理成果,更是企业构建 AI-Ready 数据底座、迈向智能问数与数据智能体的核心知识载体。
    • *

本文详细内容及高清架构图,请访问 Aloudata 官方技术博客原文: https://ai.noetl.cn/knowledge-base/aloudata-can-multi-busines...

摘要:
中国联通使用的传统集中式数据库面临高并发、扩展难、运维复杂等痛点,于是其与 OceanBase 构建“企业版核心承载 + 社区版自主创新” 双轨体系,现已全面覆盖联通 B 域(业务支撑)、O 域(运营支撑)、M 域(管理支撑)全场景。其中,OceanBase 企业版攻克运营商最核心的B域40% 生产系统,支撑全球最大规模 “全国大集中” 核心业务。

当超 4 亿用户的通信消费、5G 服务、政企业务全部汇聚于 “全国一套系统”,当传统数据库的性能瓶颈,遭遇数字时代的 “数据海啸”,自研数据库如何扛起全球最复杂的电信核心业务?

近日,中国联通软件研究院(简称 “联通软研院”)与 OceanBase 的四年深度合作交出了震撼行业的答卷:

双方打造的 “企业版核心承载 + 社区版自主创新” 双轨体系,已全面覆盖联通 B 域(业务支撑)、O 域(运营支撑)、M 域(管理支撑)全场景,累计部署节点超 1000个。其中,OceanBase 企业版攻克运营商最核心的 B 域 40% 生产系统,支撑全球最大规模 “全国大集中” 核心业务;基于OceanBase 社区版自研的 CUDB 数据库规模化上线数百套系统,更以 AI 向量数据库创新应用 ChatDBA,为运营商智能化转型提供了可复用的创新方案。

这场合作见证了自研数据库技术从 “入局” 到 “破局” 再到 “引领” 的华丽转身。

破局 “全国大集中”:超 4 亿用户核心系统的分布式升级革命

在电信行业 “省集中” 为主流的格局下,中国联通率先推行 “全国大集中” 战略,以一套 cBSS 系统承载 31 省全业务、全客户、全渠道服务,支撑超 4 亿用户的 CRM、计费、结算等核心场景 —— 这是全球电信行业单体承载用户最多、集中化程度最高的业务支撑系统,其技术升级难度堪称 “在飞行的飞机上换引擎”。

此前,该系统长期依赖传统集中式数据库,即便后续升级为 “中间件 + 数据库” 架构,仍面临高并发性能瓶颈、扩展性不足、运维复杂等致命痛点:月初缴费高峰时 “一省慢、全国卡”,5000 万用户基数就触达集中式数据库性能上限;31 省业务 “共性收敛与个性保留” 难以平衡;复杂存储过程与多数据库类型导致升级改造难如登天。

OceanBase 的分布式架构成为破解困局的关键。作为 “全国电信唯一大集中核心业务支撑系统国产升级” 案例,OceanBase 企业版通过三大核心能力实现突破:

一是 “两地三中心” 部署模式,以Paxos 协议分布式一致性机制,实现 RPO=0(数据零丢失)、RTO<30秒的金融级容灾,相比传统集中式数据库的主备架构,容灾建设成本降低 50% 以上,支撑核心业务全年 7×24小时无间断运行;

二是多租户弹性扩缩容技术,将全国上千个节点物理资源池化,按业务需求动态分配 CPU、内存、IO,彻底解决资源争抢问题,计费中心查询性能提升 60%,政企中台并发处理能力翻倍,资源利用率从不足 40% 跃升至 80% 以上,硬件成本降低 60%;

三是深度兼容特性,完美适配 MySQL 与 Oracle 语法,让复杂存储过程、冷僻 SQL 语句无需大幅改写,实现 ERP 系统零改造平滑升级,B 域核心系统整体升级改造成本降低 70%。

更具创新性的是,基于 OceanBase 多租户能力构建的 “一库多服” 架构:通过镜像库将 10 余个业务中心的高负载查询请求从生产库剥离,既保障 “全国一套账” 的统一管理,又能灵活响应各省 5G 用户增长分析、政企客户关联图谱等个性化需求,仅用 1 周就完成所有数据库升级同步,成为支撑业务运营的数据枢纽。

自主创新加码:CUDB 引领开源生态规模化落地

在核心业务升级的同时,联通软研院并未止步于 “使用者” 角色,而是向 “开发者”“创新者” 转型。

2021 年 OceanBase 开源后,联通软研院仅用 13 个月就完成社区版深度优化,打造出分布式 HTAP 数据库产品分布式 CUDB,成为基于 OceanBase 社区版的最大规模应用案例。截至 2025 年 6 月,分布式 CUDB 已承载数百个业务应用,部署节点超 200 个,管理原始数据量近 300TB,广泛覆盖 O 域、M 域各类场景。

为解决传统 MySQL 多版本分散、升级低效的痛点,自研 MySQL 与分布式 CUDB 双向数据迁移工具,实现 10 万条 / 秒的升级速度 —— 这是社区版 OMS 的 3 倍、同类产品 DataX 的 5 倍,已累计完成 25TB + 数据升级,兼容性与效率均处于行业领先水平。

同时,分布式 CUDB 全面接入联通云,实现 “一点开通、一点交付、一点监控、一点运维、一点操作” 的一站式服务,大幅提升云租户使用体验与运营效率。更值得关注的是,联通软研院在合作中累计向 OceanBase 开源社区贡献代码超万行,输出数据库事务日志精准恢复、云存储备份对接等核心能力,实现 “使用开源、贡献开源” 的良性循环,推动数据库生态协同进化。

AI + 数据库融合:ChatDBA 树立智能化转型新范式

2025 年,AI 成为数字化转型的核心驱动力,中国联通软研院聚焦 AI 向量数据库等前沿领域,基于 OceanBase 完成数据库智能专家 ChatDBA 的底层架构升级,破解了大模型落地的关键痛点。作为基于 RAG(检索增强生成)技术构建的 AI 应用,ChatDBA需整合海量数据库专业知识与运维经验,传统架构存在扩展性不足、运维复杂、资源利用率低等问题。

经过对主流向量数据库的全面测评,OceanBase 的一体化能力脱颖而出:其支持关系型数据、向量数据等多类型数据混合存储查询,可处理最高 16000 维稠密向量,在 768 维 100 万数据集下检索性能是主流向量数据库的 3-6 倍;分布式架构保障高并发与故障自动恢复,多租户技术实现资源隔离,搭配完善的管控与迁移工具,大幅降低运维成本。

依托这些优势,ChatDBA 仅用两周就完成适配改造,硬件资源成本直降 30%,运维人力成本同步降低,问题解决效率显著提升,成为运营商领域 “AI + 数据库” 深度融合的标杆范例。

从核心业务分布式升级的 “破冰”,到开源生态自主创新的 “深耕”,再到 AI 一体化架构的 “引领”,中国联通软研院与 OceanBase 的合作不仅实现了量化的降本增效,更构建了 “自主创新、安全稳定、智能高效” 的数字基建新范式。

联通软研院相关负责人表示,未来将持续扩大合作范围,深化向量数据库、多模数据融合等领域创新。OceanBase 也将以此次合作为基础,持续迭代升级,适配电信行业核心需求。

这场跨越四年的深度合作,不仅为中国联通 “数字服务使能者” 转型筑牢技术底座,更向全行业证明:自研数据库已具备支撑全球最复杂核心业务的能力。

这一点在 OceanBase 过去五年的实践中得以充分验证:自 2020 年商业化以来,OceanBase 已在运营商领域实现从“点上突破”到“面上开花”的转变,深度服务中国联通、中国移动、中国电信三大运营商,覆盖 B/O/M 全业务域。在今年 9 月举行的中国通信展上,凭借在通信行业扎根沉淀的实践优势和技术创新能力,OceanBase 联合运营商打造的五个标杆案例获得由中国通信企业协会评选的“一等案例”荣誉。这些成绩的背后,是 OceanBase 作为运营商“可信赖基石”地位的奠定。

当每一通电话、每一笔交易、每一次 AI 交互都运行在自主研发的数据库上,我们看到的不仅是技术自立自强的硬核实力,更是数字化的坚实底气 —— 自研数据库正在从幕后走向台前,重新定义数字时代的数据库核心标准。

欢迎访问 OceanBase 官网获取更多信息:https://www.oceanbase.com/