观测云产品更新 | 故障中心、错误、指标分析、基础设施、场景等
故障中心提供一体化的故障处理支持。当监控器发现异常时,会自动生成故障事件,合并重复告警,并按值班规则通知负责人。若超时未处理,将根据升级策略扩大通知范围。在故障详情页中,可一站式查看关联的监控指标、错误日志、调用链路等信息,支持状态流转与团队协作,所有操作均有完整记录。故障中心这一功能将进一步帮助团队规范故障处理流程,提升响应效率与过程透明度。 在故障中心的计费逻辑中:每命中一次升级策略,在发送通知时记录 100 次任务调用。 “错误中心”功能全新上线!可自动汇总 APM、RUM 和日志中的错误,并通过智能聚合将相同问题收敛为统一 Issue 进行跟踪。使用前需配置投递规则以设定监控范围,即可在列表中查看错误概况、处理状态与发生趋势,也可进入详情页分析完整堆栈、关联链路和用户会话。所有错误支持状态流转与团队协作,实现从发现到解决的全流程管理。 同步增加“错误条数”计费,统计每日新增的 Issue 数据条数,包含错误中心产生的 Issue 数据。 1、资源目录:新增支持创建、编辑、删除资源分组信息; 2、支持直接编辑账号状态(值班中、休假中)。 1、新增 Top N 序列及最大返回点数选项,可以指定在每个查询中,返回排序后最大或最小的若干条(20/50/100/500)数据序列; 2、新增支持点击图表数据点,下拉选择查看相似趋势指标、下钻分析或其他关联查看。 1、主机: 2、资源目录:新增“服务清单”列表入口。 1、仪表板:新增关联监控器按钮,支持一键查看与该仪表板关联的监控器; 2、图表:为所有图表别名配置新增统一序号标识和悬停联动直观化展示多查询行配置时的对应关系。 Profiling:若 Profile 文件体积超过 20MB,系统暂不支持在线解析,同时新增友好提示,您可使用专业分析工具进行查看。 LLM 查看器【所有 Trace】列表中,“总 Tokens 数” 调整为统计整条 Trace 消耗的 Tokens 数;总 Tokens 列将同步显示输入、输出 Tokens 数量。 查看器:在显示项选择“重置为默认字段”后, SSO 管理:优化 SSO 登录流程。用户需先通过邮箱选择身份提供商并完成认证,成功后才能在受保护状态下查看可访问的工作空间,避免权限信息外泄。 管理后台 > 全局配置:新增平台级系统公告管理配置。观测云更新
故障中心




错误


Open API
指标分析

基础设施
df_mute 字段进行列表筛选;

场景


APM
LLM 监测

日志
message 字段显示逻辑优化。
管理
部署版
集成更新
DataKit 更新
新加功能
问题修复
host 标签设置 host=__datakit_ip 时无效的问题istio-init 容器不退出的问题功能优化
sqlserver_host 标签,并将 instance 标签改为 counter_instancesource_type 支持