分享好友 最新资讯首页 最新资讯分类 切换频道
融云「北极星」数据监控平台:数据可视通晓全局,精准分析定位问题
2024-11-07 22:35

近期,融云“北极星”数据系统完成功能迭代,新模块“数据监控平台”正式“履新上任”。关注【融云全球互联网通信云】了解更多

融云「北极星」数据监控平台:数据可视通晓全局,精准分析定位问题

此前,“北极星”系统主要为客户提供 IM 和 RTC 业务问题排查服务,当应用出现用户连接中断或延迟、会话状态异常、消息丢失等问题时,开发者可自行通过“北极星”问题排查工具快速定位问题、解决问题。

本次上新完成后,“北极星”成为兼具问题排查和全局监控能力的业务助手。“数据监控平台”将通过 IM 数据监控、API 监控等能力,协助客户全面掌握业务表现,提前发现业务问题,降低业务运行风险。

目前,“数据监控平台”已对融云专有云客户免费开放,后续将不断迭代并覆盖更多客户业务。

一、产品生命周期管理的主要挑战

在融云等专业通信云服务商的支持下,开发一款具备 IM 和 RTC 通信能力的应用,或者让应用拥有社交能力已十分便捷。

特别是,随着融云对社交泛娱乐业务场景的深入研究,各类封装完整业务逻辑和核心能力的场景化 SDK 逐渐上线,开发者简单接入即可实现相应业务。

但一款应用上线,一切才刚刚开始。

根据融云《社交泛娱乐出海作战地图》,产品全生命周期至少包括 MVP、PMF、快速成长期、成熟期等几大阶段,而每个阶段都有必须解决和优化的核心问题,需要付出相当的精力和资金。

图源:《出海作战地图》,移步【融云全球互联网通信云】回复 【地图】获取

在这个周期中,开发者需要边思考、边变通、边优化,而数据就是最直观感受业务表现的工具。

IM 相关数据量级巨大,如何更好地统计、分析、利用这些数据,协助开发者进行运营策略决策、业务系统优化是一个重要课题。

另一个让开发者头疼的问题是,在后期的持续运营中如何保证产品的稳定性和良好体验。

这涉及两方面因素,一是通信服务的稳定性,在这方面融云近些年不断迭代全球通信服务,目前已经上线了全球通信网的 V4 版本,SDK 适配全球 3000+ 款机型,设备崩溃率低于 0.01%。

二则关乎运行故障发生后的迅速排查、定位和解决。尤其在高并发、大集群的状态下,快速定位问题是提高 SDK 使用效率和体验的关键。

开发者若自行构建相关监控平台,不仅耗费人力和管理成本,还需要付出不低的存储及算力成本。

融云“北极星”则可以一并为开发者解决以上问题。

二、北极星数据监控平台的核心功能

使用融云“北极星”,可以方便地获取多维度数据,通过数据曲线观察业务变化,与运营策略等相结合,指引产品优化和运营策略调整,有效提高开发者问题排查和业务分析的效率和体验。

全局消息数据:可查看近 7 天的单聊、群聊、聊天室、超级群的消息相关数据,包含:

☑ 总消息量:上行总消息量、分发总消息量、下行总消息量

☑ 消息峰值:上行消息峰值、分发消息峰值、下行消息峰值

☑ 消息量变化趋势:数据统计为 5 分钟粒度,可查看上行、分发、消息量趋势;每 5 分钟的消息量为该 5 分钟产生的消息总量

消息数据为实时统计,数据延迟 5 分钟左右。

用户同时在线数据:可查看近 7 天的用户同时在线峰值趋势,用户同时在线为实时统计,数据延迟 5 分钟左右。

数据统计为 1 分钟粒度,每 5 分钟一个点,图表展示该 5 分钟的 1 分钟粒度峰值。

通过这些业务数据监控,开发者可感知到各会话类型、各时段的消息量,可查看每日用户同时在线分布趋势,从而为运营策略调整提供指引。

API 实时统计:API 实时统计页面可查看近 7 天内实际调用 API 的 QPS 情况,协助研发及运维进行服务优化并感知业务当前并发情况。

如下图示,左侧展示该 Appkey 在当前检索的时间段内有实际调用的所有 Server API 及该接口的请求成功率。

点击某个对应 API,展示该接口在当前查询时段的 QPS 及错误码分布。

图表中会标注接口当前在融云开发者后台设定的频率值,当 QPS 有频繁超过设定频率的情况时,开发者可以在开发者后台调整对应接口的调用频率。

错误码统计:可查看过去 7 天的 Server API 的错误码占比情况,包含 HTTP 错误码占比及业务状态错误码占比统计。

点击饼图中某个错误码,可查看产生该错误码的具体 Server API。

点击某个 Server API ,可下钻分析该 API 产生对应错误码的时间分布情况。

请求量统计:可查看过去 7 天,有实际调用的 Server API 的每日请求量统计数据。

最新文章
再看快速排序(QuickSort)
      快速排序是一个十分伟大的算法,作为再一次的学习,写一写快排以及和快排相关的问题。 1.基本的快速排序方
阿里伴侣配合阿里巴巴打造全方位线上推广
在当今竞争激烈的电商时代,企业的线上推广至关重要。阿里巴巴作为全球知名的电商平台,为众多企业提供了广阔的发展空间。而阿里
Python大数据分析&人工智能教程 - Scrapy工作原理详解与实操案例
Scrapy是一个开源的、用Python编写的高性能网络爬虫框架,用于抓取网站数据和提取结构性数据。它是基于Twisted异步网络框架构建
AI智能写作助手:一站式解决内容创作、文章润色与高效写作的全面工具
在信息爆炸的时代内容创作已经成为企业、媒体和个人展现自我、传递价值的不可或缺手。面对海量的信息与日益增强的内容品质需求高
你的站点抗压么?推荐一款超方便的开源压测工具
这里是 HelloGitHub 推出的《讲解开源项目》系列,本期介绍一款标星 17.7k 纯 Go 语言实现的 HTTP(S) 压测工具——vegetaVegeta
【系统架构设计】计算机网络
OSI/RM 结构模型 1977年,国际标准化组织为适应网络标准化发展的需求,制定了开放系统互联参考模型(Open System Interconnectio
全世界规模最大战争排名,第一名居然是清朝时期!
自打人类走上进化这条路,就想着法儿想要证明【一伙人就该被另一伙人支配】。古罗马角斗士时代一方有多大势力,就看他有多少人的
python tk随机内容生成器
MyRandom ran=new MyRandom();System.out.println(ran.nextString(1));System.out.println(ran.nextString(50, OnlyNum));System
ai自动写文章在线 在线写文章自动生成器
身为文案工作者,我深感写作之重要且充满挑战。如今,随着人工智能(AI)写作平台的出现,我的写作历程出现了巨大变革。在此,很
AI写系统性综述ChatGPT还远远不够未来百年能否实现
在科学研究的浩瀚海洋中,科研人员时常面临一个棘手的问题:如何有效整合和理解海量的科学文献。尽管网络的普及极大地丰富了文献