走进科学–数据异常引发的血案

导语:

运营工作中发现数据异常,如何快速的找到原因?

下面我们来揭秘,数据异常背后令人匪夷所思的真正原因!

案例 描述

 

案例描述:

 2015年1月某日,发现某产品“数据平台A”提供的某渠道次日留存数据出现异常,次日留存由之前正常的XX%下降了一半。为了查询此问题,整个团队耗时2天浪费了大量的时间和精力。分析后发现发人深省的结论。

 

分析过程

1.首先来看留存数据是如何推导的

gognshi

根据留存数据推导公式,我们可以看出,决定次日留存数据的变量为分母”前一日的新增“和 “次日登录“。

 

2.首先细分“前一日的新增”数据,当时进行了以下步骤的检测

 “检查渠道游戏包是否正常→询问渠道策略→确认是否用户质量下降→检测用户是否有异常行为(刷小号等)

 在与各方协调沟通后,确认“前一日的新增”数据并无异常。

 

3.在细分“次日登录”数据时,当时进行了以下步骤的检测

 “打开APP→加载→登录→创建角色→开场动画→升级等级1→等级2→等级10→等级N”

发现只有在开场动画时的数据出现问题,初步判断定为机型崩溃,提出机型数据检测后发现无异常,此时感到非常的抓狂,因为已经无法判断到底哪个环节出现问题了。

 

4.确认问题

最后意外的查看“数据平台B”和“数据平台C“的留存数据时,抓狂了!!!对比这两个数据平台的留存数据发现都为正常的XX%,只有”数据平台A“的留存数据出现异常,经过沟通核实,竟然是“数据平台A”出现了数据记录异常。

 

问题结果:

整个过程持续了2天的时间,解决思路并无问题,问题的关键是没有验证数据准确性。导致团队在这此问题上浪费了大量的时间和精力。

 

总结 经验

进行异常数据问题分析时我们可以按照以下步骤进行:

 

1.清楚数据定义

例如新增分为设备新增,用户新增,角色新增

用户新增:有些渠道定义为登入游戏就算新增用户,而有些则为达到1级为新增用户,还有一些注册帐号即为新增用户。

明确不同数据平台的每一个数据的定义,是首要的工作!

 

2.数据验证

验证数据的准确性有以下两种方式:

  • 多平台数据对比:这种方式优点是速度快,缺点是不精准:
  • 查询游戏log日志:这种方式的优点是精准度高,缺点是速度慢

核实完数据的准确性后,得到的数据才是真正可以用的,是值得进行分析的!否则就像案例中出现的问题一样,浪费大量的时间和精力!

 

3.开始分析

(针对不同数据异常的情况,未来会进行详细介绍分析方法)

 via:73居


发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注