增长百科|差之毫厘的相关性与因果性

相关性与因果性,是经常放在一起使用和讨论的一组概念,但是很多时候大家并不纠结两者的分别。但是在互联网领域,尤其是推崇数据驱动、实验迭代的用户运营增长领域,对相关性与因果性理解和应用上的偏差,却有可能导致比较严重的工作问题和结果。

这次,我们一起咬文嚼字,看懂“相关性”和“因果性”,用好“相关性”和“因果性”。

看懂相关性与因果性

相关性是指A事件的发生往往伴随着B事件的发生,A和B规律性的同时存在,两者不一定有直接联系。

夏季游泳溺亡人数多,同时雪糕的销量多,“溺亡人数多”和“雪糕销量高”同时存在,具有一定规律性,但是我们不能说溺亡人数增多导致了雪糕销量高,也不能说雪糕销量高导致了溺亡人数多。这两者就是高度相关但是并不存在直接联系的相关性。

因果性是指A事件导致了B事件的发生,A事件是B事件的原因,两者具有直接联系。

夏天天气炎热,导致能够解暑降温的雪糕销量高,同时导致游泳人数变多、溺亡人数变多。“夏天天气炎热”才是导致雪糕销量增高、溺亡人数增多的原因,“天气炎热”与“雪糕销量”“溺亡人数”存在直接联系的因果性。

因果性中的原因和结果相继发生、同时存在,所以可以说存在因果性一定存在相关性,但是,存在相关性则不一定存在因果性,一图总结。

因果性与相关性.png

用好相关性和因果性

在用户增长中,相关性代表着不确定性,而因果性代表着确定性,确定的因果性能够帮助我们针对性地干预原因,从而产生期望的结果。用户增长本质就是在众多不确定的相关性中寻找验证确定的因果性,通过因果性驱动用户规模和价值增长。

增长实验是用户增长中的最核心最有效的方法,加强对增长实验中对相关性和因果性的认知,能够帮助我们更高效进行增长实验。进行增长实验主要步骤内容如下:

  1. 数据分析拆解,明确实验目标

  2. 形成实验假设,提升假设质量

  3. 全面设计实验,快速开发上线

  4. 监控实验过程,分析实验结果

虽然增长实验有明确实验目标→形成实验假设→设计开发实验→分析实验结果四个步骤,但是我们可以换成相关性和因果性的角度,就可以简化为寻找相关性→验证因果性,具体来看。

明确实验目标,形成实验假设:发现相关性

在增长实验的第一步中,通过对公司业务目标的拆解形成增长模型公式,并通过用户属性分析、用户行为分析、路径漏斗分析等方式,去发现用户在产品中存在的不利于实现增长目标的问题。

部分情况下,我们能够通过数据分析、用户调研、逻辑推论等方式找到增长中存在的因果性,进而针对性地解决问题。但是,更多情况下,尤其是随着增长工作不断深入时,我们很难直接通过上述方式明确因果性。

这个时候通过相关性的分析,我们能够发现与增长目标具有相关性的产品和用户问题。相关性提供了解决问题、实现增长的可能方向,但是我们无法确定地说相关性一定能直接影响增长。

以K12在线教育产品为例,通过数据监控分析,发现学生上课期间邀请好友购课活动效果反而变差,“学生上课”与“活动效果”存在有规律的相关性,但是直接说学生上课所以活动效果差却比较牵强,两者不一定有因果性,也无法有效指导后续工作。

在找到一些与增长目标具有相关性的问题后,不能着急于实验验证,需要进一步的分析和论证,让其更接近因果性,从而形成可靠性更高的假设,提升后续增长实验成功的可能性。

进一步数据分析和用户调研发现,“学生上课”期间会导致活跃学生用户数大增,但是活跃家长用户数却降低,调研表明参与邀请购课活动的用户大多是家长用户,这个时候我们就发现了新的相关性:学生上课时家长用户不使用产品,从而活动效果差。

这样我们就可以形成一个实验的假设:上课期间以检查孩子作业为理由,引导家长用户关注孩子学习、访问使用产品,是否能够提升上课期间的活动效果?

设计上线实验,分析实验结果:验证因果性

在有了比较可靠的实验假设后,我们通过上线增长实验,去验证我们的假设,将不确定的相关性验证为确定的因果性,当然结果也可能是没有因果性。

验证因果性中最重要的就是对增长实验结果数据的分析,通过对实验数据的科学分析能够准确量化实验的效果,判断实验假设正确与否。

而在增长实验结果数据分析中,有两个比较常见的错误:

  1. 根据结论推论原因

  2. 错误相关当做因果

根据结论推论原因,强行编造因果性,是因为我们对实验假设有了默认的因果性,认为前期的分析论证已经可靠说明了假设中的因果性,忽视了增长实验的作用是验证因果性而不是落地利用因果性。实验设计的分组测试、数据分析的全面多维度,以及团队成员的讨论,都能够减少此类问题。

错误把相关当成因果,没有准确区分相关性和因果性的差别。出现这种问题也是因为增长实验假设存在的不确定性,我们得出的实验数据仍然可能存在相关性的空间,对数据进一步的拆分探索,以及实验快速迭代,可以我们减少这类错误。

相关性和因果性对用户增长工作有着失之毫厘差之千里的影响,期望各位看懂相关性和因果性,在众多相关性中找准相关性,还能用好相关性和因果性,利用因果性的杠杆实现用户增长。

-END-

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注