做好A/B测试，需要了解的6个统计学概念

A/B测试是一项用来验证产品新功能效果的科学在线测试方法，它能够通过对实际实验数据进行统计分析从而帮助用户做出对产品的不同功能版本进行取舍的决策。为了使A/B测试得到的结论更严谨更科学，我们在AB测试中借助了强大的统计学做理论支持。

我们整理了以下几个基本概念，帮助大家更好地理解A/B测试中的统计学知识：

均值

平均数是反映数据集中趋势的一项指标，一般通过将一组数据集中所有数据之和除以这组数据集的数据个数得到。在A/B测试中，我们无法知道所有用户的行为（如点击率）的真正均值，而只能使用每个抽样样本集的均值。

方差

方差是衡量随机变量或一组数据的离散程度的度量。概率论中方差用来度量随机变量和其数学期望（即均值）之间的偏离程度。当方差越高时，我们预测的平均数偏离真正平均数的可能性就越大，我们采样得到的均值从而可能就越不准确。

抽样

由于我们不可能知道所研究事物总体分布的均值，所以我们不得不在总体分布中进行抽样，从而基于抽样数据进行统计分析。一般来说，我们抽样的样本数越多，方差也会逐渐变小，从而使抽样样本的均值和真正均值的误差降低。

正态分布

又称“高斯分布”，是一个在数学、物理、工程与社会学等领域都非常重要的概率分布，在统计学的许多方面有着重大的影响力。正态分布的概率密度函数曲线呈钟形（两头低，中间高，左右对称），因此又叫钟形曲线。

在进行A/B测试时，有些测试者会直接简单地通过对不同实验版本的指标均值进行比较，从而做出版本之间优劣差异的结果判断。这实际使用了点估计的方法。但是我们需要意识到：

由于样本毕竟有误差，因此点估计的误差也往往比较大。一种更严谨和精确的方法是假设检验的方法，因此专业的A/B测试基本都会选择假设检验来对实验进行判断。

假设检验

又叫显著性检验，是统计学中用来判断从样本得出的结论能否推论到总体的一种方法。一般实验者会提出提出两个假设：一个是“原假设”，另一个是“备择假设”（备选假设）。

其中，“原假设”代表两个样本没有本质区别，而“备择假设”代表两个样本有本质区别。这两个假设互相对立，并且只有一个真正成立。而通过假设检验的分析，我们就能判断出哪个假设有更大的概率成立。在假设检验中，实验者可能犯两类错误：一类错误是指当原假设为真时拒绝了原假设，其概率标记为α(alpha)；二类错误是指当原假设为假时没有拒绝原假设，其概率标记为β(Beta)。

通常来说，犯一类错误的影响会比犯二类错误的大。

扫描二维码关注公众号，回复： 8666552 查看本文章