雷竞技注册
技术文章

了解统计显著性检验中的t分布

2020年10月5日通过罗伯特Keim

本文介绍了显著性检验中使用的统计分布。我们将讨论它的重要性以及它与正态分布的关系。

本文是Robert Keim关于电气工程统计的系列文章的续篇。如果你一直在跟进,可以跳到下面的部分,简要回顾一下统计学意义。如果您刚刚加入,请查看本系列之前的文章:

  1. 统计分析在电气工程中的作用
  2. 描述统计学在电气工程中的作用
  3. 信号处理中的平均偏差、标准偏差和方差
  4. 理解标准偏差计算中的样本大小补偿
  5. 电气工程正态分布概论
  6. 理解直方图和概率
  7. 正态分布数据的累积分布函数是什么?
  8. 参数检验、偏度和峰度
  9. 发现相关、因果和协方差的统计关系
  10. 使用相关系数来寻找统计关系
  11. 实验和数据分析的统计学意义

统计学意义的快速回顾

前一篇文章探讨了统计学显著性的概念,它提供了一种广泛使用的(尽管可能具有误导性)技术,用于确定实验变量之间是否存在关系。这里有一个回顾:

  • 一个实验涉及两个(或更多)变量,它们可能以某种方式相关。的零假设说明这些变量之间没有关系。
  • 通常,我们希望实验能证明无效假设是错误的。换句话说,我们有理由相信两个变量在某种程度上是相关的,我们设计了一个实验,目的是收集数据,以证明存在关系。
  • 在零假设成立的前提下,我们可以计算得到观测值或更极端值的概率。这叫做假定值.它表示在实验变量之间不存在关系的情况下,获得至少与观测值一样极端的值的可能性。
  • 统计显著性是通过将p值与一个预定的阈值进行比较来确定的显著性水平,表示为⍺。常见显著性水平分别为1%(⍺= 0.01)和5%(⍺= 0.05)。
  • 如果p值小于显著性水平,我们有理由拒绝零假设。换句话说,我们可以宣称存在一种关系,因为如果实验变量确实不相关,我们可能会这么做已获得观测值。

在本文中,我的目标是介绍在统计显著性测试中扮演重要角色的分布的基本信息,在接下来的两篇文章中,我们将讨论t值,并通过一个应用于工程系统的简单的统计显著性示例进行工作。

的t分布

零假设通常是a的形式正态分布,因为这是由许多现象产生的价值分布,这些现象以随机或极其复杂的方式受到影响。然而,当我们实际需要计算p值并报告统计显著性时,我们经常使用t分布

t分布与正态分布相似,随着样本量的增加,它逐渐与正态分布相同。“t分布”一词实际上是指一组分布曲线,因为曲线会随着实验的样本量而变化。

更具体地说,t分布的确切形状是由一个称为自由度,表示为\(\nu \)(这是小写的希腊字母nu,不是拉丁字母v)。自由度等于样本大小(表示为n) - 1:

\[\ν= n - 1 \]

下图显示了不同的\(\nu \)值的t分布,其中包含了正态分布进行比较。



t分布的特征

t分布类似于标准正态分布:它的均值为零,它对均值是对称的,对于均值上下的值,概率密度随着相同的一般曲率而减小。

正如你在图中看到的,t分布在尾部的概率密度更大,在峰值附近的区域概率密度更小。这告诉我们,t分布与正态分布相比,会产生更多远离均值的值。

然而,随着ν的增加,这种差异减小,这表明更大的样本量降低了观测值远离平均值的趋势。最后一张图显示当分布有超过30个自由度时,t分布和正态分布本质上没有区别。

t分布的起源

与统计显著性密切相关的一个概念是置信区间.下图说明了一个标准正态分布的双边95%置信区间。

如果一个样本的均值——即我们在实验期间收集的测量值的均值——落在这个置信区间内,观察值在显著性水平为5%时在统计学上不显著。样本均值必须下降来证明对零假设的拒绝。

定义置信区间的两个值称为关键值.在标准正态分布的情况下,双边95%置信区间(对应于5%的显著性水平)的临界值是-1.96和+1.96。如果我们选择一个不同的显著性水平,临界值将会改变。

结果表明,当实验中的样本量很小时,如果我们将零假设建模为正态分布,置信区间将会太窄。这意味着一些观测值可能会落在区间之外,因此在实际实验结果没有统计显著性的情况下,表明了统计显著性。

为什么正态分布的置信区间太窄?

对于这篇文章来说,完整的解释可能太长了,但问题归结为,我们不知道总体的标准差,必须使用样本的标准差。一个非常小的样本的标准差严重低估了实际的标准差,我们使用t分布来补偿这种影响。

随着样本容量的增加,需要的补偿越少,这就是为什么样本容量越大时,t分布更接近正态分布的原因。

从图中可以看出,用t分布代替正态分布时95%置信区间变宽了。


结论

在这一点上,我们对t分布的讨论仍然是相当理论化的。我希望它以一种良好的方式理论化,但无论如何,以后的文章将帮助您理解我们如何将一些理论转化为实践。

1评论