雷竞技注册
技术文章

从应用于工程系统的T检验中找到统计学意义

10月14日,2020年通过罗伯特Keim

本文讨论了在前一篇文章中提出的示例实验的帮助下进行T-Testing的重要方面。

欢迎来到Robert Keim的电气工程统计系列。正如我们在系列结束时,您可能会想知道导致这一点的概念构建块。如果您想赶上,请浏览下面的文章的列表。否则,跳到下一节以了解有关我们如何从应用于工程系统的T检验中获得统计显着性的更多信息。

  1. 电气工程统计分析介绍
  2. 描述统计学导论
  3. 信号处理应用中的平均偏差、标准偏差和方差
  4. 电气工程正态分布介绍
  5. 了解直方图,概率和正态分布
  6. 正常分布数据中的累积分布函数
  7. 了解推理统计测试和描述性统计措施
  8. 相关性、因果关系和协方差如何帮助我们找到统计关系
  9. 从T分布中找到统计学意义
  10. 如何从实验和数据分析中找到统计学意义?
  11. 使用相关系数找到统计关系
  12. 使用T值以确定实验数据的统计显着性
  13. 将T检验应用于工程系统

审查我们计算的T值

如上所述,我们在我们的虚构实验期间获得了以下测量,涉及操作温度和数据包错误率(PER):

0.0010290.
0.0010113.
0.0010380
0.0010198
0.0009702
0.0010486.
0.0010503
0.0009941.
0.0010067

通过计算样本均值和样本标准差,确定t = 2.13。由于临界值为t* = 1.86,我们发现t > t*,因此我们拒绝原假设。

单尾与双尾测试

我们实验中一个值得怀疑的方面是,假设提高温度只会导致相同或更差的PER性能。由于这一假设,我们的分析没有考虑温度升高与PER改善相关的可能性,这反映在使用单侧检验中:


这个假设有效吗?显着高于室温的温度倾向于使电子电路以一种方式,整体而非理想的方式行事。

然而,温度和系统性能之间的关系受到各种因素的影响,这些因素以潜在的复杂方式相互作用。此外,我们的例子是建立在无线通信系统,RF电路的行为是特别难以预测的。

因此,我们可能决定以不同的方式设计实验。既然我们要为实验室加热,设置系统,收集数据,等等,也许寻找温度升高会导致统计学显著性的证据是有意义的改变在per。

我们不再只是在寻找降低的PER。现在我们假设增加的操作温度可以导致更高的PER或更低的PER,这意味着我们需要一个双尾测试。

具有相同显著性水平的双尾检验在拒绝区域具有相同的概率质量,但该区域被分为两个部分,一个高于平均值,另一个低于平均值。因此,临界值将会改变:


有趣的事情发生了:我们的t值2。13并不大于临界值!换句话说,我们现在的分析表明,该实验没有证明温度和PER之间的关系。

这个练习让我们思考两件事。首先,我们需要谨慎对待将我们导向单侧或双侧检验的假设,因为这些假设可能是我们评估统计显著性的决定性因素。

其次,显著性测试并不是一种坚如磐石的、纯粹的数学方法。除了单尾或双尾检验的选择之外,我们还有显著性阈值本身,这是相当任意的。双尾检验确实将t值移出了拒绝区域,但我们可以选择⍺= 0.1而不是⍺= 0.05将其移回拒绝区域。

样本大小对统计显著性的影响

当t值大于临界值时,零假设被拒绝。因此,如果我们的目标是证明统计意义,我们希望有一个更高的t值。让我们再看一下我们用来计算t值的方程:

\ [t = \压裂{\酒吧{x} - \μ}{s / \√{n}} \]

如果我们增加样本大小(由n表示),则量S /√N减少,这导致T值增加。因此,如果我们想要更高的T值,我们需要做的就是增加样本大小。

例如:如果我使用相同的PER测量值,但将数据集复制5次(如n = 54), t值将从原来的t = 2.13增加到t = 5.48。如果我们收集更多的数据,我们就会增加t值,即使新的测量方法没有在均值或标准差上产生显著的变化。

让事情变得更糟,临界价值减少随着样本大小的增加。用n = 9,我们有ν= 8和t * = 1.860。使用n = 54,我们有ν= 53和t * = 1.674。通常,更大的样本尺寸使统计学意义更容易实现,因为它们倾向于导致更高的T值和较低的临界值。

这是我们计算的统计分析的已知问题p值并将其与显着性水平进行比较。你可以在期刊上读到更多关于这个问题的文章使用效果大小 - 或为什么p值不够这篇文章指出,即使在现实生活中影响可以忽略不计的情况下,一个非常大的样本规模可能会导致一个统计上显著的p值。

结论

我希望这篇文章和上一篇文章帮助您了解在您在处理或故障排除电子系统时如何有用。还要记住统计显着性有其局限性也很好。

也许在未来的文章中,我们将讨论效果大小,这不会受到样本大小的影响,并作为统计显着性的重要补充。