GraphPad Prism 统计教程：统计推断中的十二个重要概念

EndNote 2023-01-12

在学习统计学的时候，我们很容易陷入细节而失去对全局的理解。下面列出了GraphPad根据统计推断(statistical inference)，总结出的十二个重要概念，帮助大家加强对统计学全局的理解。

统计学让你从有限的数据中得出一般结论

推论统计学(inferential statistics)的全部要点，是从有限的数据中推断出一般结论。“描述性统计学(Descriptive statistics)”只是描述数据，未得出任何一般结论。但统计学的挑战和困难之处在于从有限的数据中得出一般结论。

统计学并不“直观”

“直观”一词有两层含义。其一是“易于使用和理解”，是我在写《直观生物统计学(Intuitive Biostatistics)》的主要目标；其二是“本能、或即便没有理由，也会按照自己认为正确的事情采取行动”。在第二层含义中，统计推理与“直观”毫不沾边。因为在我们思考数据时，直觉往往会将我们引入歧途。人们经常在随机数据中看到模式，并得出毫无根据的结论。

要从数据中得出有效的结论，需要统计上的严密性。

统计结论总是以概率的形式出现

“统计学意味着永远不能说你绝对确信。”如果你认为一个统计学结论似乎已经确定，那可能存在一些误解。统计学的全部意义在于量化不确定性。

所有统计检验均基于假设

每个统计推断均基于一系列假设。不要试图解读任何统计结果，直至你看完列表。每一次统计计算背后的假设，数据是随机抽样的，或至少能代表可收集到的更大数量的数据集。如果你的数据不能代表本可以（但实际没有）收集的更大数据集，那么统计推断就没有意义。

应提前决定如何分析数据

分析数据需要许多决定。参数检验或非参数检验？是否排除异常值？是否首先转换数据？是否对外部对照值进行标准化？是否调整协变量？是否在回归中使用加权因素？所有这些决定均应该成为试验设计的一部分。如果统计分析的决定是在检查数据之后作出，统计分析很容易成为一种高科技的Ouja board - 一种产生预定结果的方法，而非分析数据的客观方法。这个新名称是p-hacking。

置信区间量化精确度，且易于解读

假设你已计算所收集的一组值的平均值，或者产生某个事件的受试者比例，这些值描述了分析的样本。但有关你所采样的群体总数如何？真实的群体平均值（或比例）可能更高，也可能更低。那么95%置信区间的计算就考虑到了样本量和分散性。给定一组假设，你可以有95%的把握确定置信区间包含真实的群体值（只能通过收集无限量的数据进行确定）。当然，“95%”仅仅是一种惯例。置信区间可以计算任何程度的期望置信。几乎所有结果 -- “比例、相对风险、优势比、平均值、平均值之间的差值、斜率、速率常数等” --应附加置信区间。

P值检验零假设，起初可能难以理解

P值的逻辑起初似乎很奇怪。检验两组是否不同时（不同平均值，不同比例等），首先假设这两个群体实际上是相同的，这被称为“虚假设(null hypothesis)”。然后考虑：如果“虚假设”为真，那么随机获得与实际观察到的差异一样大(甚至更大)的样本的可能性有多大？如果P值很大，那么你的数据与“虚假设”一致；如果P值很小，随机机会产生实际观察到的巨大差异的可能性很小。

这会让你怀疑虚假设是否正确。如果你不能确定虚假设，就无法解释P值。

“统计学显著性”并不意味影响很大或在科学上很重要

如果P值小于0.05（这是一个任意的、但被广泛接受的阈值），那么可以认为结果具有统计学显著性。但这仅仅意味着，你观察到的(或更大的)差异只会在不到5%的情况下发生。一个在科学上或临床上不重要的微小效应可能具有统计学显著性（尤其是在大的样本量中）。这个结论也可能错误，因为你会得出结论，结果具有统计学显著性的概率为5%。

“无显著性差异”并不意味着没有效果、效果很小或与科学无关

如果差异无统计学显著性，那么可得出这样的结论：观察到的结果并不与虚假设不一致（注意双重否定）。你不能断定虚假设为真。很有可能是虚假设是错误，群体之间确实存在差异。这是对于小样本存在的问题。当你需要根据这个结果做决定时，定义一个结果在统计上显著或不显著是有意义的。否则，统计显著性的概念对数据分析的帮助不大。

多重比较使得统计结果难以解释

同时检验许多假设时，多重比较的问题使其结果变得具有欺骗性。如果5%的检验碰巧具有“统计学显著性”，那么如果检验了许多假设，就会得到大量统计显著性结果。可以使用特殊方法来减少发现错误但统计上有意义的结果的问题，但是这些方法也使得很难找到真实的效果。多重比较可能非常难以实施，仅当所有分析都计划妥善，并且所有计划的分析都被执行和报告的时候，统计分析才能被正确地解释。

然而，这些简单的规则正遭到广泛地破坏。

相关性并不意味着因果关系

两个变量之间具有统计学显著性的相关性或关联可能表明一个变量会受到另一个变量的影响。但这可能只是意味着两者都受到第三个变量的影响。或者这可能是一个巧合。

发表的统计数据往往都是积极的

当你在读一篇论文的时候，就已经产生很多选择。当试验成功时，科研人员会继续进行这个项目，而许多其他项目会被放弃。科研人员更有可能写一些能产生显著结果的项目，或者继续以各种方式分析数据，直到得出“具有统计学显著性”的结论。期刊也更有可能会发表一些“积极的”研究。如果虚假设为真，那么你可能会期望在5%试验中得到具有统计学显著性的结果，而这5%的试验比其他95%的试验更有可能被发表。

GraphPad Prism 统计教程：统计推断中的十二个重要概念的下载地址：
本地下载

上一篇：GraphPad Prism 统计教程：如何使实验可重复？下一篇：GraphPad Prism 统计教程：高斯分布

GraphPad Prism 统计教程：统计推断中的十二个重要概念

GraphPad Prism 统计教程：统计推断中的十二个重要概念的下载地址：
本地下载

热门文章

最新文章

标签列表

GraphPad Prism 统计教程：统计推断中的十二个重要概念

GraphPad Prism 统计教程：统计推断中的十二个重要概念的下载地址： 本地下载

热门文章

最新文章

标签列表

GraphPad Prism 统计教程：统计推断中的十二个重要概念的下载地址：
本地下载