用JMP做单样本 t 检验（One-Sample t-Test）

学爸君 · 2026 年1 月 5 日 08:57

单样本 t 检验（One-Sample t-Test）

什么是单样本 t 检验？

单样本 t 检验是一种统计假设检验方法，用于判断未知的总体均值是否与某个特定值存在显著差异。

简单来说，当你有一组样本数据，想知道这组数据所代表的总体平均值是否等于（或不等于）某个你关心的数值时，就可以使用单样本 t 检验。

什么时候可以使用这个检验？

单样本 t 检验适用于连续型数据。你的数据应该是来自正态分布总体的随机样本。

如果数据不是正态分布怎么办？

如果样本量很小，你可能无法对正态性进行检验，这时需要依靠你对数据本身的理解来判断。
当无法安全地假设正态性时，可以使用非参数检验（如 Wilcoxon 符号秩检验），这类检验不要求数据服从正态分布。

单样本 t 检验的前提假设

进行有效的单样本 t 检验，数据需要满足以下条件：

假设条件	说明
独立性	数据值之间相互独立，互不影响
连续性	数据是连续型变量（如身高、体重、成绩等）
随机抽样	数据来自总体的简单随机样本
正态性	总体被假设为正态分布

实际案例：能量棒蛋白质含量检验

问题背景

假设我们从多家商店随机收集了 31 根能量棒，想检验这些能量棒是否符合包装上标注的 20 克蛋白质。

样本数据

下表展示了 31 根能量棒的蛋白质含量（单位：克）：

能量棒蛋白质含量（克）

20.69 27.46 22.15 19.85 21.29 24.75

20.75 22.91 25.34 20.33 21.54 21.08

22.14 19.56 21.10 18.04 24.12 19.95

19.72 18.28 16.26 17.46 20.53 22.12

25.06 22.44 19.08 19.88 21.39 22.33 25.79

观察数据可以发现，即使他们的标签上都写着20g，但有些能量棒的蛋白质含量低于 20 克，有些高于 20 克。那么标注是否和实际“相符”、合规呢？由于这种浮动性，导致不同的人可能有不同的看法。但统计检验提供了一种客观的方法，让每个人对同一组数据得出相同的结论。

检验下数据是否适用

在进行单样本 t 检验之前，我们需要确认数据是否满足检验的前提条件：

独立性：一根能量棒的蛋白质含量不会影响另一根。如果所有样本都来自同一生产批次，那就不满足独立性了。

连续性：蛋白质含量是连续型数据。

随机抽样：假设这些能量棒是从市场上随机购买的（混合了多个批次）。

正态性：对于大样本，我们可以通过图形或检验来验证这一假设。

结论：t 检验是合适的分析方法。

数据初步探索

在正式分析之前，先看一下数据的分布情况。

图 1：能量棒蛋白质含量的直方图和描述统计

描述统计结果：

样本量 (n)：31
样本均值 (x̄)：21.40 克
样本标准差 (s)：2.54 克
标准误 (SE)：0.456 克

从统计结果来看，样本平均值 21.40 克高于标签声称的 20 克。但这个差异是否具有统计学意义？换句话说，这个差异是真实存在的，还是仅仅由于抽样误差造成的？

如何进行单样本 t 检验

第一步：计算样本均值与假设值的差异

$$\bar{x} - \mu_0 = 21.40 - 20 = 1.40$$

第二步：计算标准误

标准误（Standard Error）衡量的是样本均值的抽样变异程度：

$$SE = \frac{s}{\sqrt{n}} = \frac{2.54}{\sqrt{31}} = 0.456$$

第三步：计算 t 统计量

$$t = \frac{\bar{x} - \mu_0}{SE} = \frac{1.40}{0.456} = 3.07$$

第四步：确定显著性水平和临界值

设定显著性水平 (α)：我们愿意承担 5% 的风险，即 α = 0.05
计算自由度：df = n - 1 = 31 - 1 = 30
查找临界值：在 α = 0.05、df = 30 的条件下，双侧检验的临界值为 ±2.042

第五步：做出统计决策

比较 t 统计量与临界值：

我们的 t 值 = 3.07
临界值 = ±2.042
因为 3.07 > 2.042，所以我们拒绝原假设

结论：有足够的证据表明，能量棒的实际蛋白质含量与标签声称的 20 克存在显著差异。标签可能需要更正，或者生产过程需要改进。

统计学细节

假设检验的正式表述

原假设（H₀）：总体均值等于 20 克
$$H_0: \mu = 20$$

备择假设（H₁）：总体均值不等于 20 克
$$H_a: \mu \neq 20$$

这是一个双侧检验。我们检验的是总体均值是否在任一方向上与 20 克不同。

t 统计量公式

$$t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}$$

其中：

\bar{x} = 样本均值
\mu_0 = 假设的总体均值（本例中为 20）
s = 样本标准差
n = 样本量

统计决策规则

将 t 统计量与临界值进行比较，有两种可能的结果：

情况	条件	结论
不拒绝 H₀	-2.042 ≤ t ≤ 2.042	没有足够证据说明总体均值与 20 不同
拒绝 H₀	t < -2.042 或 t > 2.042	有足够证据说明总体均值与 20 不同

正态性检验

为什么要检验正态性？

正态性假设对于小样本尤为重要，对于大样本则相对宽松。

正态分布的特点：

对称性：分布在中心两侧是对称的
无极端值：没有异常值（outliers）

图 4：正态 Q-Q 图

图 5：JMP 软件正态性检验结果

结论：可以继续假设能量棒数据服从正态分布。

数据不是正态分布怎么办？

情况	建议
样本量很小，无法检验正态性	依靠对数据的专业理解来判断
已知数据不是正态分布	使用非参数检验（如 Wilcoxon 符号秩检验）
样本量较大但正态性检验被拒绝	同样建议使用非参数检验

理解 p 值

图 6：自由度为 30 的 t 分布

图 7：我们的检验结果在 t 分布中的位置

p 值的含义

p 值 = 0.0046

这意味着：如果总体均值真的是 20 克，那么我们观察到样本均值为 21.4 克（或更极端）的概率只有约 0.46%（大约万分之 46）。

由于这个概率非常小（小于我们设定的 5% 显著性水平），我们有充分的理由拒绝原假设。

使用软件进行单样本 t 检验

图 8：JMP 软件的单样本 t 检验输出结果

软件输出通常包含：

原假设值：20
样本均值：21.40
样本标准差：2.54
t 统计量：3.07
p 值（双侧）：0.0046

软件还会同时显示单侧检验的结果，但在本例中我们关注的是双侧检验。

总结

单样本 t 检验的完整流程

1. 提出假设
   ├── H₀: μ = μ₀（原假设）
   └── H₁: μ ≠ μ₀（备择假设，双侧）
   
2. 检查前提条件
   ├── 独立性
   ├── 连续性
   ├── 随机抽样
   └── 正态性
   
3. 计算检验统计量
   └── t = (x̄ - μ₀) / (s / √n)
   
4. 确定临界值或 p 值
   ├── 设定 α（通常为 0.05）
   └── 查找 t 临界值或计算 p 值
   
5. 做出统计决策
   ├── |t| > 临界值 → 拒绝 H₀
   └── |t| ≤ 临界值 → 不拒绝 H₀
   
6. 得出实际结论

关键公式速查

公式	说明
t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}	t 统计量
SE = \frac{s}{\sqrt{n}}	标准误
df = n - 1	自由度

本例结论

能量棒的实际蛋白质含量（均值 21.40 克）显著高于标签声称的 20 克（t = 3.07, df = 30, p = 0.0046）。建议更新产品标签或调整生产工艺。

版权声明：本文内容整理自 JMP Statistical Knowledge Portal，仅供学习交流使用。


20.69	27.46	22.15	19.85	21.29	24.75
20.75	22.91	25.34	20.33	21.54	21.08
22.14	19.56	21.10	18.04	24.12	19.95
19.72	18.28	16.26	17.46	20.53	22.12
25.06	22.44	19.08	19.88	21.39	22.33	25.79