|
1.单样本t检验的目的
单样本t检验的目的是利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值存在差异。它是对总体均值的假设检验。
2.单样本t检验的基本步骤
单样本t检验作为假设检验的一种方法,其基本步骤与假设检验一致。
(1) 提出原假设
单样本t检验的原假设H0为总体均值与检验值之间不存在显著差异,备选假设为它们之间存在差异(也可以根据实际研究目的,大于或者小于检验值,进行单侧检验)表述为:
H0:μ=μ0,H1:μ≠μ0 式中,μ为总体均值;μ0为检验值。
(2) 选择检验统计量
对单个总体均值的推断是建立在单个样本均值的基础上的,也就是希望利用样本均值去估计总体均值。当总体分布为正态分布N(μ,σ2)时,样本均值的抽样分布仍为正态分布,该正态分布的均值为μ,方差为σ2/n,即:~N(μ,σ2/n),
式中,μ为总体均值,当原假设成立时,μ=μ0;σ2为总体方差,n为样本量。若总体分布近似服从正态分布,当样本量n较大时,由中心极限定理得知样本均值也近似服从~N(μ,σ2/n)的正态分布。于是可构造Z检验统计量,Z统计量定义为:
——公式1
式中,Z统计量服从标准正态分布。通常总体方差是未知的,此时可以用样本方差S2替代,得到的检验统计量为t统计量,数学定义为:
——公式2
式中,t统计量服从有n-1个自由度的t分布。单样本t检验的检验统计量即为t统计量。当认为原假设成立时,μ用μ0代入。
(3) 计算检验统计量的观测值和概率P值
该步骤的目的是计算检验统计量的观测值和相应的概率P值。SPSS自动将样本均值、μ0、样本方差、样本量代入公式2,计算所得成为t统计量的观测值。同时,根据t统计量所服从的分布计算其对应的双侧概率P值。
(4) 给定显著水平α,并作出决策
给定显著水平α,与检验统计量的概率P值进行比较。双侧检验中,如果概率P值小于显著水平α,则应拒绝原假设,认为总体均值与检验值之间差异有统计学意义;反之,如果概率P值大于显著水平α,则不应拒绝原假设,认为总体均值与检验值之间差异无统计学意义。
3.单样本t检验的应用
以某市120名12岁男孩的身高数据为例。已知该地区12岁男孩的平均身高为142.5cm,问该市和该地区12岁男孩平均身高有否差异。(检验水准=0.05)。
该案例的假设检验可表述为:H0:μ=μ0=142.5,H1:μ≠μ0
本案例采用SPSS22版本统计分析软件进行单样本t检验,SPSS单样本t检验的操作步骤很简单,其操作步骤如下:
(1)先设置变量hight,导入数据;
(2)在导航栏选择 分析→比较均值→单样本t检验;
(3)弹出的窗口点向右箭头,导入检验变量,输入检验值142.5,确定;
单样本统计结果如下:
| 数字 | 平均值 | 标准偏差 | 标准误差平均值 | 12岁男生身高 | 120 | 143.048 | 5.8206 | .5313 | 单样本检验结果如下:
| t | 自由度 | 显著性(双尾) | 平方差 | 差值的95%置信区间
下限
| 差值的95%置信区间
上限
| 12岁男生身高 | 1.032 | 119 | .304 | .5483 | -.504 | 1.600 |
样本统计表给出了120个被调查的学生身高的平均值为143.048cm,标准差为5.8206cm。
单样本检验表给出了如下统计量:
(1) t统计量的观测值1.032,
(2) 自由度119(即n-1=120-1),
(3) t统计量观测值的双侧概率P值为0.304,
(4) 样本均值与原假设检验值的差0.5483,即t统计量的分子部分,它除以均值标准误的值即为t统计量的观测值。
(5) 总体均值与原假设值差的95%置信区间为(-0.504,1.6)cm,由此计算出总体均值的95%置信区间为(141.996,144.1)cm
比较α和P值,因为α=0.05,P-值=0.304>0.05,因此不应拒绝原假设,认为该市120名12岁男孩的平均身高与该地区12岁男孩的平均身高142.5cm无显著差异。95%的置信区间告诉我们有95%的把握认为该市120名12岁男孩的平均身高在141.996~144.1cm之间142.5cm包含在置信区间内,也证实了上述推断。
|
|