# 假设检验基础
假设是关于总体参数的声明或断言
# 零假设 (原假设)
假设检验从假定零假设为真开始.
零假设表示现状或历史值
包含 , 或 符号
可能会或不会被拒绝
例:美国家庭平均拥有的电视机数量等于 3
注意: 是关于总体参数,而不是样本参数,
即,不是
# 备择假设
与零假设是对立的
永远不包含 , 或 符号
例:美国家庭平均拥有电视机数量不等于 3
# 检验统计量和临界值
# 假设检验决策的可能错误
# 第一类错误 Type I Error
- 拒绝了一个为真的零假设
- 被认为是一类严重的错误
- 第一类错误的概率为
- 称为统计检验的显著性水平
- 由研究者事先确定
# 第二类错误 Type II Error
- 没有拒绝错误的零假设
- 第二类错误的概率是
# 相关术语
置信系数 Confidence Coefficient (): 在零假设为真的情况下,没有拒绝 H0 的概率.
置信水平 Confidence Level :
统计检验能力 The power of a statistical test (): 当零假设为假时,H0 被拒绝的概率.
# 假设检验过程 6 步法
- 写出零假设 以及备择假设
- 选择显著性水平 以及样本容量
- 确定合适的检验统计量和样本分布
- 找出将拒绝域和非拒绝域分开的临界值
- 收集数据并计算检验统计量的值
- 作出统计决策并给出管理性结论
- 如果检验统计量落在非拒绝域,则不拒绝 .
- 如果检验统计量落在拒绝域,则拒绝 .
- 根据实际问题表达管理性结论.
例:假设检验过程
检验所宣称的美国家庭电视平均拥有量均值等于 3. (假定 )
- 给出合适的零假设和备择假设
- (双尾检验)
- 确定显著性水平和样本容量
- 假定
- 确定合适的决策方法
- 假设已知,因此采用 Z 检验.
- 确定临界值
- ,则 临界值为
- 收集数据并计算检验统计量
- 假定样本结果为 (,假定为已知)
- 因此,检验统计量为
- 作出统计决策并给出管理性结论
- , 因此检验统计量是落在拒绝域,拒绝零假设并得出结论:有足够的证据表明美国家庭平均电视数量不等于 3
# 假设检验的 p - 值法
p - 值 p-value : 是在 H0 为真的情况下,使得到的检验统计量等于或大于样本结果的概率。也被称为观察到的显著性水平
- 如果 p-value < , 拒绝 H0
- 如果 p-value , 不拒绝 H0
- 给出零假设 以及备择假设
- 选择显著性水平 以及样本容量
- 确定合适的检验统计量和样本分布
- 收集数据,并计算检验统计量的值和
p-value - 作出统计决策并给出管理性结论.
- 如果 p-value < α ,则拒绝 H0, 否则不拒绝 H0.
- 根据实际问题说明管理性结论.
例:假设检验 p-值法过程
检验所宣称的美国家庭电视平均拥有量均值等于 3. (假定 )
- 给出合适的零假设和备择假设
- (双尾检验)
- 确定显著性水平和样本容量
- 假定
- 确定合适的决策方法
- 假设已知,因此采用 Z 检验.
- 收集数据并计算检验统计量
- 假定样本结果为 (,假定为已知)
- 因此,检验统计量为
- 因此,p - 值为
- 作出统计决策并给出管理性结论
- , 因此检验统计量是落在拒绝域,拒绝零假设并得出结论:有足够的证据表明美国家庭平均电视数量不等于 3