# 假设检验基础

假设是关于总体参数的声明或断言

# 零假设 (原假设) H0H_0

假设检验从假定零假设为真开始.

零假设表示现状或历史值

包含 == , \leq\geq 符号

可能会或不会被拒绝

例:美国家庭平均拥有的电视机数量等于 3
H0:μ=3H_0: \mu = 3
注意: 是关于总体参数,而不是样本参数,
即,不是 H0:X=3H_0: \overline{X} = 3

# 备择假设 H1H_1

与零假设是对立的

永远不包含 == , \leq\geq 符号

例:美国家庭平均拥有电视机数量不等于 3
H1:μ3H_1: \mu \neq 3

# 检验统计量和临界值

# 假设检验决策的可能错误

# 第一类错误 Type I Error

  • 拒绝了一个为真的零假设
  • 被认为是一类严重的错误
  • 第一类错误的概率为 α\alpha
    • 称为统计检验的显著性水平
    • 由研究者事先确定

# 第二类错误 Type II Error

  • 没有拒绝错误的零假设
  • 第二类错误的概率是 β\beta

# 相关术语

置信系数 Confidence Coefficient (1α1-\alpha): 在零假设为真的情况下,没有拒绝 H0 的概率.
置信水平 Confidence Level : (1α)×100(1-\alpha) \times 100 %
统计检验能力 The power of a statistical test (1β1-\beta): 当零假设为假时,H0 被拒绝的概率.

# 假设检验过程 6 步法

  1. 写出零假设 H0H_0 以及备择假设 H1H_1
  2. 选择显著性水平 α\alpha 以及样本容量 nn
  3. 确定合适的检验统计量和样本分布
  4. 找出将拒绝域和非拒绝域分开的临界值
  5. 收集数据并计算检验统计量的值
  6. 作出统计决策并给出管理性结论
    • 如果检验统计量落在非拒绝域,则不拒绝 H0H_0.
    • 如果检验统计量落在拒绝域,则拒绝 H0H_0.
    • 根据实际问题表达管理性结论.
例:假设检验过程

检验所宣称的美国家庭电视平均拥有量均值等于 3. (假定 σ=0.8\sigma = 0.8)

  1. 给出合适的零假设和备择假设
    • H0:μ=3;H1:μ3H_0: \mu = 3; H_1: \mu \neq 3 (双尾检验)
  2. 确定显著性水平和样本容量
    • 假定 α=0.05,n=100\alpha = 0.05, n = 100
  3. 确定合适的决策方法
    • σ\sigma 假设已知,因此采用 Z 检验.
  4. 确定临界值
    • α=0.05\alpha = 0.05,则 临界值为 ±1.96\pm 1.96
  5. 收集数据并计算检验统计量
    • 假定样本结果为 n=100,X=2.84n = 100, \overline{X} = 2.84 (σ=0.8\sigma = 0.8,假定为已知)
    • 因此,检验统计量为

      ZSTAT=Xμσ/n=2.8430.8/100=0.160.08=2.0\begin {aligned} Z_{STAT} &= \frac{\overline{X} - \mu}{\sigma / \sqrt{n}} \\ &= \frac{2.84 - 3}{0.8 / \sqrt{100}} \\ &= \frac{-0.16}{0.08} = -2.0 \end {aligned}

  6. 作出统计决策并给出管理性结论
    • ZSTAT=2.0<1.96Z_{STAT} = -2.0 < -1.96, 因此检验统计量是落在拒绝域,拒绝零假设并得出结论:有足够的证据表明美国家庭平均电视数量不等于 3

# 假设检验的 p - 值法

p - 值 p-value : 是在 H0 为真的情况下,使得到的检验统计量等于或大于样本结果的概率。也被称为观察到的显著性水平

  • 如果 p-value < α\alpha, 拒绝 H0
  • 如果 p-value α\alpha, 不拒绝 H0
  1. 给出零假设 H0H_0 以及备择假设 H1H_1
  2. 选择显著性水平 α\alpha 以及样本容量 nn
  3. 确定合适的检验统计量和样本分布
  4. 收集数据,并计算检验统计量的值和 p-value
  5. 作出统计决策并给出管理性结论.
    • 如果 p-value < α ,则拒绝 H0, 否则不拒绝 H0.
    • 根据实际问题说明管理性结论.
例:假设检验 p-值法过程

检验所宣称的美国家庭电视平均拥有量均值等于 3. (假定 σ=0.8\sigma = 0.8)

  1. 给出合适的零假设和备择假设
    • H0:μ=3;H1:μ3H_0: \mu = 3; H_1: \mu \neq 3 (双尾检验)
  2. 确定显著性水平和样本容量
    • 假定 α=0.05,n=100\alpha = 0.05, n = 100
  3. 确定合适的决策方法
    • σ\sigma 假设已知,因此采用 Z 检验.
  4. 收集数据并计算检验统计量
    • 假定样本结果为 n=100,X=2.84n = 100, \overline{X} = 2.84 (σ=0.8\sigma = 0.8,假定为已知)
    • 因此,检验统计量为

      ZSTAT=Xμσ/n=2.8430.8/100=0.160.08=2.0\begin {aligned} Z_{STAT} &= \frac{\overline{X} - \mu}{\sigma / \sqrt{n}} \\ &= \frac{2.84 - 3}{0.8 / \sqrt{100}} \\ &= \frac{-0.16}{0.08} = -2.0 \end {aligned}

    • 因此,p - 值为

      p-value=P(Z<2.0)+P(Z>2.0)=0.0228+0.0228=0.0456\text{p-value} = P(Z < -2.0) + P(Z > -2.0) = 0.0228 + 0.0228 = 0.0456

  5. 作出统计决策并给出管理性结论
    • p-value=0.0456<α=0.05\text{p-value} = 0.0456 < \alpha = 0.05, 因此检验统计量是落在拒绝域,拒绝零假设并得出结论:有足够的证据表明美国家庭平均电视数量不等于 3
更新于

请我喝[茶]~( ̄▽ ̄)~*

梦前辈 微信支付

微信支付

梦前辈 支付宝

支付宝