ID: 23223808

8.3.2 独立性检验 课件 (共29张PPT)

日期:2025-09-24 科目:数学 类型:高中课件 查看:86次 大小:1545216B 来源:二一课件通
预览图 1/9
8.3.2,独立性,检验,课件,29张,PPT
  • cover
(课件网) 温故知新: 1.分类变量: 用以区别不同的现象或性质的一种特殊的随机变量,称为分类变量.分类变量的取值可以用实数表示,例如,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示,等等. 2.列联表: 将形如下表这种形式的数据统计表称为2×2列联表.2×2列联表给出了成对分类变量数据的交叉分类频数. 组别 甲(Y=0) 乙(Y=1) 合计 A(X=0) a b a+b B(X=1) c d c+d 合计 a+c b+d a+b+c+d 8.3 列联表与独立性检验 8.3.2 独立性检验 前面我们通过2×2列联表整理成对分类变量的样本观测数据,并根据随机事件频率的稳定性推断两个分类变量之间是否有关联.对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大.因此需要找到一种更为合理的推断方法,同时也希望能对出现错误推断的概率有一定的控制或估算. 设X和Y为定义在以Ω为样本空间上,且取值于{0,1}的成对分类变量,则判断事件{X=1}和{Y=1}之间是否有关联,主要是看以下假定关系是否成立. 1.零假设或原假设: 在这里我们通常把H0称为零假设或原假设. 其中P(Y=1|X=0)表示从{X=0}中随机选一个样本点,该样本点属于{X=0,Y=1}的概率;P(Y=1|X=1)表示从{X=1}中随机选一个样本点,该样本点属于{X=1,Y=1}的概率. 由条件概率的定义可知,零假设H0等价于 零假设或原假设: 由于{X=0}和{X=1}为对立事件,故有 由此,零假设H0等价于{X=1}和{Y=1}独立. 由于下列四条性质彼此等价: {X=0}和{Y=0}独立;{X=0}和{Y=1}独立; {X=1}和{Y=0}独立;{X=1}和{Y=1}独立. 如果这些性质成立,我们就称分类变量X和Y独立. 这相当于下面四个等式成立: ② 因此,我们可以用概率语言,将零假设改述为 H0:分类变量X和Y独立. 思考:如何基于②中的四个等式及下列2×2列联表中的数据,构造适当的统计量,对成对分类变量X和Y是否相互独立作出推断 X Y 合计 Y=0 Y=1 X=0 a b a+b X=1 c d c+d 合计 a+c b+d a+b+c+d 则事件{X=0,Y=0}发生的频数的期望值(或预期值)为 所以如果零假设H0成立,下面四个量的取值都不应该太大: 反之,当这些量的取值较大时,就可以推断H0不成立. 显然,分别考虑上面四个差的绝对值很困难,我们需要找到一个既合理又能够计算分布的统计量,来推断H0是否成立. 一般来说,若频数的期望值较大,则差的绝对值也会较大;而若频数的期望值较小,则相应的差的绝对值也会较小. 为了合理地平衡这种影响,我们将四个差的绝对值取平方后分别除以相应的期望值再求和,得到如下的统计量: 该表达式可化简为: 上述表达式是χ2的计算公式,χ2读作“卡方”. X Y 合计 Y=0 Y=1 X=0 a b a+b X=1 c d c+d 合计 a+c b+d a+b+c+d 注:n=a+b+c+d 随机变量χ2取值的大小可作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立.那么,究竟χ2大到什么程度,可以推断H0不成立呢 或者说,怎样确定判断χ2大小的标准呢 小概率值α的临界值: 忽略χ2的实际分布与该近似分布的误差后,对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2 ≥xα)=α成立. 我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准,概率值α越小,临界值xα越大. 由P(χ2 ≥xα)=α可知,只要把概率值α取得充分小,在假设H0成立的情况下,事件{χ2 ≥xα}是不大可能发生的.根据这个规律,如果该事件发生,我们就可以推断H0不成立. χ2计算公式: 注:n=a+b+c+d 基于小概率值α的检验规则是: 当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α; 当χ2< ... ...

~~ 您好,已阅读到文档的结尾了 ~~