8.3 列联表与独立性检验(强基课梯度进阶式教学) 课时目标 通过实例,理解2×2列联表的统计意义;通过实例,了解独立性检验及其应用. 1.分类变量与列联表 (1)分类变量 用以区别不同的 或 的一种特殊的随机变量,称为分类变量.分类变量的取值可以用实数表示,例如,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示,等等. (2)2×2列联表 组别 甲(Y=0) 乙(Y=1) 合计 A(X=0) a b B(X=1) c d 合计 这种形式的数据统计表称为2×2列联表.2×2列联表给出了成对分类变量数据的交叉分类频数. (3)等高堆积条形图:将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高堆积条形图. 等高堆积条形图可以展示列联表数据的频率特征,能够直观地反映出两个分类变量间是否相互影响. 2.独立性检验 (1)分类变量X和Y独立:如果下面这些性质成立, {X=0}与{Y=0}独立;{X=0}与{Y=1}独立; {X=1}与{Y=0}独立;{X=1}与{Y=1}独立. 我们就称分类变量X和Y独立. (2)独立性检验 ①小概率值α的临界值:忽略χ2的实际分布与该近似分布的误差后,对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α,我们称xα为α的临界值,这个临界值可作为判断χ2大小的标准.概率值α越小,临界值xα越大. ②χ2的计算公式: χ2=. ③独立性检验:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验. ④基于小概率值α的检验规则是: 当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2
~~ 您好,已阅读到文档的结尾了 ~~