(
课件网) 9.2 独立性检验 必备知识 清单破 假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为 知识点 1 2×2列联表 Y y1 y2 合计 X x1 a b a+b x2 c d c+d 合计 a+c b+d a+b+c+d 2×2列联表给出了成对分类变量数据的交叉分类频数. 1.χ2公式 一般地,对于两个分类变量Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B(如吸烟与不吸烟);Ⅱ也有 两类取值,即类1和类2(如患呼吸道疾病和未患呼吸道疾病).我们得到字母表示的2×2列联表: 知识点 2 与独立性检验相关的概念 Ⅱ 类1 类2 合计 Ⅰ 类A a b a+b 类B c d c+d 合计 a+c b+d a+b+c+d 记n=a+b+c+d,则χ2= . 2.独立性检验 用χ2统计量研究两类变量是否有关的方法称为独立性检验. 1.要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行: (1)提出假设H0:Ⅰ与Ⅱ没有关系; (2)根据2×2列联表与χ2= 计算χ2的值; (3)根据临界值(如下表所示),做出判断. 知识点3 独立性检验的思想 P(χ2≥x0) 0.50 0.40 0.25 0.15 0.10 x0 0.455 0.708 1.323 2.072 2.706 P(χ2≥x0) 0.05 0.025 0.010 0.005 0.001 x0 3.841 5.024 6.635 7.879 10.828 2.常用检验结论 (1)若χ2>10.828,则有99.9%的把握认为“Ⅰ与Ⅱ有关系”; (2)若χ2>6.635,则有99%的把握认为“Ⅰ与Ⅱ有关系”; (3)若χ2>2.706,则有90%的把握认为“Ⅰ与Ⅱ有关系”; (4)若χ2≤2.706,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能得出结论“H0成 立”,即Ⅰ与Ⅱ没有关系. 知识辨析 1.分类变量中的变量与函数中的变量是同一概念吗 2.独立性检验得出的结论是确定的吗 3.若事件A与B经独立性检验后得到结论“A与B无关”,则这两个事件是不是互不影响 一语破的 1.不是.变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量,有时可以 把分类变量的不同取值用数字表示,但这时的数字除了分类以外没有其他含义,而函数中的 变量分为自变量与因变量,都是数的集合,有它们各自的意义. 2.不是.因为列联表中的数据是样本数据,它只是总体的代表,具有随机性,所以独立性检验得 出的结论不是确定的. 3.不是.只能说明“A与B无关”这一结论犯错误的可能性很小. 关键能力 定点破 独立性检验的关注点 在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,事实上,|ad-bc|越小,两个 分类变量的关系越弱;|ad-bc|越大,两个分类变量的关系越强. 定点 1 由χ2进行独立性检验 典例1 为了研究经常使用手机是否对数学学习成绩有影响,某校高二数学学习小组进行了调 查,随机抽取高二年级50名学生的一次数学单元测试成绩,并制成下面的2×2列联表: 及格 不及格 合计 很少使用手机 20 5 25 经常使用手机 10 15 25 合计 30 20 50 参考公式:χ2= ,其中n=a+b+c+d. 附表: P(χ2≥x0) 0.05 0.025 0.010 0.005 0.001 x0 3.841 5.024 6.635 7.879 10.828 参照附表,得到的正确结论是 ( ) A.有99.9%以上的把握认为“经常使用手机与数学学习成绩无关” B.有99.9%以上的把握认为“经常使用手机与数学学习成绩有关” C.在犯错误的概率不超过0.5%的前提下,认为“经常使用手机与数学学习成绩无关” D.在犯错误的概率不超过0.5%的前提下,认为“经常使用手机与数学学习成绩有关” D 解析 提出假设H0:经常使用手机与数学学习成绩无关.由题中数据可得,χ2= = ≈8.333, 因为当H0成立时,χ2>7.879的概率约为0.005,所以有99.5%的把握认为“经常使用手机与数学 学习成绩有关”,即在犯错误的概率不超过0.5%的前提下,认为“经常使用手机与数学学习 成绩有关”.故选D. 典例2 有甲、乙两个班级共计105人进行数学考试,按照大于或等于85分为优秀,85分以下为 非优秀统计成绩,得到下表: 优秀 非优 ... ...