[学习目标] 1.掌握分类变量和列联表的概念,并会依据列联表判断两个分类变量是否独立.2.理解统计量χ2的意义和独立性检验的基本思想. 一、2×2列联表 问题 某医疗机构为了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中,有37人患呼吸道疾病(以下简称患病),183人未患呼吸道疾病(以下简称未患病);不吸烟的295人中,有21人患病,274人未患病. 根据这些数据能否断定:患呼吸道疾病与吸烟有关? 知识梳理 2×2列联表 Y X B1 B2 合计 A1 a b a+b A2 c d c+d 合计 a+c b+d a+b+c+d 像上表这样,将两个(或两个以上)分类变量进行交叉分类得到的频数分布表称为列联表. 由于所涉及的两个分类变量X,Y均有两个变量值,所以称上表为2×2列联表. 例1 在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,试作出性别与色盲的列联表. 反思感悟 2×2列联表是对两个分类变量的汇总统计表,列表时关键是对涉及的变量分清类别. 制作2×2列联表的基本步骤: 第一步,合理选取两个变量,且每一个变量都可以取两个值; 第二步,抽取样本,整理数据; 第三步,画出2×2列联表. 跟踪训练1 某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中m= ,n= . 80分及80分以上 80分以下 合计 试验班 32 18 50 对照班 24 m 50 合计 56 44 n 二、独立性检验 知识梳理 1.独立性检验 (1)定义 利用统计量χ2来确定在多大程度上可以认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验. (2)χ2的计算公式 χ2= 其中n= . 2.独立性检验的步骤 要推断“X与Y有关系”,可按下面的步骤进行: (1)提出统计假设H0:X与Y没有关系; (2)根据2×2列联表及χ2公式,计算χ2的观测值; (3)查临界值表确定临界值x0,然后作出判断. 其中临界值如表所示: P(χ2≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 例如: (1)如果χ2>10.828,就有不少于99.9%的把握认为“X与Y之间有关系”; (2)如果χ2>6.635,就有不少于99%的把握认为“X与Y之间有关系”; (3)如果χ2>3.841,就有不少于95%的把握认为“X与Y之间有关系”, 如果χ2≤3.841,就认为还没有充分的证据显示“X与Y之间有关系”. 例2 (1)在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是( ) A.若χ2的值大于6.635,则有99%的把握认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患肺癌 B.由独立性检验可知,有99%的把握认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺癌 C.若从统计量中求出有99%的把握认为吸烟与患肺癌有关系,是指有不超过1%的可能性使得判断出现错误 D.以上三种说法都不正确 (2)某校对学生课外活动进行调查,结果整理成下表,能否作出喜欢体育还是喜欢文娱与性别有关的结论? 喜欢体育 喜欢文娱 合计 男 21 23 44 女 6 29 35 合计 27 52 79 附: P(χ2≥x0) 0.050 0.010 0.005 0.001 x0 3.841 6.635 7.879 10.828 χ2=. 反思感悟 要推断X与Y是否有关系,可按下面的步骤进行: (1)提出统计假设H0:X与Y无关; (2)根据2×2列联表与χ2公式计算χ2的观测值; (3)把计算结果与3.841进行比较,然后作出判断. 跟踪训练2 学校举行运动会,为了做好接待工作,组委会招募了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余人不喜爱运动. (1)根据以上数据完成以下2×2列联表: ... ...