4.3 独立性检验 【学习目标】 1.理解独立性检验的基本思想及其实施步骤.(数学抽象) 2.能利用列联表探讨两个分类变量的关系.(逻辑推理) 3.了解χ2的含义及其应用.(数学抽象) 4.通过对数据的处理,提高解决实际问题的能力.(数学运算) 【自主预习】 1.有人说:“在犯错误的概率不超过0.01的前提下认为吸烟和患肺癌有关,是指每100名吸烟者中就会有99名肺癌患者.”你认为这种观点正确吗 为什么 2.利用χ2进行独立性检验,估计值的准确度与样本容量有关吗 3.应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的吗 1.判断下列结论是否正确.(正确的打“√”,错误的打“×”) (1)列联表中的数据是两个分类变量的频数. ( ) (2)χ2是判断事件A与B是否相关的统计量. ( ) (3)独立性检验的思想类似于反证法. ( ) 2.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为 y1 y2 x1 10 18 x2 m 26 则当m取( )时,X与Y的关系最弱. A.8 B.9 C.14 D.19 3.某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中m= ,n= . 80分及80分以上 80分以下 合计 试验班 32 18 50 对照班 24 m 50 合计 56 44 n 【合作探究】 探究1 2×2列联表 问题1:吸烟与患肺癌之间的关系还是前面我们研究的线性相关关系吗 问题2:下表是2×2列联表. y1 y2 合计 x1 33 21 54 x2 a 13 46 合计 b 34 表中a,b处的值应为多少 新知生成 2×2列联表 YX 患肺癌(B) 未患肺癌() 合计 吸烟(A) a b a+b 不吸烟() c d c+d 合计 a+c b+d a+b+c+d 像上表这样,将两个(或两个以上)分类变量进行交叉分类得到的频数分布表称为列联表;称X,Y为分类变量,其中变量X有两个变量值———吸烟”和“不吸烟”,变量Y有两个变量值———患肺癌”和“未患肺癌”. 因为所涉及的两个分类变量X,Y均有两个变量值,所以称上表为2×2列联表. 新知运用 例1 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁及以上的有70人,六十岁以下的有54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的2×2列联表,并利用与判断二者是否有关系. 方法指导 先列2×2列联表,然后填写,再根据比值判断. 【方法总结】 1.作2×2列联表时,关键是对涉及的变量分清类别,计算时要准确无误.2.利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将与或与的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣. 假设有两个变量X和Y,他们的取值分别为x1,x2和y1,y2,其列联表为 YX y1 y2 合计 x1 a 21 73 x2 8 25 33 合计 b 46 106 则表中a,b的值分别是( ). A.94,96 B.54,52 C.52,50 D.52,60 探究2 独立性检验 为了解某高校学生中午午休时间玩手机的情况,随机抽取了100名大学生进行调查.下面是根据调查结果绘制的学生日均午休时玩手机时间的频率分布直方图,将日均午休时玩手机不低于40分钟的学生称为“手机控”. 问题1:请根据以上数据填写下列2×2列联表中的数据. 非手机控 手机控 合计 男 女 10 55 合计 100 问题2:如何判断“手机控”与性别是否有关系 问题3:能定量分析“手机控”与性别是否有关 新知生成 1.独立性检验的概念 利用统计量χ2来确定在多大程度上可以认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验. χ2=,其中n=a+b+c+d. 2.临界值如表所示: P(χ2≥ x0) 0.50 0.40 0.25 0.15 0.10 0.05 ... ...
~~ 您好,已阅读到文档的结尾了 ~~