
4.3 独立性检验 第1课时 通过实例,理解2×2列联表的统计意义. ·课前预习 要点一 列联表 1.定义:将两个(或两个以上) 分类变量 进行交叉分类得到的频数分布表称为列联表. 2.2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为: 要点二 独立性检验 利用统计量χ2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为独立性检验. χ2=,其中n=a+b+c+d. 当χ2的取值较大时,表示假设H0不成立 .一般地,若χ2的观测值x0≥6.635,说明H0不成立,从而认为两个分类变量有关系,这种推断犯错误的概率不超过0.01. 基 础 自 测 1.判断正误(正确的画“√”,错误的画“×”) (1)列联表中的数据是两个事件的频数.( ) (2)事件A与B的独立性检验无关,即两个事件互不影响.( ) (3)χ2的大小是判断事件A与B是否相关的统计量.( ) 2.为调查中学生近视情况,测得某校150名男生中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力( ) A.回归分析 B.均值与方差 C.独立性检验 D.概率 3.在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是( ) A.吸烟,不吸烟 B.患病,不患病 C.是否吸烟,是否患病 D.以上都不对 4.下面是一个2×2列联表,则表中a处的值为_____. y1 y2 合计 x1 a b 73 x2 2 25 c 合计 d 46 题型探究·课堂解透———强化创新性 题型1 随机变量χ2的意义 例1 关于随机变量χ2的叙述,下列说法错误的是( ) A.χ2是一个不连续的随机变量 B.χ2的观测值越大,说明两分类变量X与Y的关系越强 C.χ2的观测值越大,说明“两分类变量X与Y有关系”这一结论的可信度越大 D.当χ2的观测值接近0时,应该接受“两个分类变量X与Y无关”这一假设 巩固训练1 对于分类变量X与Y的随机变量χ2的值,下列说法正确的是( ) A.χ2越大,“X与Y有关系”的可信程度越小 B.χ2越小,“X与Y有关系”的可信程度越小 C.χ2越接近于0,“X与Y没有关系”的可信程度越小 D.χ2越大,“X与Y没有关系”的可信程度越大 题型2 随机变量χ2的应用 例2 某中学为了解2022届高二学生的性别和喜爱游泳是否有关,对100名高二学生进行了问卷调查,得到如下列联表: 喜欢游泳 不喜欢游泳 总计 男生 10 女生 20 总计 已知从这100人中随机抽取1人,抽到喜欢游泳的学生的概率为. (1)请将上述列联表补充完整; (2)试根据上述数据判断“喜欢游泳”与“性别”是否有关系. 方法归纳 利用χ2判断两个分类变量是否有关系的步骤 巩固训练2 为了解高中生作文水平与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到如下调查结果: 作文水平较高 作文水平一般 合计 课外阅读量较大 22 10 32 课外阅读量一般 8 20 28 合计 30 30 60 试根据上述数据判断“作文水平”与“课外阅读量”是否有关系. 第1课时 [基础自测] 1.(1)√ (2)× (3)√ 2.解析:“近视”与“性别”是两个分类变量,检验其是否有关,应用独立性检验判断.故选C. 答案:C 3.解析:“是否吸烟”是分类变量,它的两个不同取值:吸烟和不吸烟.“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知A,B都是一个分类变量所取的两个不同值.故选C. 答案:C 4.解析:依题意得b=46-25=21,a=73-b=52. 答案:52 题型探究·课堂解透 例1 解析:两个分类变量取值是离散的,所以χ2的观测值越大,“X与Y有关系”这一结论的可信度越大,而不是“两分类变量X与Y有关系”的程度越大,故选C. 答案:C 巩固训练1 解析:根据独立性检验的基本思想可知,分类变量X与Y的随机变量χ2的观测值越大,“X与Y没有关 ... ...
~~ 您好,已阅读到文档的结尾了 ~~