(
课件网) 8.3.1 分类变量与列联表 人教A版(2019)选择性必修三 素养目标 1.通过对典型案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法,提升逻辑推理素养(重点) 2.了解独立性检验(只要求2×2列联表)的应用,提升数学运算能力(难点) 新课导入 1.就读不同学校是否对学生的成绩有影响? 2.不同班级学生用于体育锻炼的时间是否有差别? 3.吸烟是否会增加患肺癌的风险? 思考一下:思考下面的几个问题: 这些问题都是一定范围内的两种现象或性质之间是否存在关联性或相互影响的问题. 本节将要学习的独立性检验方法为我们提供了解决这类问题的方案. 新课学习 分类变量的概念 为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量. 分类变量的取值可以用实数表示,例如,学生所在的班级可以用 1,2,3 等表示,男性,女性可以用 1,0 表示,等等.在很多时候,这些数值只作为编号使用, 新课学习 思考一下:思考下面的问题: 为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查,全校学生的普查数据如下:523名女生中有331名经常锻炼;601名男生中有473名经常锻炼.你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗 新课学习 解法一:我们设 那么,只要求出 f0 和 f1 的值,通过比较这两个值的大小,就可以知道女生和男生在锻炼的经常性方面是否有差异.由所给的数据,经计算得到 由 f1-f0≈0.787-0.633=0.154 可知,男生经常锻炼的比率比女生高出15.4 个百分点,所以该校的女生和男生在体育锻炼的经常性方面有差异,而且男生更经常锻炼. 新课学习 解法二:用 Ω 表示该校全体学生构成的集合,这是我们所关心的对象的总体.考虑以 Ω 为样本空间的古典概型,并定义一对分类变量 X 和Y如下:对于 Ω 中的每一名学生,分别令 如果从该校女生和男生中各随机选取一名学生,那么该女生属于经常锻炼群体的概率是 P(Y=1∣X=0) ,而该男生属于经常锻炼群体的概率是P(Y=1∣X=1) . 因此,“性别对体育锻炼的经常性没有影响”可以描述为 P(Y=1∣X=0)=P(Y=1∣X=1); 新课学习 而“性别对体育锻炼的经常性有影响”可以描述为 P(Y=1∣X=0)≠P(Y=1∣X=1). 为了清楚起见,我们用表格整理数据,如下表所示. 性别 锻炼 合计 不经常(Y=0) 经常(Y=1) 女生(X=0) 192 331 523 男生(X=1) 128 473 601 合计 320 804 1124 新课学习 我们用 {X=0,Y=1} 表示事件 {X=0} 和 {Y=1} 的积事件,用 {X=1,Y=1} 表示事件 {X=1} 和 {Y=1} 的积事件.根据古典概型和条件概率的计算公式,我们有 由 P(Y=1∣X=1) 大于 P(Y=1∣X=0) 可以作出判断,在该校的学生中,性别对体育锻炼的经常性有影响,即该校的女生和男生在体育锻炼的经常性方面存在差异,而且男生更经常锻炼. 新课学习 2×2列联表 由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存.我们将下表这种形式的数据统计表称为 2×2 列联表 . X Y 合计 Y=0 Y=1 X=0 a b a+b X=1 c d c+d 合计 a+c b+d n=a+b+c+d 新课学习 2×2列联表表示的意义 2×2 列联表给出了成对分类变量数据的交叉分类频数. 以上表为例,它包含了X 和Y的如下信息:最后一行的前两个数分别是事件{Y=0}和{Y=1} 中样本点的个数;最后一列的前两个数分别是事件{X=0} 和 {X=1} 中样本点的个数;中间的四个格中的数是表格的核心部分,给出了事件{X=x,Y=y} (x,y=0,1) 中样本点的个数;右下角格中的数是样本空间中样本点的总数. 新课学习 统计案例常用方法 ... ...