ID: 25255985

8.3.1 分类变量与列联表 课件(共41张PPT)

日期:2026-04-01 科目:数学 类型:高中课件 查看:49次 大小:25125875B 来源:二一课件通
预览图 1/12
8.3.1,分类,变量,列联,课件,41张
  • cover
(课件网) ·选择性必修第三册· 第八章 成对数据的统计分析 8.3.1 分类变量与列联表 学习目标 1.了解 探究分类变量之间关系的方法 2.制作、理解 2×2列联表,用频率分析法、图形分析法探究两个分类变量之间的关系(重点) 3.能够对统计数据进行简单整理、初步分析提升数学抽象、数据建模及数据分析素养(难点) 情景导入 8.3.1 分类变量与列联表 01 创设背景,引入新知 吸烟是否会增加患肺癌的风险? 吸烟已成为全球范围内严重危害健康、危害人类生存环境、降低人们的生活质量、缩短人类寿命的紧迫问题.为此,联合国固定每年5月31日为全球戒烟日. 创设背景,引入新知 变量 数值变量 分类变量 例:人的身高;100米短跑所用时间;产品月销量 数值变量的取值为实数.其大小和运算都有实际含义. 两个数值变量之间的关系:回归分析法; 例:班级;性别;是否经常锻炼;是否每年体检 分类变量的取值可以用实数来表示; 这些数值只作为编号使用,用来表示不同的类别;并没有通 常的大小和运算意义.例如,学生所在的班级可以用1,2,3等表示, 男性、女性可以用1,0表示 如何利用统计数据判断一对分类变量之间是否具有关联性呢?对于这样的统计问题,有时可以利用普查数据,通过比较相关的比率给出问题的准确回答,但在大多数情况下,需要借助概率的观点和方法.我们先看下面的具体问题. 分类变量与列联表 8.3.1 分类变量与列联表 02 探究新知 某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查.全校学生的普查数据如下:523名女生中有331名经常锻炼;601名男生中有473名经常锻炼.你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗? 方法1———由频率估计概率 设,. 由可知,男生经常锻炼的比率比女生 高出个百分点,所以该校的女生和男生在体育锻炼的经常性方面 有差异,而且男生更经常锻炼. 问题 探究新知 方法2———借助条件概率 建立以为样本空间的古典概型,并定义一对分类变量和如下:对于中的每一名学生,分别令 为了清楚起见, 我们用表格整理数据 性别 锻炼 合计 不经常(Y=0) 经常(Y=1) 女生(X=0) 192 331 523 男生(X=1) 128 473 601 合计 320 804 1124 探究新知 根据条件概率的计算公式,我们有 由大于可以作出判断,在该校的学生中,性别对体育锻炼的经常性有影响,即该校的女生和男生在体育锻炼的经常性方面存在差异,而且男生更经常锻炼. 探究新知 方法3———借助等高堆积条形图 通过比较发现,男生与女生经常锻炼的人生存在差异,男生经常锻炼的的频率高于女生经常锻炼的人数. 依据频率稳定于概率的原理,我们可以推断.因此,该校的女生和男生在体育锻炼的经常性方面存在差异,而且男生更经常锻炼. 性别 锻炼 合计 不经常(Y=0) 经常(Y=1) 女生(X=0) 192 331 523 男生(X=1) 128 473 601 合计 320 804 1124 探究新知 2×2列联表 在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存. 我们将形如下表这种形式的数据统计表称为2×2列联表. 2×2列联表给出了成对分类变量数据的交叉分类频数. 组别 甲(Y=0) 乙(Y=1) 合计 A(X=0) a b a+b B(X=1) c d c+d 合计 a+c b+d a+b+c+d 应用新知 例1.为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测验得到了如下数据: 甲校43名学生中有10 名数学成绩优秀;乙校45名学生中有7名数学成绩优秀. 试分析两校学生中数学成绩优秀率之间是否存在差异. 解:用表示两所学校的全体学生构成的集合.考虑以为样本空间的古典概型.对于中每一名学生,定义分类变量和 ... ...

~~ 您好,已阅读到文档的结尾了 ~~