
8.3.1 分类变量与列联表 1.了解 探究分类变量之间关系的方法 2.制作、理解 2×2列联表,用频率分析法、图形分析法探究两个分类变量之间的关系 3.能够对统计数据进行简单整理、初步分析提升数学抽象、数据建模及数据分析素养 学习目标 情景引入 有关法律规定:香烟盒上必须印上“吸烟有害健康”的警示语. 吸烟已成为全球范围内严重危害健康、危害人类生存环境、降低人们的生活质量、缩短人类寿命的紧迫问题.为此,联合国固定每年5月31日为全球戒烟日. 例如:2019年世界无烟日的重点是“烟草和肺部健康”. 吸烟和健康之间有因果关系吗?每一个吸烟者的健康问题都是由吸烟引起的吗?如果你认为“健康问题不一定是由吸烟引起的,那么可以吸烟”的说法对吗? 新知引入 新知学习 变量 数值变量 分类变量 例:人的身高;100米短跑所用时间;产品月销量 数值变量的取值为实数.其大小和运算都有实际含义. 两个数值变量之间的关系:回归分析法; 如何利用统计数据判断一对分类变量之间是否具有关联性呢? 思路点拨 对于这样的统计问题,有时可以利用普查数据,通过比较相关的比率给出问题的准确回答,但在大多数情况下,需要借助概率的观点和方法. 例:班级;性别;是否经常锻炼;是否每年体检 分类变量的取值可以用实数来表示; 这些数值只作为编号使用,用来表示不同的类别; 并没有通常的大小和运算意义 例如,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示 1.是否吸烟、是否患肺癌是什么变量? 2.下列不是分类变量的是( ) A.近视 B.成绩 C.血压 D.饮酒 练一练 分类变量 提示:近视变量有近视与不近视两种类别,血压变量有异常、正常两种类别,饮酒变量有饮酒与不饮酒两种类别.故选B. B 新知引入 新知学习 思考 为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查.全校学生的普查数据如下:523名女生中有331名经常锻炼;601名男生中有473名经常锻炼.你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗? 方法1———由频率估计概率 设????0=经常锻炼的女生数女生总数≈0.633,????1=经常锻炼的男生数男生总数≈0.787. ? 由????1?????0≈0.787?0.633=0.154,可知,男生经常锻炼的比率比女生高出15.4个百分点, ? 所以该校的女生和男生在体育锻炼的经常性方面有差异,而且男生更经常锻炼. 方法2———借助条件概率 建立以????为样本空间的古典概型,并定义一对分类变量????和????如下:对于????中的每一名学生,分别令 ? 思考 为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查.全校学生的普查数据如下:523名女生中有331名经常锻炼;601名男生中有473名经常锻炼.你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗? 若从该校女生和男生中各随机选取一名学生,那么该女生属于经常锻炼群体的概率为 而该男生属于经常锻炼群体的概率为 {5C22544A-7EE6-4342-B048-85BDC9FD1C3A}性别 锻炼 合计 不经常(Y=0) 经常(Y=1) 女生(X=0) 192 331 523 男生(X=1) 128 473 601 合计 320 804 1124 新知学习 性别对体育锻炼的经常性没有影响: 性别对体育锻炼的经常性有影响: {X=0, Y=1}:事件{X=0}和{Y=1}的积事件; {X=1, Y=1}:事件{X=1}和{Y=1}的积事件 结论:该校的女生和男生在体育锻炼的经常性方面存在差异,男生更经常锻炼。 根据条件概率的计算公式,我们有????(????=1|????=0)=????(????=0,????=1)????(????=0)=331523≈0.633, ????(????=1|????=1)=????(????=1,????= ... ...
~~ 您好,已阅读到文档的结尾了 ~~