
8.3.2 独立性检验 学习目标 1.了解随机变量χ2的意义,通过对典型案例分析,掌握独立性检验的基本过程. 2.了解独立性检验的基本思想和方法. 情景引入 最新研究发现,花太多时间玩电脑游戏的儿童,患多动症的 风险会加倍.青少年的大脑会很快习惯闪烁的屏幕、变幻莫测的 电脑游戏,一旦如此,他们在教室等视觉刺激较少的地方,就很 难集中注意力.研究人员对1323名年龄在7岁到10岁的儿童进行 调查,并在孩子父母的帮助下记录了他们在13个月内玩电脑游戏的习惯,同时教师记下了这些孩子出现注意力不集中问题.统计获得下列数据: {5C22544A-7EE6-4342-B048-85BDC9FD1C3A} 注意力不集中 注意力集中 总计 不玩电脑游戏 268 357 625 玩电脑游戏 489 209 698 总计 757 566 1323 从这则新闻中可以得到哪些结论? 新知引入 新知学习 思考 设 X 和Y 为定义在以 Ω 为样本空间上,且取值于{0, 1} 的成对分类变量,如何判断事件 {X=1} 和 {Y=1} 之间是否有关联? {5C22544A-7EE6-4342-B048-85BDC9FD1C3A}X Y 合计 Y=0 Y=1 X=0 a b a+b X=1 c d c+d 合计 a+c b+d n=a+b+c+d 由条件概率的定义可知,零假设H0等价于: 事件A 事件B 事件AB 由此,零假设H0等价于{X=1}和{Y=1}独立. 我们需要判断下面的假定关系是否成立 H0: P(Y=1|X=0)=P(Y=1|X=1) 通常称H0为零假设或原假设 A与B相互独立 P(AB)=P(A)P(B) 新知引入 新知学习 思考 设 X 和Y 为定义在以 Ω 为样本空间上,且取值于{0, 1} 的成对分类变量,如何判断事件 {X=1} 和 {Y=1} 之间是否有关联? 根据已经学过的概率知识,下面的四条性质彼此等价: 零假设????0: {????=1}和{????=1}独立 ? {????=1}和{????=0}独立 ? {????=0}和{????=0}独立 ? {????=0}和{????=1}独立 ? 如果这4个性质成立, 则称分类变量 X 和 Y 独立. 零假设H0:分类变量X和Y独立 ② 我们可以用概率语言,将零假设改述为 假定我们通过简单随机抽样得到了X和Y的抽样数据的2×2列联表,如下表所示. {5C22544A-7EE6-4342-B048-85BDC9FD1C3A}X Y 合计 Y=0 Y=1 X=0 a b a+b X=1 c d c+d 合计 a+c b+d n=a+b+c+d ② 对于随机样本,表中的频数a, b, c, d 都是随机变量,而表中的相应数据是这些随机变量的一次观测结果. 新知学习 思考 如何基于②中的四个等式及列联表中的数据,构造适当的统计量,对成对分类变量X 和Y 是否相互独立作出推断? ② 在零假设H0成立的条件下,根据频率稳定于概率的原理, 由②中的第一个等式,可以得到 零假设H0:分类变量 X 和Y 独立 由频率估计概率,可以得到: {X=0,Y=0}发生的频数的期望值(预期值):E(a) 频数的观测值 如果零假设????0成立, 与 a 应该比较接近. ? 即: 的值应该不大 新知学习 综合②中的四个式子,如果零假设H0 成立,下面四个量的取值都不应该太大: 零假设H0:分类变量X和Y独立 ??????????????=|?????(????+????)(????+????)????| ? ??????????????=|?????(????+????)(????+????)????| ? ??????????????=|?????(????+????)(????+????)????| ? ??????????????=|?????(????+????)(????+????)????| ? 为了平衡各式的差值的变化,构造一个方便科学的统计量: 新知学习 卡方统计量 {5C22544A-7EE6-4342-B048-85BDC9FD1C3A}X Y 合计 Y=0 Y=1 X=0 a b a+b X=1 c d c+d 合计 a+c b+d n=a+b+c+d 追问1 卡方统计量有什么用呢? 统计学家建议,用随机变量 χ2取值 的大小作为判断零假设H0是否成立的依据。 如果零假设????0成立,则????2应该很小. ? 如果零假设????0不成立,则????2应该很大. ? 追问2 怎样确定判断????2大小的标准呢? ? 根据小概率事件在一次试验中不大可能发生的规律,可以通过确定一个与H0相矛盾的小概率事件来实现,在假定H0的条件下,对于有放回简单随机抽样,当 ... ...
~~ 您好,已阅读到文档的结尾了 ~~