(
课件网) 成对数据 本章导览 相关性 2X2列联表 样本相关系数 一元线性回归模型 独立性检验 数值变量 分类变量 复习回顾 一、分类变量 用以区别不同的现象或性质的一种特殊的随机变量,称为分类变量.分类变量的取值可以用实数表示,例如,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示,等等. 二、列联表 将形如下表这种形式的数据统计表称为2×2列联表. 2×2列联表给出了成对分类变量数据的交叉分类频数. 复习回顾 问题1:你认为“两校学生的数学成绩优秀率存在差异”这一结论是否有可能是错误的? 这个结论是根据两个频率间存在差异推断出来的.有可能出现这种情况: 在随机抽取的这个样本中,两个频率间确实存在差异,但两校学生的数学成绩优秀率实际上是没有差别的. 对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差, 所以我们的推断可能犯错误,而且样本容量较小时,犯错误的可能性会较大. 因此,需要找到一种更为合理的推断方法,同时也希望能对出现错误推断的概率有一定的控制或估算. 独立性检验方法 数学人教A版 选择性必修第三册 第八章 成对数据的统计分析 8.3.2 独立性检验 探究新知 问题2:你知道法官是如何凭证据进行判案的吗? 类比 追问: 我们是否可以类比法官判案的方式去判断两个分类变量是否有关联? 探究新知 问题3:设和为定义在以为样本空间上,且取值于{0, 1}的成对分类变量,如何判断事件和之间是否有关联? 我们需要判断下面的假定关系是否成立 ) 通常称为零假设或原假设. 由条件概率的定义可知,零假设等价于: 和独立 探究新知 问题3:设和为定义在以为样本空间上,且取值于{0, 1}的成对分类变量,如何判断事件和之间是否有关联? 根据已经学过的概率知识,下面的四条性质彼此等价: 和独立 和独立 和独立 和独立 如果这些性质成立, 则称分类变量和独立. 零假设:分类变量和独立 探究新知 问题4:如何基于上述四个等式及列联表中的数据,构造适当的统计量,对成对分类变量和是否相互独立作出推断 零假设:分类变量和独立 假定零假设成立,由 可以得到: 探究新知 零假设:分类变量和独立 为了平衡各式的差值的变化,构造一个方便科学的统计量: 概念生成 一、卡方统计量: 追问1:卡方统计量有什么用呢? 统计学家建议,用随机变量 取值的大小作为判断零假设是否成立的依据。 如果零假设成立,则 应该很小; 如果零假设不成立,则 应该很大. 概念生成 追问2:怎样确定判断 大小的标准呢? 根据小概率事件在一次试验中不大可能发生的规律,可以通过确定一个与相矛盾的小概率事件来实现,在假定的条件下,对于有放回简单随机抽样,当样本容量充分大时,统计学家得到了 的近似分布. 忽略 的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得下面关系成立: 我们称为的临界值,这个临界值就可以作为判断 大小的标准. 显然概率值越小,临界值越大. 归纳总结 基于小概率值的检验规则: 下表给出了 独立性检验中几个常用的小概率值和相应的临界值: 概念生成 二、卡方独立性检验: 这种利用 的取值推断分类变量和是否独立的方法称为 独立性检验,读作“卡方独立性检验”,简称独立性检验。 例2. 依据小概率值的 独立性检验,分析例1中的抽样数据, 能否据此推断两校学生的数学成绩优秀率有差异? 例题讲解 问题5:例1和例2都是基于同一组数据的分析,但却得出了不同的结论, 你能说明其中的原因吗? 例题讲解 例3. 某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈5 ... ...