(
课件网) 8.3.2 独立性检验 第八章 成对数据的统计分析 数学 1.基于2×2列联表,能通过实例,解释独立性检验的基本思想,归纳出独立性检验的基本步骤.(重点) 学习目标 2.能用独立性检验的思想和步骤解决简单的实际问题,提升数据分析能力(难点). 课堂导入 例1: 学校 数学成绩 合计 不优秀( =0) 优秀( =1) 甲校( =0) 33 10 43 乙校( =1) 38 7 45 合计 71 17 88 推断:两校学生的数学成绩优秀率存在差异. 不足:频率具有随机性. (频率稳定于概率) 课堂探究 通过频率比较,例1的推断:“两校学生的数学成绩优秀率存在差异”可能是错误的. 犯错误的概率有多大 如何从概率的角度去研究两个分类变量 与 是否有关联 合计 =0 =1 =0 a b a+b =1 c d c+d 合计 a+c b+d n=a+b+c+d 概率语言表示 类似反证法 2×2列联表: 二选一 课堂探究 课堂探究 课堂探究 课堂探究 合计 =0 =1 =0 a b a+b =1 c d c+d 合计 a+c b+d n=a+b+c+d (依据频率稳定于概率的原理) 零假设H0:分类变量 与 独立 问题:构造一个怎样的统计量,可以判断两个变量 和 是否有关联呢 课堂探究 零假设H0:分类变量 与 独立: 事件 观测值 期望值 观测值与期望值差 =0, =0 a =0, =1 b =1, =0 c =1, =1 d 残差 课堂探究 零假设H0:分类变量 与 独立: 取值均不大 反之,这些量取值较大时,就可以推断H0不成立. 课堂探究 零假设H0:分类变量 与 独立: 课堂探究 课堂探究 问题 当零假设: 成立的条件下,应该是一个很小的数,当很大时,零假设不成立,究竟大到什么程度呢 判断不成立的标准是什么呢 (临界值表) 0.1 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 小概率值ɑ 课堂探究 小概率事件在一次试验中不大可能发生. 思考:如何根据观测值大小推断两个分类变量是否有关 小概率事件 不大可能发生 对于一个小概率值α,事件 课堂探究 可以认为两个分类变量 与 独立 由观测数据计算得到 的的观测值 推断H0 不成立 没有充分证据推断H0不成立 认为两个分类变量 与 不独立,推断犯错误的概率不超过α 基于小概率值 α 的检验规则: 课堂探究 上面这种利用取值推断分类变量 与 是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验 概念生成 学以致用 例 :分析例1中的抽样数据,能否据此推断两校学生的数学成绩优秀率有差异 学校 数学成绩 合计 不优秀( =0) 优秀( =1) 甲校( =0) 33 10 43 乙校( =1) 38 7 45 合计 71 17 88 解:零假设H0:分类变量 与 独立. 思考:两个例题基于同一组数据的分析的两种分析方法(条件概率法和卡方独立性检验法),但却得出了不同的结论,你能说明其中的原因吗 事实上,8.3.1中的例1只是根据一个样本的两个频率间存在差异得出两校学生数学成绩优秀率有差异的结论,并没有考虑由样本随机性可能导致的错误,所以其的推断依据不太充分. 在本节例1中,我们用独立性检验对零假设H0进行了检验. 通过计算,发现 ≈0.837小于α=0.1所对应的临界值2.706,因此认为没有充分证据推断H0不成立,所以接受H0 ,推断出两校学生的数学成绩优秀率没有显著差异的结论. 这个检验结果意味着,抽样数据中两个频率的差异很有可能是由样本随机性导致的. 因此,只根据频率的差异得出两校学生的数学成绩优秀率有差异的结论是不可靠的. 由此可见,相对于简单比较两个频率的推断:用独立性检验得到的结果更理性、更全面,理论依据也更充分. 课堂探究 某儿童医院用甲、乙两种疗法治疗小儿消化不良,采用有放回简单随机抽样的方法对治疗情况进行检查,得到如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析乙种疗法是否比甲种疗法好. 解: ... ...