ID: 23633358

北师大版高中数学选择性必修第一册 7.3独立性检验问题 课件(共60张PPT)

日期:2025-10-04 科目:数学 类型:高中课件 查看:56次 大小:6992384B 来源:二一课件通
预览图 1/12
北师大,检验,PPT,60张,课件,问题
  • cover
(课件网) 7.3独立性检验问题 1、所求直线方程叫做回归直线方程; 相应的直线叫做回归直线。 2、对两个变量进行的线性分析叫做线性回归分析。 回归直线方程 温故知新 称为样本点的中心。 温故知新 (1)当r >0时,称成对数据正相关;当r <0时,称成对数据负相关. (2)r 的取值范围为[-1,1] (3)当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱. 2. 样本相关系数r 独立性检验 本节研究的是两个分类变量的独立性检验问题。 在日常生活中,我们常常关心分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响?等等。 吸烟与肺癌列联表 患肺癌 不患肺癌 总计 不吸烟 56 1932 1988 吸烟 23 4567 4590 总计 79 6499 6578 为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了6578人,得到如下结果(单位:人) 列联表 分类变量 3.1独立性检验:问题提出 上面是一张2行2列的表,在统计中称为2×2列联表.在这个问题中,需要考虑两个变量:是否吸烟,是否患肺癌;每个变量应取两个值:吸烟、不吸烟,患肺癌、未患肺癌. 上表中的数据是根据调査得到的结果,如吸烟且患肺癌的人数是56,不吸烟但患肺癌的人数是23,等等.我们的问题是:如何根据表格中的数据来判断吸烟与患肺癌是否有关系,即它们是否独立?这一问题称为2×2列联表的独立性检验. 分析理解 假设“吸烟与否”与“是否患肺癌”没有关系,即吸烟与患肺癌是独立的.根据直观经验, 我们把吸烟人群中患肺癌的人所占百分比,与不吸烟人群中患肺癌的人所占百分比作比较. 如果吸烟不影响患肺癌,就意味着,无论吸烟与否,患肺癌的人所占的百分比应是基本一样的.就此题而言: 吸烟人群中患肺癌的人所占百分比是 不吸烟人群中患肺癌的人所占百分比是 显然,吸烟人群中患肺癌的人所占百分比,与不吸烟人群中患肺癌的人所占百分比不相等,且相差较大.由此我们可以推断,开始的假设可能是不成立的.也就是说,患肺癌与吸烟可能是有关系的.由吸烟人群中患肺癌的人所占的百分比较大,可以认为吸烟会对肺癌的发病率产生一定的影响. 另一方面,如果吸烟和患肺癌是独立的,那么就有 P(A1B1) = P(A1)P(B1), P(A1B2)= P(Al)P(B2) , P(A2B1)=P(A2)P(B1), P(A2B2)= P(A2)P(B2). 先讨论P(A1B1) = P(A1)P(B1),的情况.我们可以列出频率表,并用既吸烟又患肺癌的人的频率来估计P(A1B1),用吸烟的人的频率来估计P(A1),用患肺癌的人的频率来估计P(B1),得到表7-10. 既吸烟又患肺癌的人的频率是0.85%, 吸烟的人的频率是30.22%, 患肺癌的人的频率是1.20%. 显然,30.22.%×1.20%≈0.36%≠0.85%.由于根据表中数据计算出的值是频率值,它只是概率的估计值,因此即使变量之间独立,这两个数一般也不一定恰好相等.但是当这两个数相差很大时,就可以得出:患肺癌与吸烟有关的可能性较大. 抽象概括 其中,a表示变量A取A1,且变量B取B1时的数据;b表示变量A取A1,且变量B取 B2时的数据;c表示变量A取A2,且变量B取Bl时的数据;d表示变量A取A2,且变量B取B2时的数据. 3.2 独立性检验的基本思想 统计学家选取以下统计量,用它的大小来检验变量之间是否独立: 统计上已经证明:在变量A, B独立的前提下,当样本量很大时,χ2近似服从一个已知的分布χ2(1).当χ2较大时,说明变量之间不独立.在统计中,用以下结果对变量的独立性进行判断. 统计学家选取以下统计量,用它的大小来检验变量之间是否独立: (1)当χ2≤2.706时,没有充分的证据判断变量A,B有关联,可以认为变量A,B是没有关联的; (2)当χ2>2.706时,有90%的把握判断变量A,B有关联; (3)当χ2>3.841时,有95%的把握判断变量A,B有关联; (4) ... ...

~~ 您好,已阅读到文档的结尾了 ~~