(
课件网) 第九章 统计与成对数据的统计分析 第3节 成对数据的统计分析 1.了解样本相关系数的统计含义. 2.了解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题. 目 录 CONTENTS 知识诊断自测 01 考点聚焦突破 02 课时分层精练 03 知识诊断自测 1 ZHISHIZHENDUANZICE 1.变量的相关关系 (1)相关关系的分类:正相关和负相关. (2)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在_____附近,我们就称这两个变量线性相关. 一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关. 一条直线 正 负 [-1,1] 强 弱 大 小 (2)独立性检验 基于小概率值α的检验规则是: 当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α; 当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立. 下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值 α 0.1 0.05 0.01 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.828 常用结论与微点提醒 × √ √ × 解析 (1)散点图是判断两个变量是否相关的一种重要方法和手段. (4)χ2的值越大,相关性越强,关系越密切. 2.(选修三P139T3)根据分类变量x与y的观测数据,计算得到χ2=2.974.依据α=0.05的独立性检验,结论为( ) A.变量x与y不独立 B.变量x与y不独立,这个结论犯错误的概率不超过0.05 C.变量x与y独立 D.变量x与y独立,这个结论犯错误的概率不超过0.05 D 解析 由χ2=2.974<3.841=x0.05,可知x,y独立,这个结论犯错误的概率不超过0.05. 3.(选修三P103T1改编)两个变量的相关关系有:①正相关;②负相关;③不相关,则下列散点图从左到右分别反映的变量间的相关关系是( ) D 解析 第一个图大体趋势从左向右上升,故正相关,第二个图不相关,第三个图大体趋势从左向右下降,故负相关,故选D. A.①②③ B.②③① C.②①③ D.①③② ABC 相关系数r的绝对值越接近于1,表示相关程度越强,越接近于0,相关程度越弱,故C正确; 用决定系数R2来刻画回归效果,R2越大,说明模型的拟合效果越好,故D错误. 考点聚焦突破 2 KAODIANJUJIAOTUPO 考点一 成对数据的相关性 例1 (1)(2023·天津卷)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.824 5,下列说法正确的是( ) A.花瓣长度和花萼长度没有相关性 B.花瓣长度和花萼长度呈负相关 C.花瓣长度和花萼长度呈正相关 D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5 C 解析 因为相关系数r=0.824 5>0.75,所以花瓣长度和花萼长度的相关性较强,并且呈正相关,所以选项A,B错误,选项C正确; 因为相关系数与样本的数据有关,所以当样本发生变化时,相关系数也会发生变化,所以选项D错误.故选C. (2)(2024·杭州质检)某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉D(10,2),则下列说法正确的是( ) A.相关系数r变小 B.决定系数R2变小 C.残差平方和变大 D.解释变量x与预报变量y的相关性变强 D 解析 可知点D偏离程度较大,去掉点D后,相关系数r变大,决定系数R2变大,残差平方和变小,解释变量x与预报变量y的相关性变强.故选D. 感悟提升 判定两个变量相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关. (2)样本相关系数:当r>0时,正相关;当r<0时,负相关;|r|越接近于1,相关性越强. (3)决定系数法:利用决定系数判定,R2越接近1,模型的拟合效果越好,相关性越强. 训练1 (1)(2023·上海卷)已知 ... ...