(
课件网) 4.2.4 相关分析 (1)已知一个圆的半径r,由r可以唯一确定圆的面积S。 (2)子女的身高与父母身高存在关系,但密切关系达不到函数程度,由父母的身高值并不能确定其子女身高值。 情境导入 ■确定性关系 也称函数关系,是指两个变量中,一个变量值确定后,另一个变量值也就完全确定了,即确定性关系往往可以表示成一个函数形式。例如,圆面积和半径的关系式S=πR 。 半径 面积 1 3.14 2 12.56 3 28.26 4 50.24 5 78.5 6 113.04 知识讲解 ■非确定性关系 也称相关关系,是指在两个变量中,当给定一个变量值后,另一个变量值可以在一定范围内变化。例如,子女身高与其父母身高的关系。从遗传学角度看,父母身高比较高,其子女身高一般也比较高。 父母身高 饮食结构 体育锻炼 睡眠时间 其他 子女身高 1 相关关系的概念 1.商品销售收入与广告费用支出的关系 2 相关分析的概念 2.粮食亩产量与施肥量的关系 3.出租汽车费用和行驶里程关系:y=2.80+1.20x 辨一辨 相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨相关方向及相关程度的方法。 相关关系:包括两个数据之间的单一相关关系和多个数据之间的多重相关关系。 相关方向: 相关程度:两个变量共同变化的紧密程度—相关系数 正相关:当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势 负相关:当一个变量的值增加时,另一个变量的相应值呈现减小的趋势 2 相关分析的概念 相关分析步骤: ■绘制两个变量的散点图 ■计算变量之间的相关系数 ■相关系数的显著性检验 3 相关分析的一般过程 在人体的脂肪含量和年龄之间的关系研究中,科研人员获得了一些年龄和脂肪含量数据,其都是对同一个体的观测结果,他们构成了成对数据。 【问题】同学们观察以上数据,你能推断出人体的脂肪含量与年龄之间存在怎样的关系吗? 活动探究 为了更加直观地描述上述数据中脂肪含量与年龄之间的关系,用横轴表示年龄,纵轴表示脂肪含量,则上述表中每个编号下的成对样本数据都可以用直角坐标系中的点表示出来。由这些点组成了下图所示的统计图。 (一)散点图的绘制 (一)散点图的绘制 (1)脂肪含量和年龄呈现正相关; (2)从整体上可以看出散点落在某条直线附近。 (一)散点图的绘制 线性相关:一般地如果两个变量的取值呈现正相关或负相关 ,而且散点落在一条直线附近,我们就称这两个变量线性相关。 (一)散点图的绘制 【问题】上述散点图中的两个变量呈现正相关,他们的相关程度有多强,我们能否通过散点图量化这种相关程度呢? (二) 相关系数的计算 统计学上经常使用相关系数反映变量之间相关关系的密切程度。常用的相关系数有皮尔逊相关系数、斯皮尔曼相关系数和肯德尔相关系数。 如果散点图中的n个点基本在一条直线附近,但又不完全在一条直线上,就可以使用皮尔逊相关系数表示变量之间相关关系的密切程度。 (二) 相关系数的计算 ①当r=±1时,各个点完全在一条直线上,这时两个变量是完全线性相关。 ②当r=0时,两个变量不相关,这时散点图上的n个点可能毫无规律。 (二) 相关系数的计算 ③当r>0时,两个变量为正相关;当r<0时,两个变量为负相关。 ④当|r|≥0.8时,两个变量为高度相关;0.5≤|r|<0.8,两个变量为中度相关;当0.3≤|r|<0.5,两个变量为低度相关;当|r|<0.3,两个变量之间的相关程度极弱,可视为不相关; 【小结】相关系数绝对值越大 ,两变量间相关程度越密切; 相关系数越接近于0,表示相关越不密切。 (二) 相关系数的计算 (二) 相关系数的计算 (三)显著性检验 【结论】r≈0.97074 >0.8,可以推断脂肪含量和年龄这两个变量线性正相关,且相关程度很强。 课后 ... ...