(
课件网) 人教A版(2019)选择性必修第三册 第八章 成对数据的统计分析 8.1.2 样本相关系数 目录 学习目标 01 情景导入 02 新知探究 03 课本例题 04 05 课本练习 06 题型探究 方法归纳 08 07 课本习题 课堂小结 1.结合实例,会通过相关系数比较多组成对数据的相关性. 2.了解样本相关系数与标准化数据向量夹角的关系. 学习目标 散点图可以说明变量间有无线性相关关系,但无法量化两个变量之间的相关程度的大小,更不能精确地说明成对样本数据之间关系的密切程度,那么我们如何才能寻找到这样一个合适的量来对样本数据的相关程度进行定量分析呢? 情景导入 通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关等.散点图虽然直观,但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.能否像引入平均值、方差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析呢? 新知探究 x y 利用上述方法处理表8.1-1中的数据,得到图8.1-3.我们发现,这时的散点大多数分布在第一象限、第三象限,大多数散点的横、纵坐标同号.显然,这样的规律是由人体脂肪含量与年龄正相关所决定的. 编号 1 2 3 4 5 6 7 年龄/岁 23 27 39 41 45 49 50 脂肪含量/% 9.5 17.8 21.2 25.9 27.5 26.3 28.2 编号 8 9 10 11 12 13 14 年龄/岁 53 54 56 57 58 60 61 脂肪含量/% 29.6 30.2 31.4 30.8 33.5 35.2 34.2 如果变量x和变量y负相关,那么关于均值平移后的大多数点 将分布在第二、四象限,对应的成对数据异号居多. · · · · · · · · · · · · · · · · · · · · · · · · 一般地,如果变量x和变量y正相关,那么 均值平移后的大多数点将分布在第一、三象限, 对应的成对数据同号居多; 思考1 根据上述分析,你能利用正相关变量和负相关变量的成对样本数据平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗 利用散点 的横、纵坐标是否同号,可以构造一个量 一般情形下,Lxy>0表明成对样本数据正相关;Lxy <0表明成对样本数据负相关. 思考2 Lxy的大小是否一定能度量出成对样本数据的相关程度吗 因为Lxy的大小与数据的度量单位有关,所以不宜直接用它度量成对样本数据相关程度的大小. 为了消除度量单位的影响,需要对数据作进一步的“标准化”处理. 我们用 我们称r为变量x和变量y的样本相关系数. 当r >0时,称成对样本数据正相关; 当r <0时,称成对样本数据负相关. 样本相关系数r是一个描述成对样本数据的数字特征,它的正负和绝对值的大小可以反映成对样本数据的变化特征: 样本相关系数r的大小与成对样本数据的相关程度有什么内在联系呢 标准化处理后的成对样本数据: 设其第一分量为 设其第二分量为 新知探究 样本相关系数r的取值范围: 样本相关系数r的取值范围为[-1,1] 当|r|=1时,成对样本数据之间具有怎样的关系? 所以 当|r|=1时 ,向量 与 共线。 即存在实数 ,使得 成对样本数据(xi,yi)都落在直线 上 成对样本数据的两个分量之间满足一种线性关系 新知探究 由此可见,样本相关系数r的取值范围为[-1,1],样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度: 当|r|越接近1时,成对样本数据的线性相关程度越强; 当|r|越接近0时,成对样本数据的线性相关程度越弱. 样本相关系数r有时也称样本线性相关系数,|r|刻画了样本点集中于某条直线的程度.当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系. 新知探究 两个随机变量的相关性 ... ...