4.1 课时2 成对数据的统计相关性(二) 【学习目标】 1.会通过相关系数比较多组成对数据的相关性.(数学抽象) 2.了解样本相关系数与标准化数据向量夹角的余弦之间的关系.(逻辑推理、数据分析) 【自主预习】 1.在许多实际问题中,是否只有一个因素对变量的变化产生影响 2.若我们把两组成对数据分别看作n维空间的两个向量(x1,x2,…,xn),(y1,y2,…,yn),则这两个向量的紧密程度可以用什么度量 3.能否用向量夹角的大小来判断两组数据的相关程度呢 1.判断下列结论是否正确.(正确的打“√”,错误的打“×”) (1)回归分析中,若rxy=±1,则说明变量x,y之间具有完全的线性关系. ( ) (2)样本相关系数r的范围是r∈(-∞,+∞). ( ) (3)当两组成对数据对应的向量夹角为90°时,两组数据不相关. ( ) 2.某研究者搜集了某种花的一些数据(见下表),试分别判断花瓣长与花枝长之间、花瓣长与花萼长之间的相关关系(结果保留三位小数). 花瓣长x 49 44 32 42 32 53 36 39 37 45 41 48 45 39 40 34 37 35 花枝长y 27 24 12 22 13 29 14 20 16 21 22 25 23 18 20 15 20 13 花萼长z 19 16 12 17 10 19 15 14 15 21 14 22 22 15 14 15 15 16 【合作探究】 探究1 多组成对数据的相关性 新知生成 多组成对数据之间的相关性 一般情况下,我们可以考虑将其分成几个不同的两组数据分别进行相关性分析. 新知运用 例1 根据统计,某蔬菜基地西红柿亩产量的增加量y(单位:百千克)与某种肥料A,B每亩使用量x,z(单位:千克)之间对应数据如表所示. x/千克 2 4 5 6 8 z/千克 3 7 4 5 6 y/百千克 3 4 4 4 5 请从相关系数r(精确到0.01)的角度分析,y与x,y与z的关系(若|r|≥0.8,则线性相关程度很高). 参考公式:对于一组数据(xi,yi)(i=1,2,3,…,n),相关系数rxy=. 参考数据:≈2.24. 【方法总结】 利用相关系数r判断线性相关关系,需要应用公式计算出r的值,注意数据的处理和计算要准确. 已知x,v与u的部分成对数据如下: x 1 2 3 4 5 v 5 10 15 20 25 u 21 31 41 51 71 通常用成对样本数据(vi,ui)的相关系数ruv来衡量u与v的线性相关性强弱,当<0.2时,认为u关于v的线性相关性较弱;当0.2≤≤0.8时,认为u关于v的线性相关性一般;当>0.8时,认为u关于v的线性相关性较强,判断x关于v,u关于v的线性相关程度. 参考公式:一组数据(v1,u1),(v2,u2),…,(vn,un)的相关系数ruv=. 参考数据:=250,=1480,≈6.1. 探究2 相关关系与向量夹角 问题1:向量夹角的大小可以用什么来进行刻画 问题2:用两组成对数据表示的向量在原点处夹角的余弦值与相关系数公式是什么关系 新知生成 1.两组成对数据表示的向量夹角的余弦值 若我们把两组成对数据分别看作n维空间的两个向量(x1,x2,…,xn),(y1,y2,…,yn),为了两个向量表达的一致性,将向量的每个元素都减去均值,形成 a=(x1-,x2-,…,xn-),b=(y1-,y2-,…,yn-), 从而有cos
==. 由上可知,用两组成对数据表示的向量在原点处夹角的余弦值与相关系数公式本质上是一致的. 2.向量夹角与相关性的关系 当夹角属于0,时,余弦值越大表示两个向量的夹角越小,两组数据的正相关程度越高;余弦值越小表示两个向量的夹角越大,两组数据的正相关程度越低. 当夹角属于,π时,余弦值越大表示两个向量的夹角越小,两组数据的负相关程度越低;余弦值越小表示两个向量的夹角越大,两组数据的负相关程度越高. 当夹角为时,余弦值为0,这说明两组数据不相关. 新知运用 例2 下表为某省十二个地区某年1月气温与海拔及纬度的数据: 气温xi/℃ 6.9 17 16.9 11.3 14.2 12.3 海拔yi/m 3640 4420 4220 2840 3200 3140 纬度zi 32.2 33.8 35 36.3 37.1 38.4 气温xi/℃ 18.2 17.3 10.4 13.3 6.4 8.6 海拔yi/m 3360 4650 2680 3970 2080 2260 纬度zi 38.9 35.3 36.8 33.8 35.9 36.6 (1)试分 ... ...