
第八章 成对数据的统计分析 章末总结 本章知识 要点一 变量的相关关系与样本相关系数 变量相关性的判断的两种方法 (1)散点图法:直观形象. (2)公式法:可用公式精确计算,需注意特殊情形的样本相关系数. 样本相关系数r的取值范围为 [-1,1] . 当|r|越接近1时,成对样本数据的线性相关程度越强; 当|r|越接近0时,成对样本数据的线性相关程度越弱. 注意: 当|r|=1时,表明成对样本数据都在一条直线上,即两个变量之间满足一种线性关系. 当r=0时,表明成对数据间没有线性相关关系,但不排除它们之间有其他相关关系. 知识梳理 要点二 经验回归方程 解决回归分析问题的一般步骤: (1)画散点图.根据已知数据画出散点图. (2)判断变量的相关性并求经验回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出经验回归方程. (3)回归分析.画残差图或计算R2,进行残差分析. (4)实际应用.依据求得的经验回归方程解决实际问题. 知识梳理 要点三 独立性检验 独立性检验问题的求解策略: (1)等高堆积条形图法:依据题目信息画出等高堆积条形图,依据频率差异来粗略地判断两个变量的相关性. (2)通过公式χ2=????(?????????????????)2(????+????)(????+????)(????+????)(????+????),先计算χ2,再与临界值表作比较,最后得出结论. ? 知识梳理 新知引入 例1 典例解析 题型一:成对数据的线性相关性 某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据: 样本号i 1 2 3 4 5 6 7 8 9 10 总和 根部横截面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6 材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9 参考数据: (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量; (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01); (3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值. 新知引入 典例解析 题型一:成对数据的线性相关性 解:(1)该林区这种树木平均一棵的根部横截面积x=0.610=0.06(m2), 平均一棵的材积量y=3.910=0.39(m3). ? (2)由题意,得i=110(xi?x)2=????=110????????2?10????2=0.038-10×0.062=0.002, i=110(yi?y)2=????=110????????2?10????2=1.615 8-10×0.392=0.094 8, i=110(xi?x)(yi-y)=i=110xiyi?10xy=0.247 4-10×0.06×0.39=0.013 4, 所以相关系数r=0.013?40.002×0.094?8=0.013?41.896×0.000?1≈0.013?40.013?77≈0.97. ? (3)因为树木的材积量与其根部横截面积近似成正比,所以比例系数k=yx=0.390.06=6.5,所以该林区这种树木的总材积量的估计值为186×6.5=1 209(m3). ? 练习1 某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据 (xi,yi)(i=1,2,…,20) ,其中 xi 和 yi 分别表示第 i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量. (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数); (2)求样本 (xi,yi)(i=1,2,…,20) 的相关系数(精确到0.01); (3)根据现有统计资料,各地块间植物覆盖面积差异很大. 为提高样本的 ... ...
~~ 您好,已阅读到文档的结尾了 ~~