(
课件网) 8.2.2 一元线性回归模型参数的最小二乘估计 第2课时 第八章 成对数据的统计分析 数学 学习目标 1.能通过实例说明一元线性回归模型修改的依据和方法. 2.能将某些非线性回归问题转化为线性回归问题并加以解决. 3.能说明R2的意义和作用. 例1 经验表明,一般树的胸径(树的主干在地面以上1.3 m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据如下表所示,试根据这些数据建立树高关于胸径的经验回归方程. 编号 1 2 3 4 5 6 7 8 9 10 11 12 胸径/cm 18.1 20.1 22.2 24.4 26.0 28.3 29.6 32.4 33.7 35.7 38.3 40.2 树高/m 18.8 19.2 21.0 21.0 22.1 22.1 22.4 22.6 23.0 24.3 23.9 24.7 分析:求一元线性回归方程的步骤: (1)以成对样本数据描出散点图,通过散点图观察成对样本数据是否线性相关. (2)判断两个变量之间的线性相关关系. (4)残差分析:残差表、残差图对回归模型的拟合效果进行评估. 探索新知 (3)利用公式计算出和,,得到经验回归方程. 以胸径为横坐标,树高为纵坐标作散点图如图. 散点大致分布在一条从左下角到右上角的直线附近,表明两个变量线性相关,并且是正相关,因此可以用一元线性回归模型刻画树高与胸径之间的关系. 用d表示胸径 , h表示树高 , 根据据最小二乘法 , 计算可得经验回归方程为 相应的经验回归直线如图所示. 解: (1)画散点图 (2)求经验回归方程 探索新知 编号 胸径/cm 树高观测值/m 树高预测值/m 残差/m 1 18.1 18.8 19.4 -0.6 2 20.1 19.2 19.9 -0.7 3 22.2 21.0 20.4 0.6 4 24.4 21.0 20.9 0.1 5 26.0 22.1 21.3 0.8 6 28.3 22.1 21.9 0.2 7 29.6 22.4 22.2 0.2 8 32.4 22.6 22.9 -0.3 9 33.7 23.0 23.2 -0.2 10 35.7 24.3 23.7 0.6 11 38.3 23.9 24.4 -0.5 12 40.2 24.7 24.9 -0.2 (3)计算残差:根据经验回归方程,由胸径的数据可以计算出树高的预测值(精确到0.1)以及相应的残差,如表所示. 探索新知 以胸径为横坐标,残差为纵坐标,作残差图,如图所示. (4)作残差图: 观察残差表和残差图,可以看到,残差的绝对值最大是0.8,所有残差分布在以横轴为对称轴、宽度小于2的带状区域内. 可见经验回归方程较好地刻画了树高与胸径的关系,我们可以根据经验回归方程由胸径预测树高. 0 0.5 1.0 -0.5 -1.0 15 20 25 30 35 40 残差/m 胸径/cm 45 探索新知 建立树的胸径和树高的关系是有实际意义的.实际上,在采伐设计、资源评估、森林规划调查等林业工作中常需测算森林蓄积量.可以从森林中抽取部分树木,通过树的胸径与树高估计抽到的每棵树的体积,进而推断整片森林的蓄积量. 由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.因此,建模时将胸径作为解释变量,树高作为响应变量,即树高作为响应变量是解决实际问题的需要. 回归分析的实际意义 探索新知 探索新知 问题 人们常将男子短跑100 m的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑100 m世界纪录产生的年份和世界纪录的数据.下面我们依据这些成对数据,建立男子短跑100 m世界纪录关于纪录产生年份的经验回归方程. 编号 1 2 3 4 5 6 7 8 年份 1896 1912 1921 1930 1936 1956 1960 1968 记录/s 11.80 10.60 10.40 10.30 10.20 10.10 10.00 9.95 画散点图: 以成对数据中的世界纪录产生年份为横坐标, 世界纪录为纵坐标作散点图, 得到右图. 在左图中,散点看上去大致分布在一条直线附近,似乎可用一元线性回归模型建立经验回归方程. 由散点图可知,散点看上去大致分布在一条直线附近,似乎可用一元线性回归模型建立经验回归方程. 根据最 ... ...