
第2课时 回归分析及非线性回归模型 学习目标 1.结合实例,了解随机误差、残差、残差图的概念. 2.对回归模型会进行残差分析. 3.了解非线性回归模型的基本思想方法,能转化为一元线性回归模型解决实际问题. 4.能利用R2判断回归模型的拟合效果. eq \o(\s\up7( INCLUDEPICTURE "新知学习探究LLL.TIF" INCLUDEPICTURE "新知学习探究LLL.TIF" \* MERGEFORMAT ),\s\do5( )) INCLUDEPICTURE "新课导学1LLL.TIF" INCLUDEPICTURE "新课导学1LLL.TIF" \* MERGEFORMAT 思考1 对于教材P105表8.2-1中的数据,由最小二乘法得儿子身高y关于父亲身高x的经验回归方程为=0.839x+28.957,那么当x=172时,=0.839×172+28.957=173.265(cm),如果一位父亲的身高为172 cm,他儿子长大成人后的身高一定是173 cm吗?为什么? 提示:不一定,因为还有其他影响他儿子身高的因素,父亲的身高不能完全决定儿子的身高. 思考2 对于教材P105表8.2-1中的第6个数据,我们发现当父亲身高为172 cm时,儿子的身高实际为176 cm,实际身高与预测的身高相差了多少? 提示:176-173.265=2.735(cm). 思考3 只要给出一组成对样本数据,利用最小二乘法就可求出经验回归方程吗? 提示:不一定,成对样本数据除了线性相关,还有非线性相关. 一 残差及残差分析 1.残差的概念 对于响应变量Y,通过观测得到的数据称为_____,通过经验回归方程得到的称为_____,观测值减去预测值所得的差称为_____.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为_____. 2.残差分析 作图时_____为残差,_____可以选为样本编号,或身高数据等,这样作出的图形称为残差图.若残差点比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,带状区域越窄,则说明拟合效果越好. [答案自填] 观测值 预测值 残差 残差分析 纵坐标 横坐标 INCLUDEPICTURE "例1LLL.TIF" INCLUDEPICTURE "例1LLL.TIF" \* MERGEFORMAT (1)下列四幅残差分析图中,与一元线性回归模型拟合精度最高的是( ) INCLUDEPICTURE "25RJS8-13.TIF" INCLUDEPICTURE "25RJS8-13.TIF" \* MERGEFORMAT (2)已知变量x和y的统计数据如下表: x -2 -1 0 1 2 y 5 ? 2 2 1 由表中的数据得到经验回归方程=-x+2.6,那么当x=-1时残差为_____.(注:残差=观测值-预测值) 【解析】 (1)用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高,显然D选项的拟合精度最高.故选D. (2)由题表知,==0,则=-+2.6=2.6,因此x=-1时的观测值为5-(5+2+2+1)=3,而x=-1时的预测值为-(-1)+2.6=3.6,所以当x=-1时残差为3-3.6=-0.6. 【答案】 (1)D (2)-0.6 INCLUDEPICTURE "解题技法LLL.TIF" INCLUDEPICTURE "解题技法LLL.TIF" \* MERGEFORMAT (1)残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预测精度越高. (2)残差是随机误差的估计值,i=yi-i. [跟踪训练1] (1)已知某成对样本数据的残差图如图,则样本点数据中可能不准确的是从左到右第( ) INCLUDEPICTURE "A38.TIF" INCLUDEPICTURE "A38.TIF" \* MERGEFORMAT A.4个 B.5个 C.6个 D.7个 解析:选C.原始数据中的可疑数据往往是残差绝对值过大的那个数据,即偏离平衡位置过大. (2)某工厂为研究某种产品的产量x(单位:吨)与所需某种原材料的质量y(单位:吨)的相关性,在生产过程中收集4组对应数据(x,y),如表所示 ... ...
~~ 您好,已阅读到文档的结尾了 ~~