(
课件网) 8.2 一元线性回归模型及其应用 第1课时 一元线性回归模型及 最小二乘估计 探究点一 求经验回归方程 探究点二 线性回归分析 【学习目标】 1.能根据给出的经验回归方程系数公式建立经验回归方程. 2.了解随机误差、残差、残差图的概念. 3.会通过分析残差判断线性回归模型的拟合效果. 知识点一 一元线性回归模型 我们称为关于 的_____模型.其中, 称为_____或_____,称为_____或_____;和 为模型的未知参数,称为_____参数,称为_____参数;是 与 之间的_____. 一元线性回归 因变量 响应变量 自变量 解释变量 截距 斜率 随机误差 【诊断分析】 判断正误.(请在括号中打“√”或“×”) (1)随机误差是一个随机变量,产生的原因是多方面的.( ) √ (2)在一元线性回归模型中,是与真实值 的随机误差,它是 一个可观测的量.( ) × 知识点二 经验回归方程与最小二乘法 1.经验回归方程 定义:对于一组具有线性相关关系的成对样本数据 , , , ,由最小二乘法得 , . 将称为关于 的经验回归方程,也称经验回归函数或经 验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法 叫作_____,求得的,叫作, 的_____. 注意:在经验回归直线中,是斜率, 是截距.一般地, 当时,说明两个变量正相关,它的意义是当 每增大一个单位 时,平均增大个单位;当 时,说明两个变量负相关,它的意 义是当每增大一个单位时,平均减小 个单位. 最小二乘法 最小二乘估计 2.残差与残差分析 (1)残差:对于响应变量 ,通过观测得到的数据称为观测值,通过 经验回归方程得到的___称为预测值,_____减去_____称为残差. (2)残差分析:残差是随机误差的估计结果,通过对残差的分析可 以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数 据等,这方面工作称为残差分析.其步骤为:计算残差 画出残差图 →在残差图中分析残差特性. 观测值 预测值 3.决定系数 (1)的计算公式: . (2)与模型拟合效果的关系: 越大,表示残差平方和_____, 即模型的拟合效果_____; 越小,表示残差平方和_____,即模 型的拟合效果_____. 越接近1,拟合效果越好. 越小 越好 越大 越差 【诊断分析】 判断正误.(请在括号中打“√”或“×”) (1)通过经验回归方程求出的 是精确值.( ) × (2)用最小二乘法求出的 可能是正的,也可能是负的.( ) √ (3)经验回归直线一定经过点 .( ) √ (4)残差平方和越大,线性回归模型的拟合效果越好.( ) × 探究点一 求经验回归方程 例1 [2024·遵义高二期中] 某地2019年至2023年五年中新能源汽车保 有量如下表. 年份 2019 2020 2021 2022 2023 1 2 3 4 5 18 20 23 25 29 (1)请用样本相关系数说明与 的线性相关程度; 附:样本相关系数 , . 解:因为 ,, 所以 , , , 所以样本相关系数 . 因为 的值越接近1,随机变量之间的线性相关程度越强, 所以与 的线性相关程度较强. (2)求关于的经验回归方程 ,并预测2025年该地新能 源汽车保有量. 附:在经验回归方程中, , . 解:因为, , , , 所以, ,所以 经验回归方程为 . 当时, , 所以预测2025年该地新能源汽车保有量为33.8万辆. 变式 某种鱼苗育种基地,饲养员每隔两天观察并统计育种池内鱼苗 的尾数,统计结果如下表: 2 4 6 8 10 72 140 212 284 340 (1)若与之间具有线性相关关系,求关于 的经验回归方程; 附:样本数据的经验回归直线 的斜 率和截距的最小二乘估计分别为, . 参考数据:,, . 解:由题可得 , 代入公式得 , , 则关于的经验回归方程为 . (2)根据(1)中所求的经验回归方程,估计第30天时育种池内鱼 苗的尾数(结果保留整数). 解:当时, , 估计第30天时育种池内有鱼 ... ...