专题9.3 成对数据的统计分析【七大题型】 【新高考专用】 【题型1 变量的相关关系】 4 【题型2 样本相关系数】 5 【题型3 一元线性回归模型】 6 【题型4 非线性回归模型】 8 【题型5 残差分析】 11 【题型6 列联表与独立性检验】 12 【题型7 独立性检验与其他知识综合】 14 1、成对数据的统计分析 考点要求 真题统计 考情分析 (1)了解样本相关系数的统计含义 (2)了解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题 (3)会利用统计软件进行数据分析 2022年新高考全国I卷:第20题,12分 2023年全国甲卷(文数、理数):第19题,12分 2024年全国甲卷(文数):第18题,12分 2024年天津卷:第3题,5分 2024年上海卷:第13题,5分、第19题,12分 成对数据的统计分析是高考的重点、热点内容,从近几年的高考情况来看,主要以解答题的形式考查,一般会与概率等知识结合考查,综合性强,难度中等;有时也会在选择、填空题中出现,难度不大;复习时要加强此类问题的训练. 【知识点1 变量的相关关系】 1.变量的相关关系 (1)函数关系 函数关系是一种确定性关系,常用解析式来表示. (2)相关关系 两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关 系.与函数关系不同,相关关系是一种非确定性关系. 2.散点图 (1)散点图 成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图. (2)正相关和负相关 如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个 变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关. 3.线性相关 一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线 性相关. 【知识点2 样本相关系数】 1.样本相关系数 (1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为(,),(,),,(,),利用 相关系数r来衡量两个变量之间线性关系的强弱,相关系数r的计算公式: (其中,,,和,,,的均值分别为和). ①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小; 当其中一个数据的值变大时,另一个数据的值通常也变大. ②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大; 当其中一个数据的值变大时,另一个数据的值通常会变小. 【知识点3 一元线性回归模型】 1.一元线性回归模型 把式子为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称 为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差. 2.线性经验回归方程与最小二乘法 设满足一元线性回归模型的两个变量的n对样本数据为(,),(,),,(,),由=+a+ (i=1,2,,n),得|-(+a)|= ||,显然||越小,表示样本数据点离直线y=bx+a的竖直距离越小. 通常用各散点到直线的竖直距离的平方之和Q=来刻画各样本观测数据与直线 y=bx+a的“整体接近程度”. 当a,b的取值为时,Q达到最小.将=x+称为Y关于x的经验回归方 程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二 乘法,求得的,叫做b,a的最小二乘估计. 经验回归直线一定过点(,). 3.残差分析 对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减 去预测值称为残差.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析. 4.回归分析的三大常用结论 (1)求解经验回归方程的关键是确定回归系数 ... ...
~~ 您好,已阅读到文档的结尾了 ~~