章末复习提升 一、回归分析 1.主要考查两个变量线性相关的判定,以及利用最小二乘法求线性回归方程. 2.掌握求线性回归方程的方法和步骤,提升数学运算、数据分析的素养. 例1 在一段时间内,分5次测得某种商品的价格X(万元)和需求量Y(t)之间的一组数据为 1 2 3 4 5 价格X(万元) 1.4 1.6 1.8 2 2.2 需求量Y(t) 12 10 7 5 3 已知xiyi=62,x=16.6. (1)画出散点图; (2)求出Y关于X的线性回归方程; (3)如果价格定为1.9万元,预测需求量大约是多少 训练1 某湿地公园经过近十年的规划和治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的300个地块,并设计两种抽样方案. 方案一:在该地区应用简单随机抽样的方法抽取30个地块作为样本区,依据抽样数据计算得到相应的相关系数r=0.81; 方案二:在该地区应用分层随机抽样的方法抽取30个地块作为样本区,调查得到样本数据(xi,yi)(i=1,2,…,30),其中xi和yi分别表示第i个样本区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1 200, (xi-)2=90, (yi-)2=8 000, (xi-)·(yi-)=800. (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘地块数); (2)求方案二抽取的样本(xi,yi)(i=1,2,…,30)的相关系数(精确到0.01),并说明哪种抽样方法更能准确地估计. 参考数据:≈1.414. 二、独立性检验 1.主要考查根据样本制作2×2列联表,由2×2列联表计算χ2,分析并判断相关性结论的可信程度. 2.通过计算χ2的值,进而分析相关性结论的可信程度,提升数学运算、数据分析素养. 例2 为了解观众对球类体育节目的收视情况,随机抽取了200名观众进行调查.下面是根据调查结果绘制的观众日均收看球类体育节目时间的频率分布直方图、2×2列联表(将日均收看球类体育节目时间不少于40分钟的观众称为“球迷”). 性别 是否“球迷” 总计 非“球迷” “球迷” 男 女 20 110 总计 (1)根据已知条件完成2×2列联表; (2)据此调查结果,是否有95%的把握认为“球迷”与性别有关 训练2 眼保健操是一种眼睛的保健体操,主要是通过按摩眼部穴位,调整眼及头部的血液循环,改善眼的疲劳,达到预防近视的效果.某学校为了调查推广眼保健操对改善学生视力的效果,在高二2 000名学生中随机抽取了100名学生进行视力检查,并得到如图所示的频率分布直方图.一般认为:视力在5.0以上的为标准视力. (1)为了研究学生的视力与做眼保健操是否有关系,对高二年级做眼保健操和不做眼保健操的学生进行调查,得到下表中部分数据,请结合频率分布直方图,求出a,b,并回答是否有95%的把握认为视力与做眼保健操有关系 做眼保健操 不做眼保健操 非标准视力 a 48 标准视力 14 b (2)若以该样本数据,来估计全年级学生的视力,从全年级标准视力的同学中,随机抽取4名同学,设4名同学中视力在5.2以上的人数为X,求X的分布列和期望. 参考公式:χ2=,其中n=a+b+c+d. 章末复习提升 例1 解 (1)散点图: 样本点分布在一条直线附近,X与Y具有线性相关关系. (2)因为×9=1.8,×37=7.4, xiyi=62,x=16.6, 所以= ==-11.5, =7.4+11.5×1.8=28.1, 故Y关于X的线性回归方程为 Y=28.1-11.5X. (3)Y=28.1-11.5×1.9=6.25(t). 故价格定为1.9万元,预测需求量大约为6.25 t. 训练1 解 (1)样本区野生动物平均数为 yi=×1 200=40, 地块数为300,所以该地区这种野生动物数量的估计值为300×40=12 000. (2)样本(xi,yi)(i=1,2,…,30)的相关系数为 r′==≈0.94. 因为方案一的相关系数为r=0.81,且明显小于方案二的相关系数为r'=0.94, 所以方案二分层随机抽样的方法更能准确地估计. 例2 解 (1)2×2列联表为 性别 是否 ... ...